AWS와 엔비디아, 생성형 AI 발전을 위한 파트너십 확대

2023-12-06     송민경 기자
(사진=아마존) AWS re:Invent 2023에서 연설 중인 AWS 데이터 및 AI 부문 부사장 Swami Sivasubramanian

[디지털비즈온 송민경 기자] 아마존웹서비스(AWS)와 엔비디아(NVIDIA)는 AWS re:Invent에서 전략적 협업을 대폭 확대를 발표했다. 이 협업을 통해 생성형 AI 혁신을 촉진하기 위해 고객에게 최첨단 인프라, 소프트웨어 및 서비스를 제공하는 것을 목표로 한다고 밝혔다.

이번 협업은 엔비디아의 최신 멀티 노드 시스템과 차세대 GPU, CPU, AI 소프트웨어를 통합하고, 니트로 시스템(Nitro System) 고급 가상화, 엘라스틱 패브릭 어댑터(Elastic Fabric Adapter, EFA) 인터커넥트, 울트라클러스터(UltraCluster) 확장성과 같은 AWS 기술을 통합함으로써 양사의 강점을 결합할 수 있다.

엔비디아 GPU에 대한 수요는 오픈AI가 지난해 챗GPT 챗봇을 출시한 이후 급증했다. 정보를 요약하고 인간과 유사한 텍스트를 작성하는 능력을 통해 엔비디아의 칩 부족 사태가 발생했고, 기업들은 유사한 생성형 AI 기술을 자사 제품에 통합하기 위해 경쟁했다.

자체 칩을 구축하고 고객이 엔비디아의 최신 칩에 액세스할 수 있도록 하는 AWS의 이중 접근 방식은 최고의 클라우드 컴퓨팅 경쟁자인 MS에 맞서는 데 도움이 될 수 있다는  판단이다.

새로운 엔비디아 GPU는 자사의 가장 진보된 대용량 언어 모델인 GPT-4를 훈련시키는데 사용되었던 칩 'H100'으로부터 업그레이드된 것이다.

대기업들과 신생기업들 그리고 정부기관들 모두 이 칩들의 공급이 제한적이기 때문에 AWS 같은 클라우드 업체들로부터도 이 칩들을 임대하려는 수요가 많다는 것을 의미한다. 엔비디아는 H200이 H100보다 거의 두 배 빠른 속도로 출력을 낼 것이라고 말했다.

(사진=아마존) AWS Graviton4(왼쪽) 및 AWS Trainium2(오른쪽)

챗GPT의 오픈AI와 경쟁사들과 같은 AI 챗봇이 실행하는 종류를 포함하여, AWS의 자체적인 트레인리움2 칩은 AI 모델을 훈련시키기 위해 만들어졌다. 트레인리움2 칩은 원래 모델보다 4배 더 나은 성능을 자랑할 것이라고 아마존웹서비스는 전했다.

그라비톤4(Graviton4) 프로세서는 Arm 아키텍처를 기반으로 하고 있으며, 또는 AWS의 칩보다 에너지를 덜 소비한다.

그라비톤4는 기존의 그라비톤3 칩보다 30% 향상된 성능을 약속하고 있어 AWS가 말한 가격 대비 더 나은 출력을 가능하게 한다.

AWS를 계속 사용하면서도 경제를 더 잘 처리하기 위해 클라우드 비용을 낮추고자 하는 기업들은 그라비톤으로 전환하는 것을 고려해 볼 수 있다.

이미 5만명 이상의 AWS 고객이 그라비톤 칩을 사용하고 있다고 아마존은 전했다.

마지막으로, AWS는 엔비디아와의 관계 심화의 일환으로 엔비디아 GPU와 엔비디아의 암 기반 범용 프로세서를 포함하는 1만 6,000개 이상의 엔비디아 GH200 그레이스 호퍼 슈퍼칩을 운영할 것이라고 밝혔다.

엔비디아 자체 연구 개발 그룹과 AWS 고객 모두 이 인프라를 활용할 수 있을 것이다.

AWS는 컴퓨팅 및 데이터 저장을 위한 EC2 및 S3 서비스를 출시한 2006년 이후 200개 이상의 클라우드 제품을 출시했다. 그라비톤과 트라니움 프로그램에 계속 투자하고 있으며, 이는 AWS가 업계 수요를 감지한다는 것을 의미한다.

이번 AWS와 엔비디아의 협업은 생성형 AI 분야를 발전시키기 위한 공동의 노력을 뜻한다. 내부적으로 아마존 로보틱스 및 풀필먼트 팀은 이미 엔비디아의 옴니버스 플랫폼을 사용하여 실제 배포 전에 가상 환경에서 창고를 최적화하고 있으며,다양한 산업 분야에서 대규모 언어 모델과 생성형 AI 애플리케이션의 개발, 훈련 및 추론을 가속화시킬 것으로 예상된다.