“AI 기업”… 자체 칩 개발 시대

메타, 최신 맞춤형 AI 칩 공개 인텔, 최신 AI 칩 가우디3 공개 구글, 맞춤형 Arm 기반 칩 공개 TSMC, AI 칩 호황으로 높은 월 매출 성장률 기록

2024-10-17     김맹근 기자
사진 : pixabay

[디지털비즈온 김맹근 기자] 생성형AI 분야의 경쟁자들을 따라잡기 위해 노력하고 있는 메타(Meta)는 자체 AI 개발에 수십억 달러를 투자하고 있다. 이 중 많은 금액이 하드웨어, 특히 메타의 AI 모델을 실행하고 훈련하는 칩을 개발하는 데 쓰이고 있다.

메타는 차세대 맞춤형 AI 칩이 더욱 강력하고, 랭킹 모델을 훨씬 더 빠르게 훈련할 수 있을 것으로 기대하고 있음. 메타는 2023년 5월에 MTIA v1을 발표함. MTIA v1은 2025년까지 출시되지 않을 것으로 예상되었지만 메타는 현재 두 가지 MTIA 칩이 모두 생산 중에 있다고 밝혔다.

메타는 최근 MTIA v1의 후속 모델인 차세대 메타 트레이닝 및 추론 가속기(MTIA, The Meta Training and Inference Accelerator)를 공개했다. 이 칩은 메타의 자산에서 디스플레이 광고의 순위와 추천을 포함한 모델을 실행했다.

차세대 MTIA는 현재 16개 데이터센터 지역에서 가동 중이며 MTIA v1에 비해 전체적으로 최대 3배 더 나은 성능을 제공함. 메타는 현재 MTIA가 주로 순위 및 추천 알고리즘을 학습하지만, 궁극적으로는 라마(Llama) 언어 모델과 같은 생성형 AI 학습을 시작할 수 있도록 칩의 기능을 확장하는 것이 목표라고 말하며, 메타는 새로운 MTIA 칩이 근본적으로 컴퓨팅, 메모리 대역폭, 메모리 용량의 적절한 균형을 제공하는데 초점을 맞추고 있다고 밝혔다.

인텔, 최신 AI 칩 가우디3 공개

인텔은 최근 인텔 비전 이벤트의 일환으로 엔비디아(Nvidia)의 가장 인기 있는 AI 프로세서 중 하나에 대응하도록 설계된 새로운 AI 칩, ‘가우디3(Gaudi 3)’를 선보임. 가우디 3칩은 생성형 AI 모델을 훈련하고 배포하는데 있어 엔비디아의 H100 AI 프로세서와 동등하거나 그 이상의 성능을 발휘한다.

H100프로세서는 엔비디아의 가장 인기 있는 칩 중 하나로, 마이크로소프트에서 구글에 이르는 세계 최대 기술 기업의 인공지능 애플리케이션을 구동함. 인텔은 가우디3가 엔비디아의 H100보다 전력 효율이 40% 더 높고 추론 속도는 50% 더 빠르다고 밝혔다.

또한, 일반적인 대규모 언어 모델을 훈련할 때 가우디 3가 H100보다 최대 1.7배 빠르며, 특정 언어 모델을 추론할 때에는 엔비디아의 H200보다 평균 1.3배 빠르다고 말함. 인텔은 가우디3가 음성 인식을 위한 스테이블 디퓨전(Stable Diffusion)이나 OpenAI의 위스퍼(Whisper)와 같은 모델을 훈련하거나 배포하는 데 도움이 될 수 있다고 밝혔다.

새로운 가우디 3칩은 3분기에 고객에게 제공될 예정이며, 델(Dell), 휴렛 팩커드(Hewlett Packard Enterprise), 슈퍼마이크로(Supermicro)를 포함한 기업들이 이 칩으로 시스템을 구축할 예정이다.

인텔은 고객이 원하는 서비스와 소프트웨어를 사용할 수 있는 오픈 소스 접근 방식을 주장하며 자사의 AI 시스템을 엔비디아의 대안으로 내세우고 있음. 인텔의 가우디3는 마이크로소프트, 구글, 아마존, 메타 등과 같은 하이퍼 스케일러에게 칩 시장에서 또 다른 옵션을 제공할 것으로 기대된다.

구글, 맞춤형 Arm 기반 칩 공개

구글은 클라우드 넥스트 컨퍼런스에서 AI 칩의 새 버전에 대한 세부 정보를 공개하고 Arm 기반 중앙 프로세서를 발표함. 구글은 맞춤형 Arm 기반 서버 칩으로 클라우드 컴퓨팅을 더 저렴하게 만들기 위해 노력하고 있다.

새로운 Arm 기반 칩을 통해 구글은 수년 동안 유사한 전략을 사용해 온 아마존 및 마이크로소프트와 같은 경쟁업체를 따라잡고 있음. 이 거대 기술 기업들은 조직이 멀리 떨어진 데이터 센터에서 리소스를 임대하고 사용량에 따라 비용을 지불하는 클라우드 인프라 시장에서 치열한 경쟁을 벌이고 있다.

Arm 아키텍처를 기반으로 하는 칩을 광범위하게 사용하면 특정 워크로드에서 탄소 배출량을 줄일 수 있다. 구글은 Axion 칩이 포함된 물리적 서버의 가상 슬라이스는 x86 모델 기반의 동급 가상 머신보다 60% 더 높은 에너지 효율성을 제공한다고 말한다. 이 칩은 또한 애플리케이션 속도를 높일 수 있다. Axion은 클라우드에서 가장 빠른 범용 Arm 기반 가상 머신보다 30%, x86 기반 동급 가상 머신보다 50% 더 나은 성능을 제공한다고 구글은 밝혔다.

TSMC, AI 칩 호황으로 높은 월 매출 성장률 기록

대만 반도체 제조업체인 TSMC(Taiwan Semiconductor Manufacturing Co.)는 세계 최대의 위탁 반도체 제조업체로, 애플부터 엔비디아에 이르는 다양한 기업에 칩을 공급하고 있다. TSMC는 하이엔드 칩을 기반으로 한 지속적인 인공지능 붐에 힘입어 3월 월 매출이 급증했다.

TSMC는 3월 분기 매출이 약 5,926억 대만 달러(185억 달러)로 예상보다 16% 증가하여 평균 전망치인 5,795억 대만 달러에 비해 높은 실적을 기록했다. 이러한 실적은 세계에서 가장 가치 있는 칩 제조업체가 코로나 이후 스마트폰과 컴퓨터 판매의 침체를 극복하고 올해 견고한 성장세로 돌아설 것이라는 기대에 힘을 실어주고 있다.

이는 글로벌 스마트폰 침체가 끝났는지에 대한 우려를 상쇄하고 있다. TSMC는 1월에 자사의 AI 매출이 매년 50%씩 성장하고 있다고 밝힘. 분석가들은 TSMC의 총 매출이 올해 23.7% 증가할 것으로 예상하고 있다.