상단영역

본문영역

MS, 소형 AI 언어모델 '파이-3' 출시…가격 대비 성능 우수

  • Editor. 송민경 기자
  • 입력 2024.04.27 09:30
  • 수정 2024.04.27 09:31
  • 댓글 0
이 기사를 공유합니다
(사진=게티이미지)
(사진=게티이미지)

[디지털비즈온 송민경 기자] 마이크로소프트(MS)는 23일(현지시간) 경량 AI 모델 파이-3 미니(Phi-3 Mini)를 출시했다.

파이-3 미니(Phi-3 Mini)는 MS에서 출시할 계획인 세 가지 소형 모델 중 가장 경장 모델로 38억 개의 매개변수를 측정하며 GPT-4와 같은 대규모 언어 모델에 비해 더 작은 데이터 세트에서 훈련시킨 모델이다.

MS의 생성형AI(GenAI) 연구 부사장인 세바스티안 버벡(Sébastien Bubeck)은 "Phi-3 Mini는 약간이 아니라 확실하게 더 저렴하며, 유사한 기능을 가진 다른 모델에 비해 10분의 1 수준의 비용이 든다."고 밝혔다.

지난 12월에 파이-2(Phi-2)를 출시했는데, MS는 파이-3(Phi-3)가 이전 버전보다 더 나은 성능을 발휘하며 10배 더 큰 모델 수준의 응답을 제공할 수 있다고 언급했다.

MS 애저 AI 플랫폼(Microsoft Azure AI Platform) 부사장인 에릭 보이드(Eric Boyd)는 더 버지(The Verge)를 통해 파이-3 미니(Phi-3 Mini)가 GPT-3.5 같은 소형 폼 팩터로 기능한다고 말했다.

파이-3는 몇 가지를 제외하고 Meta의 오픈 소스 모델인 라마3(Llama 3) 및 OpenAI의 GPT-3.5와 유사한 점수를 받았다. 자연어 이해(MMLU)와 상식 추론(HellaSwag)에서 라마 3를 능가하고 GPT 3.5 바로 아래를 기록했으며 산술 추론(GSM8K)에서 두 모델을 모두 능가한다.

에릭 보이드는 "파이-3는 이전 버전에서 학습한 내용을 기반으로 만들었다"고 밝히며 "파이-1은 코딩에 중점을 뒀고 파이-2는 추론을 배우기 시작하는 단계였다면, 파이-3는 코딩과 추론에 더 능숙하다"고 설명했다.

파이-3는 소규모 모델이기 때문에 컴퓨팅 성능을 적게 사용해서 가격이 저렴하지만, 인터넷 전체에서 훈련된 LLM와 비교하면 답변 종류에 큰 차이가 있다. 이는 비용을 효율화시켜 더 넓은 고객 기반 유치에 목적이 있다.

저작권자 © 디지털비즈온 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

하단영역