[서울=뉴스핌] 최원진 기자= 생성형 인공지능(AI) 챗GPT 개발사 오픈AI와 손잡은 마이크로소프트(MS)가 차세대 소형언어모델(SLM) '파이(Phi)-3' 시리즈 중 초경량 모델인 '파이-3 미니'를 23일(현지시간) 출시했다.
파이-3 미니는 MS가 앞으로 내놓을 '파이-3' 시리즈 모델 중 하나로 매개변수(파라미터)는 38억 개다.
파이-3 미니는 이날 애저 AI 모델 카탈로그, 허깅 페이스, 엔비디아 NIM 등 각종 소프트웨어 플랫폼에 출시됐다.
회사가 앞으로 내놓을 모델인 '파이-3 스몰'은 70억 파라미터, '파이-3 미디움'은 140억 파라미터다. 이들 모델은 애저 AI 모델 카탈로그 등의 플랫폼에 조만간 출시될 예정이다.
마이크로소프트. [사진=로이터 뉴스핌] |
MS는 파이-3 시리즈가 시중에 있는 SLM 중 "가장 유능하고 비용 면에서 효율적"이라고 소개했다.
지난해 12월 MS는 전작인 파이-2를 출시한 바 있는데 파이-3는 이전 버전보다 성능이 개선됐을 뿐만 아니라 이보다 10배 큰 모델 수준의 응답도 제공할 수 있다는 설명이다.
MS 애저 AI 플랫폼의 부사장 에릭 보이드 말에 따르면 파이-3 미니의 경우 오픈AI의 LLM '챗-3.5' 성능에 견준다.
SLM은 휴대전화와 노트북 등 개인용 기기에서 작동하는 등 간단한 작업에 적합하도록 설계된 모델이다. 한정된 자원의 조직에서 더 쉽게 접근하고 사용할 수 있으며 특정 요구 사항을 충족하도록 미세 조정이 가능하다.
거대언어모델(LLM)과 달리 SLM은 작업을 위해 클라우드를 거칠 필요가 없고 기계학습 등 비용이 비교적 저렴하다는 장점이 있다.
MS 생성형 AI 연구 담당 부사장인 세바스티엔 부벡은 파이-3 등 소형 모델이 거대 모델 대비 비용이 10분의 1 수준이라고 밝혔다.
소날리 야다브 MS 생성형 AI 수석 제품 매니저는 "우리가 보게 될 것은 거대 모델에서 소형 모델로의 전환이 아니라 단일 모델 범주에서 고객이 자신에게 가장 적합한 모델이 무엇인지 결정할 수 있는 모델 포트폴리오로의 전환"이라고 밝혔다.
루이스 바르가스 MS AI 부문 부사장은 "일부 고객은 소형 모델만 필요로 할 수 있고 일부는 거대 모델만 필요로 할 수 있지만 많은 이들은 두 가지 모두 합쳐 여러 방식으로 활용할 것"이라고 내다봤다.
IT 업계의 AI 경쟁이 LLM뿐만 아니라 SLM에서도 치열해졌다.
지난 2월 구글은 간단한 챗봇 구동과 언어 관련 작업에 특화된 경량 모델 '젬마 2B'와 '7B'를 출시했으며 페이스북 모기업 메타는 지난 18일 '라마 3'를 출시하면서 파라미터 80억 개의 소형 모델도 선보인 바 있다.
AI 스타트업 앤스로픽은 방대한 양의 연구 논문 등을 빠르게 요약해주는 '클로드(Claude) 3 하이쿠(Haiku)' 모델을 출시했다.
wonjc6@newspim.com