제보
주요뉴스 산업

"챗GPT·생성AI, 멀티미디어 지각변동...새로운 빅테크 탄생할 것"

기사등록 : 2023-03-17 17:56

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
네이버클라우드 "7월 하이퍼클로바X 활용 서치GPT 출시"
"응용 Generative AI 모델 개발이 성공의 관건"
"생성 AI 기술, 멀티미디어 산업에서 이미 활용 중"

[서울=뉴스핌] 양태훈 기자 = 오픈AI의 생성형 대화 인공지능(AI) 서비스 '챗GPT(ChatGPT)'가 과거 아이폰의 등장처럼 산업의 패러다임을 바꿀 '게임체인저'로 주목받는 가운데 네이버, 뤼튼테크놀로지스, 네오사피엔스 등 국내 대표 AI 전문 기업들이 지난 16일 서울 강남구 소재 과학기술컨벤션센터에서 열린 '챗GPT와 생성 AI가 만드는 미래' 컨퍼런스를 통해 챗GPT와 생성 AI 기술 동향을 공유했다.

먼저 네이버는 자체 개발한 초거대 AI 언어모델인 '하이퍼클로바'를 통한 한국 시장에서의 자신감을 내비쳤다. 오픈AI의 챗GPT보다 많은 한국어 데이터를 기반으로, 한국어 특화 서비스가 가능한 만큼 국내 기업과의 협력 계획도 발표했다.

생성 AI 전문 기업 뤼튼테크놀로지스는 Generative AI(생성형 인공지능) 시장이 초기 시장인 만큼 앞으로 유망한 응용 및 사업화 영역을 공유했다. 뤼튼테크놀로지스가 주목한 영역은 Hyper-local AI 모델과 Operating Systems and API Layers, Applications이 가장 유망한 응용 및 사업화 영역으로, Generative AI 모델의 발전과 경쟁력 강화를 이룩한 기업이 새로운 빅테크 기업으로 도약할 것으로 봤다.

이기창 네이버클라우드 리더. [사진=양태훈 기자]

네오사피엔스 대표는 앞으로 생성 AI가 영상 및 오디오 제작 등의 멀티미디어 산업에서 대폭 활용되면서 시장의 지각변동을 가져올 것으로 봤다. 특히, AI 기술과 접목한 아바타와 합성 기술을 이용해 얼굴표정과 제스처를 생성하는 분야(가상인간 서비스 등)에서 기회가 올 것으로 예측했다.

◆ 오픈AI 언어모델 튜닝으로 성능 개선....네이버, '하이퍼클로바 X'에도 적용

이기창 네이버클라우드 리더는 이날 열린 컨퍼런스에서 "네이버는 그간 (AI와 관련해) 많은 투자를 해왔고, 여러 시행착오를 겪고 있지만 한국어 분야에서는 가장 많은 데이터와 성능을 확보하고 있다고 생각한다"며 "(네이버는) 최근 개발자 컨퍼런스 데뷔(DEVIEW)에서 (차세대 초거대 AI 모델인) 하이퍼클로바 X에 대해 공개했고, 비즈니스 가능성을 충분히 갖고 있다고 본다"고 자신했다.

하이퍼클로바 X는 작은 양의 데이터 결합에도 목적에 맞춰 생산성을 높일 수 있는 초대규모AI 기술로, 네이버클라우드는 올해 7월 중 하이퍼클로바X 및 이를 활용한 서치GPT를 출시할 예정이다.

이기창 리더는 이에 대해 "(하이퍼클로바 X는) 챗GPT, InstructGPT와 같이 Instruction Tuning을 통해 다양한 능력을 발휘할 수 있다. 예컨대 후속 질문을 추천하거나 영어를 한국어로 바로 요약할 수 있고, 보도자료 초안을 작성하거나 글의 제목을 다는 부분에 있어서도 충분한 성능을 보여준다"며 "(네이버는) 생산성과 관련해서 고객들의 요구가 각기 다른 만큼 다양한 데이터를 하이퍼클로바 X에 넣어 커스텀 할 수 있는 것들도 준비 중"이라고 설명했다.

[자료=네이버클라우드]

또 "챗GPT나 하이퍼클로바나 본질은 언어모델로, 이는 어떤 입력이 들어오면 처리를 해서 출력을 만들어내는 함수라고 이해하면 된다. 언어 모델은 각 회사마다 고유한 레시피를 보유하고 있고, 최근 경쟁적으로 많은 모델들이 출시되고 있다"며 "특히 GPT3, Codex, InstructGPT, GPT 3.5, ChatGPT 등 오픈AI의 모델들이 주목을 받고 있는데, 과거 오픈AI가 발표한 GPT3 논문에서는 입력 문서의 의미를 파악해 문제를 해결하는 In-context learning이라는 개념이 있다. 네이버도 이를 하이퍼클로바에 적용했다"고 전했다.

이어 "다만, In-context learning은 예제가 하나도 없는 경우 성능이 그다지 높지 않고, 프롬프트 구성에 따라 성능이 크게 달라지는 한계가 있다. 심지어 동일한 입력이다도 예제 수나 순서에 민감하게 반응한다"며 "최근 언어모델이 거대할수록 튜닝(성능 개선을 위한 파라미터 수정 작업)을 하면 성능이 엄청나게 개선된다는 것이 발견되고 있는데, 이후 (자연어 처리를 위한 방법 중) Instruction Tuning이 나왔고, 이게 오픈AI의 InstructGPT, GPT, ChatGPT 태동의 모태가 된 것"이라고 덧붙였다.

◆ Generative AI 시장은 극초기, 응용과 사업화 경쟁력 확보가 관건

현지웅 뤼튼테크놀로지스 리드는 "Generative AI는 여전히 초기 시장이다. 앞으로도 수많은 응용 사례가 나올 예정이고, 이것들이 각 레이어로 세분화돼서 발전할 것"이라며 "많은 해외 투자자들과 매체들이 Generative AI가 인터넷과 모바일에 이어 14년 주기로 찾아오는 새로운 인터페이스의 혁명이라고 이야기를 하고 있다. 무엇보다 사람과 AI 사이의 인터랙션(상호작용) 수준을 단순히 개선하는 것이 아니라 아예 새로운 방식으로 향상시킬 것이라고 이야기하고 있다. 이러한 인터페이스 혁명, 인터랙션 혁명에서는 많은 기회가 있을 것이고, 빅테크 기업도 탄생할 것"이라고 강조했다.

또한 "Generative AI는 정답을 찾거나 분석하는 것을 넘어 정답이 없는 개념화나 구체화도 가능하다. 지식 업무나 창작 업무에 있어서는 획기적인 생산성 향상을 보일 수가 있다"며 "과거에는 제로투원(0에서 1이 되는 것을 창조하는 것)의 영역은 오로지 인간의 영역이었다. 초기 아이디어를 구상하고, 개념화하고, 구체화하고, 초안까지 완성하는 과정을 거친 다음에 그것들을 컴퓨터가 알아들을 수 있게 마우스나 키보드를 통해 전달을 했다. 그리고 이후 완성까지의 업무 과정에서 소프트웨어가 도와주는 형식이었다. 하지만 Generative AI을 통해 제로투원의 과정에서 (컴퓨터가) 인간과 상호작용할 수 있게 됐다. 그뿐만이 아니라 이후의 과정에서도 기존 소프트웨어가 하던 일을 Generative AI가 도와줄 수 있다"고 덧붙였다.

[자료=뤼튼테크놀로지스]

현지웅 리드는 향후 유망한 Generative AI의 응용 및 사업화 영역으로 ▲ GENERAL AI MODELS ▲ SPECIFIC AI MODELS ▲ HYPER-LOCAL AI MODELS ▲ OPERATING SYSTEMS AND API LAYERS ▲ APPLICATIONS을 제시했다.

이 중 가장 유망한 영역으로는 HYPER-LOCAL AI MODELS과 OPERATING SYSTEMS AND API LAYERS, APPLICATIONS을 꼽았다.

현 리드는 "HYPER-LOCAL AI MODELS은 일종의 전문가 모델로, 개별 기업이 원하는 코드 스타일을 이해하고 측정할 수 있는 형태다. 유저 데이터와 같은 독점적 데이터로 구축이 되거나 혹은 B2B나 파트너십을 통한 HYPER-LOCAL로 된 데이터를 기반으로 학습을 하는 영역"이라고 설명했다.

이어 "애플리케이션 레이어는 사람과 AI가 상호작용을 하고, 협업할 수 있는 인터페이스를 제공하는 형태다. 예를 들어 비즈니스 고객이 업무에 있어서 도움을 받는다거나 소비자가 엔터테인먼트 요소로 AI 모델을 체험하는 등의 형태"라며 "API LAYERS는 APPLICATION과 AI 모델을 이어주는 중간 다리다. APPLICATION 레이어 영역에서는 유저들의 수요를 충족시키는 것이 최우선이기 때문에 결국은 범용 AI 모델을 하나만 사용하는 것이 아니라 여러 가지의 AI 모델들을 종합적으로 응용하는 방향으로 발전해 나갈 것"이라고 덧붙였다.

[자료=뤼튼테크놀로지스]

또 "Generative AI 시장은 초기인 만큼 OPERATING SYSTEMS AND API LAYERS 관련 회사들이 아직 등장하지 않고 있다. Generative AI 모델의 빠른 발전과 응용 및 사업화 영역에서의 경쟁력을 갖추기 위해서는 OPERATING SYSTEMS AND API LAYERS, HYPER-LOCAL AI MODELS 등이 충분히 내재화되어야 한다"며 "바로 이 영역들이 (AI를) 응용하는 기업들의 핵심 경쟁력으로 발휘할 수 있는 부분이 될 것"이라고 전했다.

현 리드는 대표적인 성공 사례로 광고 문구, 이메일 등을 작성해 주는 비즈니스 콘텐츠 생성 플랫폼을 제공하는 제스퍼라는 회사를 꼽았다. 이 회사는 다양한 툴을 제공해 현재 한화로 2조 원의 가치를 지닌 유니콘이자 APPLICATION LAYERS 서비스를 제공하는 회사다. 초기에는 GPT3 범용 AI 모델 기반으로 시작을 했지만 지금은 SPECIFIC AI MODELS 및 HYPER-LOCAL AI MODELS로 다양한 가치를 제공하고 있다.

현 리드는 "한국에서는 네이버와 KT, LG, SK텔레콤 등 대기업 위주로 Generative AI 모델 개발 경쟁이 이뤄지고 있다. 앞으로 챗GPT와 같이 범용적인 AI 모델 개발사에서 만들어진 APPLICATION은 마치 아이폰의 메신저나 노트, 건강 앱과 같이 기본 앱처럼 사용자들에게 제공이 될 것"이라며 "하지만 이들이 단기간에 특화되는 것이 아니기 때문에 응용 기업들은 각 영역에서 자신의 APPLICATION을 잘 구축하고, 모델 생태계에 국한되지 않고 다양한 Generative AI 모델을 활용하면서 고객 데이터를 모으고, 궁극적으로는 SPECIFIC AI MODELS 및 HYPER-LOCAL AI MODELS 만들어 나가면서 경쟁력을 갖춰 나가야 된다. 앱스토어라는 생태계를 통해 다양한 모바일 빅테크 기업들이 탄생할 것과 마찬가지"라고 강조했다.

[자료=뤼튼테크놀로지스]

아울러 "인터넷과 모바일의 혁명을 이끌었던 미국 주요 투자자는 이제 생성 AI가 인터넷과 모바일을 능가하는 기술 혁명이라고 평가를 한다. 또한 지금 시점을 인터넷 초기 스토어 초기 모습이라고 이야기를 하고 있다"며 "인터넷 시장 초창기에 가능해진 제로마진 코스트라는 이점을 극대화한 아마존이나 구글, 페이스북 같은 기업들을 인터넷 기업들이 인터넷의 기술 발전과 함께 빅테크 기업이 된 것처럼 기존 기업과 서비스가 Generative AI를 응용한다고 해도 모두 Generative AI 컴퍼니라고 할 수는 없다"고 전했다.

더불어 "AI에서 가능한 요소들을 극한으로 활용하는 기업들이 발전 과정에서 승리할 것이다. 중요한 요소는 제로마진과 콘텐츠 큐레이션이 될 것이라고 본다. 텍스트와 이미지, 영상과 같은 콘텐츠의 생성 비용과 시간이 점점 낮아지고 있다"며 "기존의 추천 엔진으로는 불가능했던 초개인화 콘텐츠를 생성·구현하면서 유저에게 새로운 가치를 전달해 주는 기업이 결국 Generative AI 컴퍼니가 될 것"이라고 덧붙였다.

◆ 챗GPT와 Generative AI, 멀티미디어 산업 변화 가져올 것

김태수 네오사피엔스 대표는 "크레이티브티 툴로서 AI가 굉장히 좋은 애플리케이션이 지금 되고 있는 것 같다. 사람들의 어떤 창의적인 활동을 대체한다기보다 그것을 도와주고, 그다음에 일부는 대체될 수도 있겠지만 생산성을 향상시키는 방향"이라며 "과거 10년 전에는 글 쓰는 일이나 프로그래밍 하는 일들이 가장 나중에 기계로 대체될 것이라고 생각했는데, 완전히 반대 방향으로 가고 있다"고 전했다.

이어 "챗GPT라고 하는 GPT 알고리즘은 결국 언어모델이고, 이는 단어나 글자와 같은 것들을 있을 때 그 다음을 예측하는 모델을 학습하는 것이다. 대량의 텍스트 데이터를 이용하여 다음 단어를 예측하는 아주 큰 신경망 모델을 학습하는 것"이라며 "이미 적절한 응답을 텍스트로 잘 내보내준다라는 것은 증명이 됐다. 텍스트 형태의 콘텐츠 생산이 굉장히 용이해지면 초벌 번역의 개념도 바뀔 수 있을 것이다. 현재 미디어 콘텐츠 환경을 좀 보면 (AI를 통해 제작된) 콘텐츠들을 텍스트로만 소비를 할 것으로 보지 않는다"고 덧붙였다.

김태수 대표는 생성 AI가 멀티미디어 콘텐츠를 제작·서비스하는 영역에서 대폭 활용될 것으로 봤다.

김태수 네오사피엔스 대표. [사진=양태훈 기자]

김 대표는 "예를 들면 유튜브다. 이에 필요한 오디오, 비디오를 제작하기 위해서는 현재는 연기자들이 필요하지만, 앞으로는 챗GPT가 음성도 만들어내게 될 것"이라며 "이미 (AI 기술과 접목한) 아바타가 등장하고 있고, 실사에 가까운 합성 기술들이 나오고 있다. 여기서 기회의 창이 열리는 부분은 Generative AI를 통해 얼굴표정을 생성하거나 자동으로 제스처를 자연스럽게 생성하는 등의 분야"라고 설명했다.

나아가 "대표 사례로 네오사피엔스는 특정한 프로젝트에 필요한 음성과 영상을 생성할 수 있는 타이프캐스트라는 서비스를 운영하고 있다. 현재 130만 명이 가입자를 확보했고, 350여 종의 연기자·성우·아나운서를 제공하고 있다. 전 세계 75개국에 유료 사용자가 있다"며 "(네오사피엔스의 서비스가) 틱톡 숏폼이나 유튜브 쇼츠 콘텐츠 제작에 많이 사용되고 있는데 전문 큐레이터나 제작자, 편집자들이 성우·아나운서를 대신해 콘텐츠를 만들고 있다. 뉴스 콘텐츠에 더빙을 넣는 방식으로도 앞으로 서비스가 많이 이용될 것으로 보고 있다"고 전했다.  

dconnect@newspim.com

CES 2025 참관단 모집
<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>