제보
주요뉴스 산업

생성형 AI 난제 '할루시네이션', GPT-5 성능 기대…국내선 '비큐AI' 주목

기사등록 : 2024-05-20 08:00

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
비큐AI, 신규 서비스 'RDPLINE' 지난해 10월 출시

[서울=뉴스핌] 이나영 기자= 프런티어 AI(고도화된 생성형 인공지능)의 선두주자로 알려진 챗GPT의 최신 모델인 'GPT-4o(포오)'가 최근 공개 돼 다시 한번 전 세계에 충격을 준 가운데, 업계에서는 GPT-5가 얼마나 더 향상된 성능을 보여줄지를 기대하고 있다.

20일 업계에 따르면, 올해 초 챗GPT를 개발한 오픈AI의 샘 올트먼 최고경영자(CEO)는 스위스 세계경제포럼(WEF·다보스포럼) 현장에서 "GPT-2는 매우 나빴고(Very Bad), GPT-3는 꽤 나빴으며(Pretty Bad), GPT-4는 나쁜 수준이었다(Bad)"며 "하지만 GPT-5는 괜찮을 것(Would be Okay)"이라며 기대감을 높였다.

구글의 '제미나이 울트라(Gemini Ultra)' 등 경쟁 기업들의 신규 모델들이 최근 GPT-4와 유사하거나 일부 영역에선 뛰어넘는 수준의 성능을 보여주고 있다는 평을 받고 있다. 업계 관계자들은 오픈AI가 경쟁자들을 따돌리기 위해 GPT-5에 어떠한 기술적·기능적 보강을 진행하고 있을지 주목하고 있다. 특히, 생성형 AI의 최대 난제로 알려진 '환각(할루시네이션)' 문제를 얼마나 최소화했는지도 주요 쟁점 중 하나다.

오픈AI와 챗GPT 로고 [사진=뉴스핌DB]

할루시네이션은 AI가 거짓 또는 날조된 정보를 답변에 포함하는 현상이다. 예컨대 현재 대통령이 누구인지 묻는 질문에 이전 임기의 대통령을 답하거나, 실존하지 않는 사건을 판례 인용문으로 답변한 '가짜 판례' 사건 등이 대표적 사례다.

할루시네이션을 억제하기 위해 다양한 시도가 이어지고 있으나 현재 'RAG(Retrieval Augmented Generation, 검색 증강 생성)'을 활용한 방안이 유일한 해결책으로 평가받고 있다. RAG는 외부 지식 베이스에서 정보를 가져와 LLM(대형언어모델)에 적용시켜 답변을 한 층 정확하게 만드는 기술이다.

RAG와 관련해 국내에선 '비큐AI(전 비플라이소프트)'가 주목받고 있다. 비큐AI는 신규 서비스인 RDPLINE(Real-time Data PipeLine)을 지난해 10월 출시했으며, RDPLINE은 생성형 AI 학습에 필요한 원천·정제 언론 데이터를 제공하는 플랫폼이다.

RDPLINE은 20여년간 비큐AI가 축적해 온 약 7억개 이상의 대규모 데이터를 벌크 형태로 제공한다. 뿐만 아니라 수요 기업은 매일 실시간 업데이트되는 약 20만개의 데이터도 API 형태로 공급받을 수 있다. RDPLINE을 통해 '과거'에 대한 '정확한 데이터' 확보는 물론 '현재' 데이터도 즉각 확보가 가능한 것이다.

비큐AI의 가장 큰 특징은 다년간의 업무 노하우와 자체 AI 솔루션으로 '전처리' 과정의 차별화된 기술력을 보유하고 있다는 점이다. 특히, ▲데이터 보유량 ▲처리 속도 ▲라벨링 품질 등에서 압도적 우위를 보여주고 있다. 이 같은 결과가 삼성전자, KT, SKT, LG 등과의 RDPLINE 공급 계약 체결이다.

RDPLINE의 또 다른 강점 중 하나는 '저작권 분쟁'에 대한 리스크를 선제적으로 해소할 수 있다는 것이다. 비큐AI는 한국언론진흥재단의 공식 저작권 유통대행사로 국내 언론사들의 뉴스 저작권을 합법적으로 유통하고 있다. 이와 더불어 약 3000여곳의 언론사와도 파트너십을 맺고 우호적 관계를 유지하고 있다.

RPDLINE 로고. [사진=비큐AI]

주요 빅테크들의 AI 학습용 무단 데이터 '크롤링(수집)' 의혹은 아직까지도 업계에서 '뜨거운 감자'로 여겨진다. 실제 해외에서 '게티이미지'는 '스테이빌리티AI'를 대상으로 1조 8천억달러에 달하는 초대형 소송을 제기했으며, '뉴욕타임즈(NYT)'와 오픈AI의 저작권 침해 논란은 여전히 진행 중이다.

다만 구글이 NYT에 3년간 1억달러를 지불하면서 기사 데이터를 구매하기로 했고, 최근에는 월스트리트저널(WSJ)의 발행사인 '다우존스'의 모기업 '뉴스코퍼레이션'과 AI 콘텐츠 이용 및 제품 개발을 위한 계약을 체결해 언론 데이터 저작권 개선 움직임이 본격화되고 있다.

업계에 따르면 구글이 뉴스코퍼레이션에 지급하기로 한 금액만 한화로 연간 약 83억원(500~600만달러)에 달하는 것으로 알려졌다. 뉴스코퍼레이션은 다우존스, 하퍼콜린스, 더타임스, 유로 방송 등을 자회사로 두고 있는 세계 최대 미디어그룹이다.

오픈AI도 지난달 영국 일간지 '파이낸셜타임스(FT)'와 콘텐츠 이용과 AI 기능 개발을 위한 파트너십을 체결하며 저작권 분쟁 최소화에 나서고 있다. 오픈 AI는 앞서 미국 'AP통신', 독일 '악셀 스프링거', 프랑스 '르몽드' 등과도 이와 비슷한 계약을 체결한 바 있다.

비큐AI는 국내뿐 아니라 주요 국가의 합법적 글로벌 뉴스 데이터 확보와 동시에 글로벌 빅테크향 매출 증대 전략도 함께 추진하고 있다. 국가별 주요 언론 매체와 'RDPLINE 얼라이언스'를 구축하고 국내와 해외 양방향적으로 고객사 확대 및 데이터풀(Pool) 확장에 나서겠다는 계획이다.

실제 비큐AI는 최근 이를 위해 실리콘밸리에 본사를 둔 AI&IT 전문 미디어 매체와 업무협약(MOU) 및 본계약을 체결했다. 이를 통해 비큐AI는 글로벌 AI 기업들에게 각 국의 뉴스 데이터에 합법적으로 접근할 수 있는 전략적 마케팅을 추진하고 있는 것으로 알려졌다.

김두현 하나증권 연구원은 최근 발간한 보고서에서 비큐AI가 "데이터 수요자에게 공인된 데이터를 제공하고 데이터 공급자에게는 부가 수익 창출을 제공할 수 있는 유일한 상장사"라며 "생성형 AI 학습에 있어서 저작권법 문제는 피해 갈 수 없는 글로벌 흐름이며, 이에 따른 비큐AI의 구조적인 성장은 필연적인 상황"이라고 분석하고 관련 분야의 수혜기업으로 꼽았다.

한편, 지난 13일 비큐AI의 변경상장(상호변경)이 완료됐다. 비큐AI는 최근 사명변경을 비롯해 기업 이미지(CI), 기업 이니셔티브, 슬로건 등을 새롭게 정립했다. 비큐AI는 비플라이소프트의 뿌리를 이어받아 고객과 AI를 위해 존재하고 시너지를 널리 확산시키겠다는 의지를 담았으며, 회사는 올해 생성형 AI의 핵심 자산인 '데이터'를 바탕으로 AI 분야의 혁신을 이끌고 글로벌 기업으로 도약해 나갈 방침이다. 

nylee54@newspim.com

CES 2025 참관단 모집
<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>