제보
주요뉴스 산업

세계 3대 이미지생성AI 뛰어넘는 토종기술 IEEE에 논문 게재…'캐릭터·배경 안 바뀐다'

기사등록 : 2024-02-26 15:10

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
문맥 일관성 이미지 생성 독보적 결과 도출
기존 서비스 대비 2배 이상 연계성 상회
동영상 생성 시 경쟁력↑…특허 출원 완료


[세종=뉴스핌] 이경태 기자 = 세계 3대 이미지생성 인공지능(AI) 서비스를 뛰어넘는 국내 원천기술이 공개됐다. 캐릭터와 배경이 바뀌지 않는 등 일관성 있는 이미지를 생성하는 데 독보적인 결과물을 만들어내고 있어 향후 글로벌 AI 기업이 탐내는 기술로 평가된다. 

26일 한국인공지능협회·맥케이(AI 기업)에 따르면, 맥케이가 직접 개발한 기술이 소개된 '생성형 인공지능을 사용해 컨텍스트를 고려한 이미지 생성에 대한 새로운 구조'라는 제목의 논문이 지난 23일 국제전기전자공학회(IEEE)에서 배포됐다.

기존의 생성형 AI 서비스를 보면 같은 인물이나 배경을 유지하지 못한다는 게 문제로 지적됐다.

실제 달리(DALL-E), 스테이블디퓨전(StableDiffusion), 미드저니(Midjourney) 등 대표적인 3대 이미지생성 AI를 보면 문장이 달라지면 인물과 배경이 각기 다르게 표현된다. 

맥케이가 개발한 기술이 기존 3대 이미지생성 AI 서비스 대비 더 높은 문맥 연관성을 보여주고 있다. [자료=맥케이] 2024.02.26 biggerthanseoul@newspim.com

이와 관련 맥케이는 3가지 문장을 제시했다. 이 문장을 보면 '빨간 색 옷을 입은 한 남성이 있다. 그 남자는 배 위에서 낚시를 하고 있다. 배 여러 척이 그 남자의 주위를 둘러싸고 모여있다'로 돼 있다. 

달리, 스테이블디퓨전, 미드저니로 확인할 결과, 각각 첫 인물만 빨간 색 옷을 입은 남성으로 이미지를 생성했을 뿐 그 이후부터는 빨간 색 옷을 입은 남성을 찾을 수가 없었다.

이와 달리 맥케이의 기술로 이미지를 생성하면 빨간 옷을 입은 남성이 지속해서 생성되는 것을 알 수 있다.

맥케이가 개발한 이 기술 중 '초기 문맥 우선(ICF) 방식으로 전환한 값을 보면 달리 첫번째와 두번째 사이의 연관성에서 달리 0.2, 스테이블디퓨전 0.2, 미드저니 0.2, 맥케이의 ICF 방식 0.4 로 맥케이 기술이 2배 가량 연계성이 높은 것으로 확인됐다.

두번째와 세번째 이미지의 연관성을 볼 때에도 달리 0.4, 스테이블디퓨전 0.4, 미드저니 0.6, 맥케이 방식 0.8 등으로 맥케이 기술이 우수한 것으로 나타났다. 이 값은 높을 수록 상호 이미지 연관성이 높다는 것을 의미한다.

결과적으로 맥케이의 기술을 활용하면 일관성이 있는 이미지를 지속적으로 생성할 수 있기 때문에 영상 제작시 경쟁력을 확보할 수 있다.

[사진 = 오픈AI 홈페이지] 미국 오픈AI(OPEN AI)가 15일(현지시간) 공개한 동영상 생성 AI 서비스인 '소라'를 통해 제작한 영상.

AI 업계 한 전문가는 "이 기술이 중요한 이유는 최근 전세계를 놀라게 한 오픈AI의 영상 생성 서비스인 소라(Sora)가 공개되면서 영상 제작에 대한 기대가 높아지고 있기 때문"이라며 "맥케이의 이같은 기술은 현재는 이미지의 연관성을 높여주는 기술이나 영상이 많은 이미지로 구성되기 때문에 실제 영상 생성에도 큰 도움을 줄 수 있을 것"이라고 말했다.

그는 "당장 맥케이의 기술이 소라 서비스를 앞지를 수는 없겠지만 영상 생성을 위한 핵심적인 기술이라는 점에서 국내외 투자의 시선을 끌기에 충분할 것"이라며 "영상을 생성하기 위한 원천기술이기 때문에 기존 오픈AI사 역시 유사한 방식으로 개발을 했다면 분면 맥케이의 기술과도 연관성이 높을 것"이라고 강조했다.

이와 관련 맥케이는 이 기술에 대한 권리를 보호받기 위해 지난해 11월 국내외 특허 출원을 완료한 상태다.

한 유튜버는 "국내기업의 기술이 짧은 영상을 만들 수 있는 원천 기술이 된다면 그야말로 다양하게 활용해서 우리나라 기술을 널리 알리고 싶다"며 "요즘에는 릴스나 쇼츠와 같은 짧은 영상이 대세이기 때문에 이같은 기술이 빨리 상용화되길 기대한다"고 말했다.

최재호 맥케이 대표는 "문맥을 유지해서 이미지를 생성하기 때문에 광고 영상을 비롯해 영화나 애니메이션까지 제작할 때 그만큼 일관된 스토리텔링을 전개해나갈 수 있을 것"이라며 "이 기술을 기반으로 향후 온디바이스 AI(On-device AI)로 구축해 스마트폰에서도 관련 영상 등을 생성하는 AI를 개발할 것"이라고 말했다.

biggerthanseoul@newspim.com

CES 2025 참관단 모집
<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>