기술은 결코 뜻한 방향대로 움직여주지 않는다. 생성형 AI가 등장한지 1년 반이 되어가는 시점에서 살펴본 소셜 담론의 결과도 그렇다.
생성AI가 주로 생산성 향상 측면에서 활용될 것이라는 예상과 달리 상당수 놀이문화의 일부로 자리잡아 그 활용성을 넓히고 있다. AI로 소설을 쓰고 그림을 그리고 AI가상인물을 부캐로 삼아 영상도 만든다. 일하는 데 도움이 되라고 만든 도구가 정작 대중적인 놀이도구로 더 많이 쓰이고 있다니 자못 흥미롭다.
영상, 게임, 광고 등 지식재산권(IP)생산에 생성형AI가 핵심 도구로 부상 중이다. 스토리 개요, 스케쥴, 보고서 작성 등의 텍스트 생성은 물론 제작물에 필요한 이미지와 오디오, 영상 등의 멀티모달 데이터 생성까지 과거에 비해 훨씬 적은 비용으로 쉽고 빠르게 효율적인 제작이 가능하다. 이러다 관련 인력까지 AI가 대체하는 게 아니냐는 우려가 당연해 보인다.
특히 지난 2월 오픈AI에서 공개한 '텍스트 투 비디오(Text to Video)' 영상 생성 AI모델 '소라(Sora)'는 충격적이었다. 고화질에 자연스럽고 섬세한 표현, 다양한 캐릭터뿐 아니라 명령어로 제시하지 않은 내용까지 적절한 연출 기법을 통해 스스로 서사를 만들고 결과물로 완성한다. 이 같은 정교한 영상은 소라가 명령어를 이해할 뿐 아니라 현실의 물리적 규칙을 이해하고 이를 영상에 적용했음을 보여준다.
하민회 이미지21 대표. |
프롬프트에 맞춰 최대 1분 길이의 동영상을 생성하는 소라의 출현에 광고와 영화 예고편 업계는 종말을 맞았다는 말까지 돌았다. 전 세계 영상업계를 흔들었던 소라는 대중 공개를 미루고 일부 소수의 창작자에게만 사용권을 부여하며 검증에 돌입했다.
전문가가 본 소라의 기술력은 어느 정도일까? 영화계 전체가 위협을 느낄 만큼 강력할까?
"제작 가치와 품질의 관점에서 볼 때, 소라는 영화에 사용되는 것과는 아직 거리가 멀다" 한달 간 작업에 소라를 사용한 영화감독 폴 트릴로가 비즈니스 인사이더와의 인터뷰에서 밝힌 결론이다.
트릴로 감독이 꼽은 가장 큰 이유는 프롬프트의 한계다. 그는 소라가 슬롯머신처럼 아이디어를 뒤섞기 때문에 자신이 의도한 정확한 장면을 프롬프트로 설명해서 만들어 내기엔 한계가 있었으며 결과값도 매번 달라졌다고 했다.
[사진 = 오픈AI 홈페이지] 미국 오픈AI(OPEN AI)가 15일(현지시간) 공개한 동영상 생성 AI 서비스인 '소라'를 통해 제작한 영상. |
생성AI의 공통적인 문제인 일관성 유지의 어려움도 짚었다. 경우에 따라 물리적 법칙을 따르지 않거나 학습 데이터의 다양성 부족에서 오는 문제도 지적했다.
무엇 보다 결정적인 것은 ' 영화 제작 과정을 독특한 경험으로 만드는 핵심 요소의 부재' 였다. 현장에서 배우나 스태프들과 함께 작업하며 느끼는 긴장감과 협업 과정 자체가 반영될 수 없다는 점이 소라의 치명적인 약점이었다.
트릴로 감독은 소라가 누구를 위한 도구인지 보다 명확해질 필요가 있다고 했다. 비용 절감 면에서는 확실한 장점이 있으니 인디영화 제작자에게는 큰 기회가 될 수도 있을 것으로 보았다.
영상 제작에 있어 생성AI의 가장 큰 장점은 비용절감이다.
그 동안 영상 제작과정에는 엄청난 비용과 비효율적인 작업이 존재할 수 밖에 없었고 기꺼이 이를 감내해왔다. 수 초가량의 장면을 촬영하기 위해 수 시간에 수십명을 동원하는 등의 막대한 비용을 쏟아붓는 일이 비일비재했다.
하지만 생성AI모델을 사용하면 제작비가 많이 드는 장면의 중간 일부를 적은 비용으로 제작할 수 있다. 최근 공개된 2분 30초짜리 독립 영화 '솜 레퀴엠(Somme Requiem)은 1914년 제1차 세계대전 중 눈보라에 갇힌 크리스마스 휴전 사건을 다뤘다. 생성AI 런웨이로 초벌 영상을 제작하고 사람이 시나리오, 음악, 영상 편집을 맡아 후작업을 했다. 생성AI가 없었다면 비용문제로 꿈도 꾸지 못할 전쟁물이었다.
[서울=뉴스핌] 이호형 기자 = ICT 전시회 2024 월드 IT쇼가 17일 오전 서울 삼성동 코엑스에서 열린 가운데 관람객들이 삼성전자 갤럭시 S24 부스를 둘러보고 있다. 2024.04.17 leemario@newspim.com |
비용절감에 생성AI가 필요하다면 고품질의 완성도 있는 영상에는 반드시 인간의 손길이 필요하다.
트릴로 감독의 말처럼 프롬프트로 만들어내는 영상은 제어할 수 있는 부분이 많지 않다. 단일 프롬프트에서 1분 이상의 길고 일관된 영상을 한 번에 생성하는 건 아직은 어렵다. 캐릭터의 물성이 바뀌거나 색상이 잘못되거나 형태가 변하기 쉽기 때문이다. 디테일한 부분의 제어를 위한 편집과 수정, 영상 추출 등에는 사람의 수고가 더해져야 한다.
결국 저비용 고품질 두 마리 토끼를 잡으려면 AI와 숙련된 사람의 협업이 필수적이다.
이미 생성AI는 영상 외 멀티모달 콘텐츠 생산 비용도 혁신적으로 낮추고 있다. 음악, 음향효과 면에서도 드라마틱한 기술들이 대거 등장 중이다.
구글 딥 마인드 출신 연구원들이 설립한 스타트업 유디오(Udio)는 프롬프트만으로 다양한 장르의 40초 이내 음악을 생성한다. 한국어를 비롯해 여러 나라의 언어로 보컬 생성도 가능하다.
[서울=뉴스핌] 이호형 기자 = ICT 전시회 2024 월드 IT쇼가 17일 오전 서울 삼성동 코엑스에서 열린 가운데 관람객들이 LG전자 부스서 미래 자율주행 경험을 구현한 LG알파블 자동차 설명을 듣고 있다. 2024.04.17 leemario@newspim.com |
국내 스타트업 옵티마이저AI는 텍스트를 인식해 고품질의 음향 효과를 만드는 자체 AI모델을 개발했다. '성을 공격하는 수십만 대군(大軍)의 함성 소리' 라는 명령어에 여러 사람들이 내는 생동감 있는 함성 효과가 만들어진다. 영화, 드라마, 게임 제작에 쓰이는 효과음은 구하기도 어려울 뿐 더러 제작 시간과 비용도 상당한 만큼 크리에이터 시장 성장에 긍정적인 영향을 미칠 것으로 기대하고 있다.
유튜브의 등장으로 누구나 방송인이 될 수 있었던 것 처럼 생성AI는 누구나 콘텐츠 제작자가 될 수 있도록 돕는다. 유튜브 크리에이터들 사이에서도 생성AI 프로그램을 익히는 건 필수 사항이 되었다.
구글 로고 [사진=로이터 뉴스핌] |
제작비를 획기적으로 낮출 수 있는 만큼 실력을 갖춘 최소한의 인원만으로 광고와 독립영화는 물론 게임까지 콘텐츠 창작의 영역을 넓힐 수 있다. 물론 생성AI를 효과적으로 잘 활용한다는 전제 하에서 말이다.
"아마도 10년 뒤쯤, 아무런 자원도 없는 누군가의 삶에는 큰 변화를 불러올 수 있을 것" 트릴로 감독의 소라에 대한 정리 멘트는 생성AI가 바꿀 미래 콘텐츠 제작자의 요건을 시사한다. 원대한 꿈과 무궁무진한 상상력과 감성 그리고 생성AI의 효과적 활용. AI에 올라 탄 인간의 능력이 나날이 확장되고 있다.
◇하민회 이미지21대표(코가로보틱스 마케팅자문) =△경영 컨설턴트, AI전략전문가△ ㈜이미지21대표, 코가로보틱스 마케팅자문△경영학 박사 (HRD)△서울과학종합대학원 인공지능전략 석사△핀란드 ALTO 대학 MBA △상명대예술경영대학원 비주얼 저널리즘 석사 △한국외대 및 교육대학원 졸업 △경제지 및 전문지 칼럼니스트 △SERI CEO 이미지리더십 패널 △KBS, TBS, OBS, CBS 등 방송 패널 △YouTube <책사이> 진행 중 △저서: 쏘셜력 날개를 달다 (2016), 위미니지먼트로 경쟁하라(2008), 이미지리더십(2005), 포토에세이 바라나시 (2007) 등