제보
주요뉴스 산업

엔씨소프트, AI 음성 합성 기술 '멀티버스 TTS' 공개

기사등록 : 2024-10-08 14:32

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
적은 데이터로 다국어 음성 제작
게임 캐릭터 음성 개발에 활용

[서울=뉴스핌] 양태훈 기자 = 엔씨소프트가 8일 게임 음성 제작 과정에 활용할 수 있는 인공지능(AI) 모델 'Zero-shot Multi-verse TTS(멀티버스 TTS)'를 공개했다.

멀티버스 TTS는 3초 분량의 음성 데이터만으로도 다양한 발화 스타일 변환과 다국어 음성 제작이 가능한 기술이다. 이 기술을 활용하면 제한된 음성 리소스로 고품질의 AI 캐릭터 보이스를 제작할 수 있어, 기존 음성 작업에 소요되던 시간과 비용을 크게 절감할 수 있다.

엔씨소프트 측은 "단일 모델로 여러 언어와 기능을 가진 TTS를 구현해 다국어 음성 콘텐츠를 제작할 수 있다"며 "경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다"고 설명했다.

'바르코(VARCO)' 로고. [사진=엔씨소프트]

멀티버스 TTS 기술의 우수성은 세계적 권위의 인공지능 기술 학회인 EMNLP(Empirical Methods in Natural Language Processing)에 관련 논문이 게재되면서 입증됐다.

엔씨소프트는 이 기술을 활용해 연내 100종의 게임 캐릭터 음성을 제작할 계획이다. 또한 NPC(non-player character)의 성격과 상황에 맞는 음성을 제작하는 조절 기능도 지속적으로 개발할 예정이다.

dconnect@newspim.com

CES 2025 참관단 모집
<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>