[서울=뉴스핌] 성상우 기자 = 지난해 본격 태동한 '인공지능(AI) 스피커' 시장이 '화자인식' 기술 적용으로 올해 새로운 경쟁 국면을 맞게 될 전망이다. 이용자 목소리를 구별하는 이 기술은 AI 스피커의 대중화를 이끌 것이란 게 업계 관측이다. 기술 상용화 측면에선 KT와 카카오가 현재 가장 앞서있는 것으로 나타났다.
14일 관련업계에 따르면 KT(회장 황창규)와 카카오(대표 여민수·조수용)가 연내 AI 스피커에 화자 인식 기능을 도입할 예정이다.
KT '기가지니'(왼쪽)와 카카오 '카카오미니'(오른쪽) <사진=각사> |
KT는 음성만으로 상품 주문과 결제까지 한번에 가능한 화자인식 및 인증 기술을 오는 9월께 상용화한다는 계획이다. 현재 특정인의 목소리만을 식별할 수 있는 화자식별 기술과 목소리를 통해 결제까지 할 수 있는 원거리 목소리 생체인증(FIDO) 기술을 금융감독원에 인증 요청한 상태다. 오는 6월 중 인증받는 것을 목표로 하고 있다.
인증이 완료되면 9월부터 상용화 서비스를 적용한다는 계획이다. 앞으로 AI스피커 '기가지니'를 통해 목소리만으로 결제까지 완료할 수 있게 된 것. 기존 음성 비서 기술로는 모바일 쇼핑몰에서 상품을 주문하는 것까지만 가능했다. 회사측에 따르면 현재 KT 화자인증 기술의 목소리 사칭률은 0.01%로 금융거래가 가능한 수준이다.
카카오 역시 사전 등록한 특정인의 목소리만을 구별하는 화자인식 기능을 상반기 중 도입한다. 이 기술을 통해 자사 AI스피커 '카카오미니'와 카카오톡의 결합을 더 강화한다는 방침이다
이 기술을 통해 하반기부턴 카카오톡 수신 메세지 '읽어주기' 기능까지 가능해진다. 지금까지 카카오미니는 카카오톡 메세지 '보내기'까지만 가능했다. 수신 메세지 읽어주기 기능은 타인의 카카오톡 메세지까지 읽어줄 수 있는 위험성이 있어 지금까지 적용하지 못했다. 화자인식 기술을 통해 특정 이용자를 구별할 수 있어 메세지 수신 알림 후 읽어주기와 보내기 기능까지 카카오톡을 음성만으로 완전히 이용할 수 있게 된 것.
다만, 목소리 인증만으로 금융거래까지 할 수 있는 '화자인증' 기능을 적용하기까진 시간이 더 걸릴 것으로 보인다. 카카오 관계자는 "금융 거래까지 가능한 화자 인증 적용 일정은 아직 미공개"라며 "기술적으론 완성 단계에 있지만 정확도를 더 높여야하는 문제가 있고 어떤 서비스에 어떤 방식으로 적용할 지에 대한 계획도 세워야한다"고 말했다.
두 회사 모두 인터넷은행 '케이뱅크'와 '카카오뱅크'를 보유하고 있다는 점도 화자인증 기술 적용을 서두르는 이유다. 업계는 모바일 또는 AI 스피커를 통해 별도 인증 절차 없이 음성만으로 결제, 송금, 계좌조회 등이 가능해진다면 기존의 금융 거래 패턴에 획기적인 변화를 가져올 수 있다는 판단에서다.
또 다른 플랫폼 기업 네이버 역시 화자인식 기능을 올해 중 도입할 것으로 추정된다. 자사 AI스피커인 '프렌즈와 '웨이브'에 동시에 탑재된 AI 플랫폼 '클로바'에 기술을 적용하는 방식이다. 검색 포털, 쇼핑, 음악 서비스 등 다양한 분야에서 이용자 목소리를 구별하고 명령 수행 및 결제까지 가능한 개인화 서비스를 구현한다는 구상이다.
다만, 네이버 관계자는 "화자인증 기술을 빠른 시일내 적용한다는 방침이지만 공식적으로 나온 일정이나 계획은 없는 상황"이라고 설명했다.
SK텔레콤은 아직 관련 계획이 없는 상태다. 금융거래까지 가능한 화자인증 기술을 전면 도입하려면 인식 정확도를 100% 수준으로 끌어올려야 한다는 판단이다. SK텔레콤 관계자는 "해당 기술을 검증하는 단계에 있으나 아직 구체적 적용 계획은 없는 상태"라고 밝혔다.
업계는 화자인식 및 인증 기술을 가장 먼저 상용화하는 회사가 올해 AI스피커 시장의 주도권을 선점할 것으로 보고 있다. 지난해까지 AI 스피커는 단지 이용자의 명령에 대해 자체 DB 바탕으로 이에 대답하거나 간단한 오락 기능을 수행하는 것에 그쳐 활용도가 높지 않았다. 올해부터 목소리를 구별하는 기술이 적용되면 본격적인 개인 맞춤 명령 서비스, 주문 결제, 금융 거래까지 AI 스피커의 활용도를 획기적으로 넓힘으로써 새로운 시장을 창출할 것이란 관측이다.
업계 관계자는 "AI 스피커 시장은 이제부터가 시작이라고 할 수 있다"면서 "이용자를 구분할 수 있어야 본격적인 AI 기반 개인화 서비스가 가능하다. 가만히 앉아서 말만으로 모든 것을 할 수 있는 서비스 생태계 시작이 화자인식 기술. 이 기술을 선점하는 쪽이 장기적으로 음성 비서 플랫폼 생태계를 주도할 수 있을 것으로 본다"고 말했다.
swseong@newspim.com