[대전=뉴스핌] 김태진 기자 = 국내 연구진이 기존의 문어체 언어분석 기술을 고도화시킨 구어체 언어분석 API(운영체제가 제공하는 함수의 집합체)를 공개했다.
이를 통해 글을 이해하는 인공지능(AI)을 넘어 사람의 말까지 이해할 수 있는 AI 서비스 개발에 박차가 가해질 전망이다.
엑소브레인 언어분석API 데모UI [사진 제공 = ETRI] 2020.08.06 memory4444444@newspim.com |
한국전자통신연구원(ETRI)은 위키백과 및 법령 등 문어체를 주로 이해하는 기존 언어분석 기술을 확장해 사람의 대화 분석오류를 최대 41% 개선하고 정확하게 이해할 수 있는 구어체 언어분석 기술을 개발, 관련 사이트에 공개했다고 6일 밝혔다.
연구진은 기존 문어체 기술을 고도화해 사람의 대화까지 정확하게 이해할 수 있는 구어체 언어분석 기술을 개발하는 데 성공했다.
이로써 관련 산업 생태계를 활성화하고 AI비서, 챗봇 등 AI 서비스 개발이 한층 가속화될 전망이다.
ETRI가 공개한 구어체 언어분석 기술은 크게 △형태소분석 기술과 △개체명 인식 기술 두 가지다.
형태소분석 기술은 한국어 의미의 최소 단위를 분석하는 기술로 한국어 처리에 필수적으로 활용된다.
개체명 인식 기술은 문장 내 고유 대상과 그 의미를 인식하는 기술로 AI스피커와 챗봇 등 다양한 언어처리 서비스에서 활용도가 높은 기술이다.
ETRI가 앞서 개발한 '엑소브레인(Exobrain)'은 현재'한컴오피스 2020'에 탑재되는 등 이미 상용화가 이뤄진 인공지능으로 △언어분석 기술 △딥러닝 언어모델 기술 △질의응답 기술 등이 적용됐다.
특히 언어분석 API는 2017년 10월 공개 이후 일 평균 2만6000건 등 총 2천600만 건에 이를 만큼 학계 및 언어처리 분야 연구자들에게 널리 사용되고 있다.
연구진은 구어체 언어분석 API와 더불어 기존 대비 성능을 개선한 문어체 언어분석 API도 추가로 공개했다. 추가 공개한 API는 형태소분석과 개체명 인식 기술이 각각 96.80%, 89.40%의 높은 정확도를 보였다.
ETRI 언어지능연구실 임준호 박사는"기존 엑소브레인 언어분석 기술이 백과사전 및 법령을 분석하기 위한 목적으로 개발됐음에도 구어체 분야에 많이 적용되고 있었다"며 "이번 구어체 언어분석 API 공개로 언어분석의 정확도 및 신뢰도를 제고해 국내 인공지능 시장이 더욱 활성화되길 기대한다"고 말했다.
한편 엑소브레인 사업단은 최근 3년간 기술이전 22건과 사업화 17건을 달성해 외산 인공지능 솔루션의 국내시장 잠식을 막는 동시에 응용 서비스의 폭을 넓히는 데 힘쓰고 있다. 추후 딥러닝 언어모델의 지속적인 성능 개선 및 추가 공개를 통해 AI 기술 고도화 및 플랫폼 개발에 기여할 계획이다.
memory4444444@newspim.com