[서울=뉴스핌] 김지완 기자 = 정부가 디지털 뉴딜 핵심사업 '데이터댐'에 한국어 기반 인공지능(AI) 발전을 위해 '한국어말뭉치' 데이터셋 구축에 전력을 기울일 예정이라고 밝혔다. 아울러 데이터댐을 클라우드 기반으로 구축, 사용자들이 머신러닝 등의 분석툴을 쉽게 쓸 수 있도록 하겠다는 복안이다.
14일 한국과학기술단체총연합회(과총), 한국과학기술한림원, 한국공학한림원, 대한민국의학한림원은 '한국판 뉴딜, 성공의 조건은?'을 주제로 온라인 공동포럼을 개최했다.
[서울=뉴스핌] 김지완 기자 = 14일 박수경 대통령비서실 과학기술보좌관이 한국과총 온라인포럼에서 '한국판 뉴딜, 성공의 조건은?'이란 주제로 발표하고 있다. [갈무리=김지완 기자] 2020.10.14 swiss2pac@newspim.com |
정부는 지난 7월 대한민국 대전환과 선도국가로의 도약을 위한 '한국판 뉴딜 종합계획'을 발표했다. 본 계획은 '디지털 뉴딜', '그린 뉴딜'을 두 축으로 2025년까지 총 160조원이 투입되는 대단위의 국가 프로젝트.
이날 포럼에선 박수경 대통령비서실 과학기술보좌관, 박영일 강원연구원장, 고진 한국모바일산업연합회장, 김상선 한국과학기술기획평가원장, 윤제용 한국환경정책·평가연구원장, 임태환 대한민국의학한림원 회장, 천병련 우정바이오 대표 등이 참석했다.
◆ "한국어 기반 AI, 경쟁력 확장성 가능...한국어말뭉치 구축에 전력"
디지털 뉴딜 핵심사업인 '데이터댐'에선, '한국어말뭉치' 데이터셋 구축이 핵심이라는 점을 천명했다. 챗봇이나 인공지능 비서가 한국어를 자연스럽게 알아듣고 분석해 말하려면 반드시 다양한 한국어 말뭉치로 학습해야 한다.
이날 주제 발표에 나선 박수경 대통령비서실 과학기술보좌관은 "데이터댐은 빅데이터와 인공지능을 통해 새로운 가치를 창출하는 것"이라며 "이를 위해 양질의 데이터를 모으고 활용할 필요가 있다"고 강조했다.
박 보좌관은 "우리나라가 AI 분야에선 미국·중국의 글로벌 경쟁력을 따라잡아야 하는 상황"이라면서 "특정 AI분야에서 경쟁력을 갖추기 위해선 해당 분야에 방대한 데이터를 확보해야 한다"고 했다. 이어 "여러 산업계, 연구계, 학계 관련자들을 만나 자문을 구한 결과, 향후 한국어 기반 음성·텍스트 AI가 대한민국이 전 세계에서 가장 큰 경쟁력과 확장성을 나타낼 수 있는 AI 분야로 꼽혔다"며 "이를 위해 한국어말뭉치 데이터셋 구축이 필요하다는 걸 알게 됐다"고 전했다.
그는 또 "K팝을 국제 사회에 알린다고 하더라도, K팝은 모두 한국어로 돼 있다"며 "이를 번역하거나 외국인들이 이해시키기 위해선 한국어 기반 음성·텍스트AI가 중요하다"고 부연했다.
데이터댐에 구축된 데이터셋은 모두 클라우드를 통해 제공될 것임을 시사했다.
박 보좌관은 "데이터가 많기 때문에 개인 PC에 다운로드하게 하는 것은 맞지 않다"며 "방대한 데이터를 부담없이 사용하게 하고, 머신러닝 등의 분석툴을 제공하기 위해 데이터댐 컴퓨팅 환경을 클라우드로 할 것"이라고 했다. 그는 이어 "공공·민간 데이터를 받아서, 분석 인프라 제공 플랫폼이 클라우드로 구축된다는 의미"라면서 "데이터 갖고 창업하는 분들에겐 큰 인프라가 갖춰지는 것"이라고 의미를 부여했다.
swiss2pac@newspim.com