[편집자주] 딥러닝(Deep Learning)으로 무장한 구글 '알파고'가 이세돌 9단을 누르며 인공지능(AI) 시대의 도래를 알린 지 3년 반이 지났습니다. 알파고 쇼크에 우리 기업과 대학은 앞다퉈 인공지능 투자를 선언했지요. 하지만 국내 법체계는 기업들이 개인정보를 활용하는 것을 제한하고 있습니다. 법 규제에 막혀 야심차게 닻을 올린 인공지능 연구가 속속 중단되고, 인재는 해외로 떠나고 있습니다. 정부와 국회가 뒤늦게 데이터 3법 개정을 추진중이지만 법안이 1년 째 국회서 낮잠을 자고 있습니다. 국가경쟁력을 갉아먹고 있는 이 답답한 현실을 종합뉴스통신 뉴스핌이 30회 이상 '빅시리즈'로 꼼꼼하게 짚어봅니다.
# 2016년 11월 18일 EBS가 주최한 장학퀴즈에 한국전자통신연구원(ETRI)가 개발한 엑소브레인(Exo-brain)이 출전했다. 2013년 미국 퀴즈왕을 이긴 IBM 왓슨을 롤모델로 제작됐는데 왓슨과 달리 딥러닝과 머신러닝 기술을 장착, 진일보 했다는 평가를 받았다. 엑소브레인은 12만권의 책을 독파한 뒤 수능만점자, 퀴즈대회 상하반기 우승자 등 4명의 인간 경쟁자를 모두 누르고 우승했다.
이후 ETRI는 엑소브레인에게 의료 빅데이터를 학습시켜 질병 진단에 도움을 주는 서비스 개발을 검토했으나 중단했다. 표면적인 이유는 의료 기록이 대부분 영상 데이터이기 때문에 텍스트 기반의 엑소브레인으로서는 도전이 쉽지 않다는 것.
하지만 개인정보인 의료데이터에 접근할 수 없었던 것이 포기의 가장 큰 이유라는 후문이다. KAIST 인공지능연구센터 관계자는 "엑소브레인 프로젝트는 현재 개인정보와 무관한 법률 정보 인공지능 서비스를 연구 중"이라고 설명했다.
에릭 슈미트 구글 지주회사 알파벳 회장(오른쪽)과 이세돌 프로바둑 기사(가운데), 데니스 하사비스 구글 딥마인드 CEO가 2016년 3월 8일 서울 종로구 포시즌스호텔 서울에서 열린 '구글 딥마인드 챌린지 매치 프레스 브리핑'에 참석해 포즈를 취하고 있다.<사진=이형석 기자> |
◆ 기울어진 운동장..빅데이터 없어 절절매는 국내 AI 기업들
반 세기 넘게 공상과학의 영역이던 인공지능(AI)이 최근 들어 우리 실생활에 폭넓게 활용되기 시작했다. 가깝게는 구글의 유튜브를 꼽을 수 있다. 구글은 인공지능을 활용해 이용자 개개인의 입맛에 맞는 영상을 계속 추천한다. '왜 이 영상을 나에게 추천했지'라는 질문을 던져도 이제 구글 직원이 답해 줄 수 없다. 유튜브가 딥러닝을 통해 스스로 최적의 추천 알고리즘을 찾아냈기 때문이다.
유튜브가 내 입맛에 꼭 맞는 영상을 추천할 수 있는 것은 구글의 인공지능 기술력 때문이지만 구글이 수집한 광범위한 개인정보의 영향이 지대하다. 국내 기업과 수집 데이터에서부터 차이가 크다.
정보기술(IT)업계에 따르면 네이버와 카카오 등 국내 인터넷기업들이 회원 가입을 통해 수집하는 개인정보 항목은 각각 12개와 18개. 반면 구글은 최대 57개 개인정보 항목을 수집한다. 페이스북도 사진 촬영 장소, 스마트폰 주소록, 이용자 위치 정보 등 개인정보 51개 항목을 수집한다.
[상하이 로이터=뉴스핌] 전솔희 인턴기자 = 일론 머스크 테슬라 최고경영자(우)와 마윈(馬雲) 전 알리바바그룹 회장이 지난 8월 29일(현지시간) 중국 상하이(上海)에서 열린 세계 인공지능 회의(WAIC)에 참석했다. 2019.08.28. |
우리 기업들이 개인정보 수집에 미온적인 이유는 정보통신법, 개인정보보호법 등 상대적으로 엄격한 국내법 때문이다. 반면 글로벌 기업들은 해외에 서버가 있기 때문에 국내 규제를 피해간다. 전 세계가 인터넷으로 연결된 평등한 세상 같아 보이지만 AI를 준비하는 기업들 입장에선 '기울어진 운동장'인 것이다.
본인이 얼마나 많은 정보를 구글에게 주고 있는지 알고 싶다면 스마트폰에서 구글 사이트에 로그인 하면 된다. '데이터 및 맞춤설정 관리'를 보면 나의 위치 정보는 물론이고 음성 및 오디오 녹음, 웹 검색 기록이 모두 구글에 넘어간다. 또 유튜브에서 무엇을 검색했는지 어떤 영상을 봤는지도 고스란히 구글이 캐치하고 있다.
국내법은 개인정보를 최소한으로 수집할 것을 명시하고 있다. 한 술 더 떠 방송통신위원회는 '온라인 개인정보 처리 가이드라인'을 국내 업체들에게 적용하고 있는데 이 가이드라인은 서비스의 본질적 기능과 무관한 정보수집(연락처 등)은 일일이 이용자 동의를 받도록 하고 있다.
게다가 현행 개인정보보호법에 따르면 이미 수집한 개인정보라도 처리 목적이 달라지면, 즉 신규서비스에 적용하기 위해서는 다시 명시적 동의를 받아야 한다. 데이터 기업 입장에서는 옴짝달싹 하기 힘든 구조다.
우리가 이처럼 사전 동의를 원칙으로 하는 '옵트인(opt-in)' 방식을 취하는데 반해 미국과 유럽, 일본은 경우 포괄 동의와 사후 처리 거부가 기본인 '옵트아웃(opt-out)'방식이다. 유럽연합(EU)의 경우 민감정보, 쿠키, 위치 데이터를 제외한 그 밖의 데이터를 수집·이용·제한할 때 반드시 정보주체 동의가 필요하지 않다. 일본도 강력한 사후 규제를 전제로 익명가공 정보에 대해서는 적극 활용할 수 있도록 길을 터놨다.
◆ 산업계 '윈윈' 설득에도 시민단체 강경 대응…데이터 공유 '스톱'
국내 기업의 데이터 활용 저하 문제를 정부도 손 놓고 있지만은 않았다. 2016년 정부는 '개인정보 비식별조치 가이드라인'을 발표해 기업이 보유한 고객 정보를 한국인터넷진흥원 등 전문기관에 넘겨 다른 기업이 보유한 정보와 결합할 수 있도록 길을 열었다. 이에 통신3사를 비롯한 20개 기업은 한국인터넷진흥원, 신용정보원 등 비식별조치 전문기관을 통해 3억4000만 건에 달하는 개인정보를 가공 의뢰했다.
[서울=뉴스핌] 정일구 기자 = 7월 17일 서울 강남구 코엑스에서 열린 '2019 국제인공지능대전'에 참가한 관람객들이 전시장을 둘러보고 있다. 2019.07.17 mironj19@newspim.com |
예컨대 SK텔레콤이 보유한 통신료 납입 정보, 단말기 정보 등과 한화생명이 보유한 추정소득금액, 추정 주택 가격, 보험 가입 건수 등을 결합해 여러 기업이 공유하려 했다. 그러나 2017년 11월 시민단체들이 이 기업들을 개인정보보호법 위반으로 고발했다. 검찰이 무혐의 처리했으나 홍역을 치른 기업들은 발을 뺀 상태다. 국회 정무위원회 관계자는 "데이터 활용에 대해 시민단체가 고발을 한 이후 해당 가이드라인은 사실상 사문화된 상황"이라고 말했다.
기업의 빅데이터 결합 활용을 두고 이처럼 시민단체가 반대하는데는 정보 유출에 대한 불안감이 깊게 자리잡고 있다. 또 개인의 고유자산이라 할 수 있는 개인정보를 왜 기업에게 무료 또는 헐값에 넘겨주는가에 대한 불만도 크다. 기업 좋은 일에 국가가 구태여 빗장을 풀어 소비자의 효용을 저해한다는 지적도 상당하다.
[서울=뉴스핌] 최상수 기자 = 조국 당시 법무부 장관이 지난 9월 26일 서울 여의도 국회에서 열린 본회의 대정부질문에서 인사말을 하는 가운데 자유한국당 의원들이 등을 돌리고 있다. 2019.09.26 kilroy023@newspim.com |
반면 산업계는 빅데이터 활용이 기업과 소비자 모두에게 '윈윈'이라는 점을 강조한다. 예컨대 통신료 납부정보와 금융정보를 결합하면, 통신료를 성실하게 납부한 이용자의 신용등급을 상향해 줄 수 있다. AIA생명이 SK텔레콤과 손 잡고 출시한 'AIA 바이탈리티 X T건강걷기' 서비스도 빅데이터 활용의 좋은 예다. AIA앱이 걷기 목표를 제시하고 사용자가 이를 달성하면 보험료와 통신요금을 할인해 주는 서비스다.
AIA생명 관계자는 "보험사의 서비스라는 게 병이 발발하면 보험금을 지급하는 것이 전부였지만 이제는 사용자 스스로가 건강한 생활 습관을 갖도록 유도한다는 점에서 차별성이 있다"고 설명했다. 보험사는 고객들이 건강해짐에 따라 보험금 지급 확률이 낮아져 보다 탄탄한 재무안정성을 확보할 수 있다.
◆ 김범수 "필요한 인재 30% 뿐..국내에 남지 않는다" 하소연
"카카오브레인의 대표를 하면서 카카오의 비전과 대한민국의 미래를 위해 필요한 인재를 모았는데, 30% 밖에 확보하지 못했다. 이들은 국내에 남지 않는 이유를 데이터의 수집과 활용이 어려운 구조라고 꼽았다"
지난해 10월 국회 과학기술정보방송통신위원회 국정감사에서 김범수 카카오 의장이 한 말이다. 김 의장은 이어 "AI기술은 데이터를 활용하는 경험이 많을수록 발전할 수 밖에 없다"면서 "골든타임을 놓치면 과학기술의 미래는 어둡다"고 강조했다.
문재인 정부도 문제점을 인지하고 인식의 변화를 보이고 있다. 지난해 8월 문 대통령은 '데이터 경제'를 선언하며 "데이터 고속도로를 구축하겠다"라고 천명했다. 더불어민주당은 그해 11월 '데이터3법(개인정보보호법·정보통신망법·신용정보법) 개정'을 당론으로 채택하고 국회 통과를 추진 중이다.
개정안은 유럽연합이 개인정보보호규정(GDPR)을 통해 적용한 가명정보 개념을 적극 도입했다. 즉 개인정보를 가명정보 또는 익명정보로 전환해 공익영역과 상업적 목적을 포함한 과학적 목적 등에 이용자 동의 없이 활용할 수 있도록 열어주자는 것이다.
하지만 '조국 블랙홀'이 국회를 두 달 이상 집어삼키면서 허송세월을 보냈다. 여야 별다른 이견이 없는데도 불구하고 향후 전망도 녹록치 않다. 데이터 3법이 다양한 분야에 걸쳐 있는데다 개인정보라는 민감한 내용을 다루고 있기 때문이다. 3개 상임위가 서로 눈치만 보고 있다.
한국핀테크산업협회 관계자는 "데이터 3법 개정이 안되다 보니 스타트업들은 출발을 못하는 등 애로가 크다"며 "대기업과 달리 스타트업은 한 달이고 두 달이고 버틸 수 있는게 아니고 중간에 수익 안 나오면 투자 못 받고 접어야 한다"고 우려했다.
김선엽 기자 sunup@newspim.com