제보
주요뉴스 산업

SKT 에이닷도 골머리…AI가 학습한 개인정보 어떻게 관리될까

기사등록 : 2023-11-01 15:55

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
SKT "통화요약 불법 아냐" VS 개보위 "검토해보겠다"
"AI 학습 사각지대에 개인정보 유출 위험 있어"

[서울=뉴스핌] 조수빈 기자 = SK텔레콤, KT에 이어 LG유플러스까지 인공지능(AI) 시장에 뛰어들면서 통신사 삼파전이 AI로 번지고 있다. 이 가운데 SK텔레콤의 통화요약 기능처럼 고객 데이터를 학습하는 AI에 대한 우려가 커지면서 AI 프라이버시 확보에 정부도 가세했다.

SK텔레콤은 인공지능(AI) 개인비서 서비스 에이닷의 아이폰 앱에서 'A. 전화'를 통해 통화녹음, 통화요약 등 새로운 기능을 제공한다. [사진=SK텔레콤]

AI 학습에 가장 문제가 되는 것은 개인정보다. AI는 학습을 위해 방대한 데이터를 수집한다. 그 안에는 개인정보나 민감한 기업정보도 포함되기에 AI가 학습하는 데이터에 대한 관리도 까다로운 과제로 남는다.

이통3사는 공통적으로 현행 법에서 지정하고 있는 비식별데이터만 모은다고 밝혔다. 2020년 정부의 데이터3법 시행 이후 데이터 활용을 위한 가명정보 개념이 도입됐다. 기업 입장에서는 가명처리 된 데이터를 활용할 수 있는 법적 근거가 마련된 셈이다. 통신업계 관계자는 "이름, 나이 등 특정할 수 있는 데이터를 비식별화해서 사용한다"며 "비식별정보로도 충분히 AI 학습이 가능하다"고 설명했다.

SK텔레콤이 출시한 AI 개인비서 서비스 에이닷이 구설수에 오른 것도 개인정보 때문이다. 에이닷이 지난 10월 출시한 AI 전화 서비스는 아이폰에서도 통화녹음, 통화요약 기능을 지원한다. 아이폰이 정책상 금지한 통화녹음을 자사 기술력으로 우회해 구현한 서비스다.

SK텔레콤은 이용약관에 통화 녹음 파일과 통화 내용 속 전화번호, 일정, 계좌번호 등 정보는 1년 동안 이용자 단말기에 보관된다고 밝혔다. 통화요약을 위해서는 통화 내용이 SK텔레콤의 서버로 전송되는데 텍스트로 변환되는 즉시 자동 파기된다.

논란이 된 것은 주소, 일정 등과 개인을 특정할 수 있는 통화내용이 제3자인 SK텔레콤의 서버에 잠깐이라도 머문다는 사실이다. 현재 통화녹음 동의를 얻은 것은 SK텔레콤 이용자이며 상대방이 SK텔레콤 가입자가 아니고 에이닷 사용자가 아닐 경우 동의없이 통화 내 개인정보가 학습된다는 것이 개인정보 침해의 소지가 있다는 지적이다.

개인정보보호위원회 관계자는 "아직까지 조사에 착수한 단계는 아니며 제기된 문제에 대해 검토하는 단계"라며 "에이닷의 통화요약처럼 SK텔레콤 서버에 정보가 올라갈 경우 개인정보보호법상 개인정보 처리에 해당하기 때문에 문제가 불거진 것"이라고 부연했다.

SK텔레콤은 통화내용이 텍스트로 전환되는 즉시 서버에서 삭제된다고 반박했고 개보위 측은 이 내용이 실효성 있는 주장인지 면밀히 살피겠단 입장이다. 개보위에 따르면 통화녹음과 관련된 유사한 사례로 개인정보보호법 위반이 된 사례는 아직 없다.

지난 30일 서울 대한상공회의소에서 열린 AI 프라이버시 민·관 정책협의회 출범식에 고학수 개인정보보호위원회 위원장(왼쪽)이 위촉장을 전달하고 있다. [사진=조수빈 기자]

◆AI 학습 과정은 아직 '사각지대'…보안에 힘주는 기업들

전문가들은 아직까진 AI의 학습 알고리즘을 운영자도 정확히 파악하기 힘들다는 것이 한계점이라고 지적한다. 블랙박스는 인공지능에선 원하는대로 결과값을 도출할 순 있지만 무엇을 어떻게 학습해서 나온 결과인지 알 수 없는 상황을 일컫는다. 개발단계에서 발생하는 일종의 사각지대다.

김명주 서울여대 정보보호학과 교수는 "한 회사가 보유한 같은 서버 내에서 학습된 데이터는 사용자나 관리자가 모르는 사이 AI가 사전에 학습한 내용을 다른 서비스에 사용할 가능성도 있다"며 "학습 시킨 내부 영역들이 어떻게 다른 서비스와 융합이 되는지는 현 기술로는 파악하기 힘들다. 그렇기에 개인정보 관리에 대한 사각지대가 존재하는 것"이라고 설명했다.

이에 프라이빗 대규모언어모델(LLM), 온프레미스 등 별도의 서버를 구축하는 형식이 각광받고 있다. 김 교수는 "내부 데이터만 활용하기 때문에 검증 데이터만 활용해 할루시네이션(환각 현상)도 적다"며 "다만 비용과 인력이 많이 드는 것이 문제"라고 설명했다. LG유플러스와 KT 등 기업 간 거래(B2B) 시장을 겨냥한 기업들이 서버를 직접 구축해주는 온프레미스, 프라이빗 서버 방식을 채택하며 비용 절감을 강조하는 것도 시장의 니즈에 맞춘 것이다.

기업 역시 AI 학습이 갖고 있는 사각지대에 대해 인지하고 있다. 최준기 KT AI·빅데이터 본부장은 지난 10월 31일 열린 초거대 AI 믿음 공개 기자간담회에서 AI 학습의 편향성을 극복하기 위한 노력에 대해 "이것(LLM)이 블랙박스인 게 맞고, 99.9% 노력을 했지만 마지막 0.1%에서 저희가 생각지도 못한 이탈을 할 수가 있다"며 "대화에 있어서 사회적으로 용납이 가능한 AI를 위해 노력 중"이라고 강조했다.

정부에서도 개인정보 유출 차단 등 신뢰 가능한 AI 개발에 힘을 주고 있다. 30일 개인정보보호위원회는 고학수 개보위 위원장, 배경훈 LG AI연구원장을 공동의장으로 하는 AI 프라이버시 민·관 정책협의회 출범식을 개최했다. 해당 협의회에는 SK텔레콤, KT, LG 등 이통사도 포함돼 있다. 기업이 AI 사업을 전개하기 이전 법 위반 여부를 우려하는 경우 개보위가 사전 협의에 참여하는 사전적정성 검토제가 언급되기도 했다.

이날 고 위원장은 "데이터 처리의 회색지대(Gray Area)를 악용하거나 프라이버시를 도외시하는 AI 서비스가 국민 권익을 침해하는 일이 발생하면 해당 기업은 물론 국가 전체의 AI 혁신 동력을 해칠 수 있다"며 "AI 모델을 개발하거나 서비스 기획 단계부터 기업이 스스로 개인정보 침해 위험성을 관리하는 문화가 정착될 수 있도록 정부와 기업이 함께 노력해 나가야 한다"고 강조했다.

한편 이통3사는 하반기에 자사의 특성을 살린 생성형 AI를 공개하면서 생성형 AI 시장 진입에 대한 의지를 보였다. SK텔레콤이 가장 먼저 지난 9월 한국어 LLM 서비스인 에이닷(A.)을 정식 출시했다. 에이닷은 SK텔레콤의 AI 컴퍼니 전환의 핵심 서비스로 출시 이후 한 달만에 '아이폰 통화녹음' 기능을 공개하며 많은 관심을 받았다.

이어 지난달 29일 LG유플러스가 자사가 보유한 통신, 플랫폼 데이터와 AI 기술 역량을 통합한 통신 전용 생성형 AI '익시젠'을 개발한다고 밝혔다. 그룹사인 LG가 이미 초거대 범용 AI인 '엑사원'을 보유하고 있어 별도로 AI 개발을 고려하지 않는다는 입장을 유지하던 LG유플러스가 '통신 맞춤형'으로 전략을 달리하는 모습이다. 마지막으로 KT도 31일 초거대 AI 믿음을 출시하며 B2B 시장 개척을 위한 초거대 AI 개발에 이어 B2C 영역 진출까지 역량을 강화하겠다고 밝혔다. 

beans@newspim.com

<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>