제보
주요뉴스 newspim

[일문일답] 구글 부사장 "이세돌 9단에 대한 정보, 미리 학습 안 해"

기사등록 : 2016-01-28 18:52

※ 뉴스 공유하기

URL 복사완료

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게
"3월 세기의 바둑 대결, 기대 크다"

[뉴스핌=이수경 기자] 컴퓨터가 세계 정상의 바둑 기사와 세기의 대결을 펼친다. 인간의 시간으로 따지면 1000년의 세월 동안 수백만 번 바둑만 연습한 '알파고'가 이세돌 9단에게 도전장을 내던진 것.

구글코리아는 28일 서울 구글코리아에서 인공지능 프로그램 '알파고'를 소개하는 미디어 간담회를 개최했다. 알파고는 구글이 2014년 인수한 인공지능 기업 딥마인드가 개발했다.

데미스 하사비스 구글 딥마인드 엔지니어링 부사장은 "한국에서 우리 기술에 큰 관심을 보여서 기쁘다"며 "3월 중순에 열릴 이세돌 9단과의 대국에 참석하기 위해 한국에 갈 예정으로 우리의 도전을 받아줘서 진심으로 감사하다"고 밝혔다.

28일 오후 서울 강남구 구글코리아에서 구글 딥마인드 '알파고(AlphaGo) 프레스 브리핑'이 열리고 있다. <사진=이형석 사진기자>

다음은 데미스 하사비스 구글 딥마인드 엔지니어링 부사장과 데이비드 실버 리서치 사이언티스트와의 일문일답이다. 

- 왜 게임에 인공지능 기술을 도입했는가?

▲ 게임은 인공지능 알고리즘을 연구하기 좋은 분야다. 궁극적으로 이 기법을 가지고 현실 세계의 문제를 해결해보고자 한다. 우리가 사용하는 방법은 범용적이다. 우리 사회가 직면하고 있는 심각하고 힘든 문제를 해결하고자 한다. 기후 모델링, 의학 진단 등 스마트 시스템 쪽에서의 응용을 기대해볼 수 있다. 

- 바둑이 현실 문제를 해결하는 데 무슨 연관관계가 있는가?

▲ 기본적으로 바둑에서 이기기 위해서는 기능과 역량이 필요하다. 바둑판이라는 형상을 인식하고, 강화 학습을 바탕으로 더 잘 바둑을 둘 수 있도록 학습해야 한다. 알파고에 적용된 알고리즘은 범용적이다. 어떤 데이터도 학습할 수 있다는 것이 특징이다. 우리의 목표는 바둑 전용 알고리즘이 아니라 범용 알고리즘을 만드는 것이다. 

예를 들어, 유럽 여행을 계획하고 있다고 보자. 스마트폰에서 숙박 일정을 예약한다면 2가지 기능이 필요하다. 알고리즘이 사용자의 선호도를 기억해야 한다. 박물관을 좋아하는지, 맛집 여행을 좋아하는지 그러한 형상을 인식할 수 있어야 한다. 또한, 단순히 항공편을 예약하는 것이 아니라 정해진 시간을 가장 유익하게 볼 수 있도록 체계적으로 일정을 짤 수 있도록 해야 한다. 이와 같은 문제를 해결하는 데 이 범용 알고리즘이 사용될 수 있을 것이다.

- IBM의 '딥블루'와 '왓슨', 딥마인드 '알파고'의 구체적인 차이점은?

▲ 1997년 딥블루의 체스 대국, 제퍼디 퀴즈쇼에 출연한 '왓슨'과 비교해보고자 한다. 딥블루의 체스 경기는 훌륭한 대국이었다. 모든 경우의 수를 미리 집어놓았고, 체스 거장들이 필요로 하는 정보를 사전에 입력해서 딥블루가 대국에 임했다. 우리 시스템은 계속해서 다른 사람들과 경기하면서 학습한다는 것이 차이점이다. 

탐색하는 경우의 수에도 차이가 있다는 것도 말해볼 수 있다. 바둑과 체스는 검색량 자체도 크게 차이가 있다. '왓슨'은 사례들을 모두 데이터베이스에 입력했다. 질문이 나왔을 때 특정 주제에 한해서만 답을 찾을 수 있는 구조다. 알파고는 기본적인 데이터를 필요로 하지만 학습을 하면서 다음을 예측한다는 것이 큰 차이점이다.

- 빅데이터가 없어도 학습 효과를 낼 수 있나?

▲ 기계학습이 효과를 내기 위해서는 일정 수준 이상의 데이터가 필요하다. 그래서 우리는 전문가들의 게임을 공부하고, 게임을 직접 하는 과정에서 학습할 수 있도록 한다. 전문가들의 게임 정보 없이도 강화 학습을 통해 기계 자체가 자가 학습을 하고 승률을 더 높일 수 있다고 생각한다. 어떤 사례에서는 사전에 입력된 데이터 없이도 강화학습을 통해 지식을 습득할 수 있다.

여기에 첨언하자면, 실질적으로 데이터가 어느 정도 있어야 한다. 수백만 정도의 연습경기를 하면서 발전할 것이다. 물론 인간의 학습 효율성이 더 높다. 인간은 한 사례만 가지고도 본인이 가진 다른 지식을 가지고 와서 쉽게 배운다. 기계는 인간만큼 효율적이지 못하다.

- 이세돌 9단의 바둑 전략을 학습한 상태에서 대국에 임하게 되는가?

▲ 특정 바둑 기사에 대한 정보를 바탕으로 해서 알고리즘이 작용하는 것은 아니다. 이세돌 9단은 정말 훌륭한 선수이기는 하지만 특정 선수에 대한 정보를 학습하지는 않는다. 범용적인 바둑 전략을 학습한다. 

- 구글이 개발하고 있는 자율주행 자동차와 어떻게 연계될 수 있는가?

▲ 자율주행 시스템은 주행과 제어에 필요한 경우의 수가 다 들어가 있을 수 있다. 사실 '자율주행'이라는 단일 목적만 실행한다는 점에서 우리 시스템과는 조금 차이가 있을 수 있다.

28일 오후 서울 강남구 구글코리아에서 구글 딥마인드 '알파고(AlphaGo) 프레스 브리핑'이 열리고 있다. <사진=이형석 사진기자>

- 알파고 이름의 기원은?

알파라는 단어는 '최고', '리더’라는 의미를 가지고 있다. 구글의 모회사가 '구글알파벳'이기도 해서 여기에서 아이디어를 연상해냈다.

- 알파고는 바둑판을 어떤 방식으로 인지하는지?

▲ 사람이 대신해서 수를 둔다. 바둑판 위에서 돌을 두고 표준화된 인터페이스를 통해 그 수에 대한 정보를 알파고에게 전달한다. 이 인터페이스를 바탕으로 각 수 정보를 알파고에게 전달한다. 

- 수를 한 번 두는 데 시간이 얼마나 걸리는가?

▲ 우리가 어떻게 설정하느냐에 따라 다르다. 0.1초로 둘 수 있고 10분으로 둘 수 있다. 네이처지에 소개된 대국에서는 한 경기당 1시간의 제한시간이 있었고, 우리는 생각하는 시간에 3초를 썼다. 

- 바둑을 두는 실력을 결정하는 기준은?

▲ 바둑은 1:1 토너먼트 방식이다. 각각의 대진을 바탕으로 선수들의 능력을 평가하는 데 굉장히 좋다고 생각한다. 심층적으로 평가하고 있다. 

- 알파고의 승률은?

▲ 알파고가 다른 프로그램과 500개의 경기를 치르게 되면서 어느 시스템이 가장 우수한가 평가할 수 있게 됐다. 이렇게 직접 대국을 다 치른 결과 99% 승률을 기록했다. 우리 시스템이 최고라고 평가할 수 있게 됐다.

- 알파고가 바둑을 학습하는 데 하루 몇 시간을 투자했는가?

▲ 알파고가 4주 동안 쉬지 않고 모든 수를 공부했다. 그사이 백만 번의 경기를 뒀다. 보통 바둑 기사가 1년에 천 번의 경기를 치른다고 한다면, 알파고는 1000년이라는 경험을 바탕으로 학습했다고 보면 된다. 

- 3월 경기에서 바라는 점은?

▲ 알파고의 바둑 스타일에 대해서는 프로 기사의 평가를 한번 들어보면 좋을 거 같아서 3월이 상당히 기대된다. 이세돌 9단은 세계 최고 바둑 기사이기 때문에 어떤 평가를 받을 수 있을지 우리도 궁금하다. 

- 이세돌 9단과의 경기에 진다면 다시 재도전할 계획인가? 만약에 이긴다면 다음 상대는?

▲ 만약 알파고가 진다면 재도전을 분명히 고민할 것이다. 하지만 이에 대한 세부적인 내용은 첫번째 대국을 치르고 나서 정하고자 한다. 우선은 대국에서 이기는 것이 목표다. 만일 대국에서 이긴다면 경기를 분석한 뒤 세계바둑협회를 통해 선수를 추천받을 수도 있겠지만 다 향후 계획일 뿐이다. 일단은 3월 대국에만 집중하고자 한다. 

- 누가 이길 것이라고 보는가?

매우 자신있기는 하지만, 50:50의 확률이라고 본다.

 

 

[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)

<저작권자© 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지>