이세돌과 알파고, 세기의 대결이 임박했다
2016년 1월 27일 과학저널 ‘네이처’는 구글 딥마인드가 개발한 인공지능 ‘알파고(AlphaGo)’가 지난해 10월 판 후이(유럽 바둑 챔피언이자 중국 프로 바둑기사)와 벌인 공식 대결에서 5번 모두 이겼다는 소식을 표지논문을 통해 소개했다.
바로 전날, 페이스북 창업자 마크 주커버그는 페이스북에 포스트를 하나 올렸다.
“지난 20년간 과학자들은 컴퓨터에게 바둑을가르치려고 노력해 왔습니다. 이제 완성 단계에 가까워졌습니다. 지난 6개월간 우리는 0.1초 이내에 바둑돌을 놓을 만큼 빠르게 대응할 수 있는 인공지능을 만들어냈습니다.”
마크 주커버그가 페이스북에 그 포스팅을 하고 10시간 후 구글이 폭탄같은 발표을 한다: 자회사 딥마인드가 개발한 바둑 프로그램이 다른 모든 바둑 프로그램을 이길 뿐 아니라 역사상 처음로 프로 바둑 기사를(!) 이겼다.
영국의 가디언지는 ‘ 마크 주크버그가 딥마인드의 성과에 김을 빼려고 했으나 뜻대로 되지 않았다’ 고 비아냥됐다. 구글이 바둑 프로그램에 대한 중요한 발표를 27일에 하겠다고 25일에 예고한 바로 다음날 페이스북이 급히 바둑 프로그램에 대한 발표를 내면서 구글의 발표에 초를 치려고 했으나 구글의 알파고가 프로 바둑 기사를 이겼다는 역대급 뉴스로 페이스북 창업자 마크 주커버그를 무색하게 했다는 취지의 기사다.
이로부터 약 2년 전…
2014년 3월 21일, 인공 지능과 프로 바둑기사의 대결 전성전(電聖戦) 2회 대회가 일본 도쿄전기통신대학에서 열렸다. 요다는 인공지능 대표인 젠(Zenㆍ일본) 그리고 크레이지스톤(Crazy stoneㆍ프랑스)에게 넉점을 깔게 하고 대국했다. 요다는 젠을 불계로 이겼지만 크레이지스톤에 3집패했다.
크레이지스톤은 프랑스의 컴퓨터 과학자 RÉMI COULOM이 십수 년에 걸쳐 개발한 바둑 프로그램이다. 2014년 최초로 프로바둑기사에게 승리를 거두었지만, 이는 넉 점을 먼저 깔고 하였기 때문에 가능한 것이었다. 전성전 후 요다는 이 프로그램이 수년 내에 프로 수준이 되기는 어려울 것 같다고 말했고, 젠 개발팀 대표 가토 히데키(加藤英樹) 씨는 “지금부터가 어렵다. 눈에 띄게 강해지려면 10년 단위의 연구가 필요하다.”며 “장기 분야에서는 소프트웨어들이 프로 레벨이지만, 바둑은 아직 도달하지 못했다.”고 말했다.
바둑, 컴퓨터 게임의 최종 영역
그동안 바둑은 인공지능에게 가장 어려운 도전 중 하나였다. 체스의 경우 이미 1997년 IBM의 인공지능 체스 컴퓨터 ‘딥 블루’가 체스 세계 챔피언 가리 카스파로프를 이겼지만, 바둑은 지난 30년간의 노력에도 아마추어 수준에 머물러 있었다.
바둑의 규칙은 심플하지만 바둑돌을 놓을 수 있는 경우의 수는 무려 10의 170제곱이나 된다. 즉, 1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000 가지 경우의 수.
구글의 블로그를 인용하면 이는 “전 우주의 모든 원자 수보다 많고 체스보다 구골배 더 많은 경우의 수”다 . 때문에 프로 바둑 기사는 계산보다는 직관에 따라 바둑을 두는 것처럼 보인다.
* 구골 1 googol = 10100 = 10,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000
구글 딥마인드 연구팀은 알파고를 기존 인공지능 게임 프로그램과는 다른 방식으로 설계했다. 딥 블루의 경우 체스에서 승리하는 전략을 사용하도록 프로그래밍이 돼 있는 반면, 알파고는 바둑을 두도록 프로그래밍 돼 있지 않다. 인간의 직관에 가까운 기능을 수행하려면, 스스로 학습하는 프로그램이 필요했다. 구글의 알파고는 구글이 그동안 착실하게 진전시켜온 스스로 학습하는 인공 지능 개발이 어디까지 와 있나를 보여준다.
미국의 테크 저널 ‘와이어드‘지에 따르면 구글의 발표 2일 전 기자들은 발표 내용을 엠바고와 함께 미리 제공받았고 페이스북 역시 이를 알았다고 한다. 이 기사에 따르면 구글과 인공지능 개발을 두고 경쟁하고 있는 페이스북이 다급하게 구글 발표 직전에 자사의 바둑 프로그램에 대한 논문을 게재하고 주커버그가 직접 포스팅까지 한 이유가 있다.
뛰어난 인공지능 개발자는 많지 않고 그들을 구글에 뺏기지 않고 자사로 영입하기 위해서는 페이스북이 이 연구에 얼마나 진지한지를 보여줄 필요가 있었다는 것. 주크버그의 페이스북 포스팅에서 “이 바둑 프로그램을 개발한 Tian Yuandong은 내 바로 옆에 있다. AI 팀이 바로 내 옆에 있어서 나는 너무 기쁘고” 어쩌고 한 것은 AI 개발자들에게 어필하기 위한 것이고, 바둑 프로그램에 대한 페이스북의 신경전은 사실 AI 개발에서 뒤처지지 않기 위해 개발자 확보를 위한 신경전이라는 해설.
딥 마인드
알파고는 구글이 2014년 5천억에 인수한 딥마인드의 작품이다. 딥마인드는 컴퓨터가 스스로 학습하는 딥러닝을 이용하여 스페이스 인베이더, 퐁,팩맨 등의 오락실 게임을 플레이하는 프로그램을 선보였고 이 프로그램은 스스로 학습하여 인간 프로게이머의 수준에 도달했다.
인간 뇌의 정보처리 방식을 기계에 도입한 인공 신경망 회로를 발전시킨 딥러닝 기술은 놀랍도록 효과적으로 이미지를 찾아주는 구글의 이미지 검색, 페이스북의 안면 인식 기술, 마이크로소프트의 스카이프에 장착된 자동 번역 등에 이용되고 있다. 수백만 개의 게임 무브를 인공 신경망에 입력하는 것은 컴퓨터가 게임을 하도록 가르치는 역할을 하고 이것이 가능하다면, 엄청난 양의 데이터가 필요하겠지만, 게임뿐 아니라 다른 작업을 수행하도록 가르칠 수도 있다.
여기에 리인포스먼트 러닝이 더해진다. 일단 신경망이 게임을 플레이하는 데 익숙해졌다. 이 프로그램은 스스로 대결을 벌인다. 두 버전의 신경망이 수천, 수만 번의 게임을 서로 플레이하면서 가장 효과적인 무브, 가장 높은 점수를 획득하는 움직임을 습득한다. 이런 기술은 게임에만 국한된 것이 아니다. 게임과 유사한 모든 전략, 경쟁에도 적용될 수 있다.
알파고는 이 모든 것을 이용하고 한 걸음 더 나아갔다. 딥마인드의 하사비스는 ‘딥 리인포스먼트 러닝’이라는 기술을 도입했다고 밝혔는데, 이는 한 번의 움직임이 가져올 장기적인 효과를 예측하는 것이라고 한다.
인간의 마지막 발명품?
구글과 페이스북뿐 아니라 마이크로소프트, 트위터, 엘론 머스크, 그리고 다른 많은 회사들이 인간의 지능을 뛰어넘는 인공 지능 개발을 추진하고 있다.
닉 보스트롬은 그의 저서 Superintelligence에서 인공지능은 원자폭탄보다 위험할 수 있는데 이는 인간이 악용할 수 있는 가능성 때문이라기 보다, 인간이 전혀 통제할 수 없을 가능성 때문이라고 했다. 테드 연설에서도 이를 경고한 바 있다. 기계가 인류보다 똑똑해진 후 인간의 컨트롤을 완전히 벗어날 경우를 대비하여 기계의 가치체계, 동기부여 시스템이 인간이 올바르다고 생각하는 것과 일치하도록 설계해야 한다고 주장한다.
하지만 AI와 관련하여 경고가 계속 나오는 이유는 이런 연구가 계속 진행되면서 어느 순간 이런 경고가 현실화되는 경계선을 돌파할지도 모른다는 것이다. 바둑 프로그램에 사용된 이런 종류의 인공지능은 게임으로 치환할 수 있는 거의 모든 문제에 적용될 수 있다. 기본적으로 전략이 필요한 모든 상황 말이다. 주식거래와 전쟁도 이에 포함된다. 바둑보다 더 많은 데이터와 더 많은 작업이 필요하겠지만 기본적으로 이런 것에 활용하는 것이 가능하다.
아직은 희박한 가능성에 불과함에도, ‘알파고’와 이세돌의 게임을 앞두고 이런 류의 염려가 나오는 것은 ‘알파고’가 그만큼 파급력이 크기 때문이다. 단순한 게임 프로그램이 아니라 진정한 인공지능의 서막이라고.
원문: Contenta M
글: 류정화