구글 번역 최고 담당자인 마이클 슈스터가 자동 번역기가 좋아지더라도 특정 문화를 이해하기 위해 특정 언어를 익히는 것은 여전히 중요하다고 했다고 한다. 그리고 완벽한 번역기는 나오지 않을 수도 있다고도 얘기했다 한다.
슈스터의 말뜻을 조선비즈에서 어느 정도 제대로 이해하고 글로 잘 옮겼는지 나는 잘 모르겠다. 게다가 슈스터가 평소에 어떻게 얘기했는지를 몰라서 이번 얘기의 진의를 더욱 가늠하기 어렵다. 아무튼 슈스터 또는 조선비즈가 놓치고 있거나 얘기하지 않은 부분은 보통 사람들이 학습, 그러니까 공부를 별로 좋아하지 않는다는 점이다.
기사에 따르면 슈스터 본인은 여러 가지 언어를 공부하는 게 재밌었던 것 같은데 대다수에게 언어 공부는 참 재미없는 일이다. 모국어 공부는 지루하고, 외국어 공부는 어렵다. 아니, 어쩌면 그렇게 슈스터처럼 재밌게 공부를 할 기회 또는 환경이 주어지지 않았다는 게 더 맞는 얘기일 수도 있겠다. 여하간 사람들은 언어 공부를 별로 좋아하지 않는다.
반면에 노는 것은 훨씬 재밌다. 놀다 보면 자연스레 문화도 익힌다. 다시 말해서 노는 것은 본능이고, 사람은 놀면서도 배운다. 그런데 지금까지는 같은 지구 안에서 살아가는 여러 문화의 사람들이 함께 노는 데 있어서 언어가 매우 큰 장벽이었다. 누군가에게는 문화를 보는 창이었겠지만 다른 누군가에게는 문화를 가리는 벽이었다. 언어의 장벽은 바벨탑 만큼이나 높았다. 앞으로는 좋은 품질의 자동 통·번역기 때문에 그 장벽이 상당히 낮아질 거다.
유튜브에 자동 번역 자막이 지금보다 훨씬 좋아졌다고 생각해 보자. 아니, 그 정도가 아니라 유튜브에서 자동 자막이 아니라 자동 더빙이 들어갔다고 생각해 보자. 심지어 목소리와 말투까지 흉내 낸 더빙이. 지구촌 사람들이 함께 즐길 수 있는 것이 얼마나 많아질까. 싸이는 말이 아닌 춤으로 표현해서 전 세계인의 사랑을 받는 스타가 될 수 있었다. 자동 통역 더빙기가 제대로 돌아가는 세상에서는 춤이 아닌 말로도 전 세계 스타가 될 수 있지 않을까.
악화가 양화를 구축한다. 고작 카드 뉴스 같은 것들 때문에, 진지한 언론사들이 고생하게 된 것은 그렇게 놀랄 일이 아니다. 카드 뉴스 때문에 사람들은 좀 더 가볍고 재밌게 뉴스를 접하게 되었다. 자동 통·번역기 때문에 사람들은 다른 언어권의 문화를 좀 더 가볍고 재밌게 접하게 될 거다. 이것이 문화 교류에 도움을 주리라는 것은 자명하다.
딥러닝으로 달성하게 될 일정 수준 이상의 품질의 번역기, 끝도 없이 작아지고 빨라지는 디바이스, 마지막으로 딥러닝으로 엄청나게 빠르게 발전 중인 음성인식기 및 음성합성기의 조합으로, 나는 앞으로 탄생할 귀에 꽂는 실시간 통역기가 상당수의 통·번역가들을 대체할 것이라고 예상한다.
실시간 번역 안경도 많이 쓸 것 같다. 폰트 크기뿐 아니라 스타일까지 반영해서 보여줄 거다. 대통령들의 정상회담 때 그런 것을 쓰진 않겠으나 대통령도 은퇴하고 나면 그런 것을 쓸 것이다. 결과적으로 외국어 공부에 대한 자타의 강요가 앞으로 제대로 된 실시간 통·번역기가 나오고 나서는 상당히 줄어들 것이라고 본다.
사람들은 언제든지 외국어 공부를 때려치울 수 있다. 마음의 준비를 잔뜩 해놨다. 그동안 엄청 참아왔다. 필요할 때마다 귀에 뭘 넣고 안경도 써야 하고 하는 게 편하진 않겠지만, 아무리 불편해도 평생 영어 중국어 공부하는 것 보다는 훨씬 낫고, 매번 전문 통·번역가의 솜씨를 빌리는 것보다도 나을 거다.
지금도 영어는 매우 중요하다. 모두가 안다. 그래서 다들 공부하고 싶다고 한다. 말만 한다. 진짜로 열심히 공부하는 이는 드물다. 그러니까 중요하다는 사실이 사람들에게는 그렇게 중요하지 않다. 그런데 실시간 통역기가 나온 상황에서 누가 진짜로 공부를 할까? 사실 앞으로 30년쯤 안에 정말 위에서 얘기한 멋진 통·번역기가 나온다면 보통 사람들은 언어 공부를 거의 안 하게 되지 않을까 싶다.
언어학자들, 또는 교육학자들, 아니면 문화학자들 아무튼 그러한 어떤 분야의 학자들이 언어 공부가 아무리 중요하다고 강조해도, 심지어 그것이 혹시나 많은 근거를 가진 사실로 밝혀진다 하더라도 실시간 통·번역기가 꽤 잘 돌아가는 세상에서는 언어 공부에 시간을 많이 쏟을 사람은 매우 적을 것이라고 예상한다. 학습 욕구는 결코 귀차니즘을 이길 수 없다.
기계가 미분한다고 해서 많은 사람이 미분을 공부할 필요가 없게 된 것은 아니다. 과학이나 공학에서는 미분을 이해해야만 그다음 것, 기계로는 안 되는 것, 본인이 직접 해야만 하는 것을 할 수 있기 때문이다. 미분 또는 수학이 생각의 기초가 되기도 한다. 과학이나 공학을 하는 사람들에게 수학은 수학 안에서 완결되고 끝나는 도구가 아니다. 수학 기계로는 대체가 안 되는 부분이 크다. 과학 공학을 하는데 수학에 대한 지식과 경험과 이해가 필요하다.
하지만 언어, 그러니까 여기서 관심 있는 외국어는 그런 성격의 것이 아니지 않을까 싶다. 특별히 강력한 근거는 없고 그냥 요즘 딥러닝을 공부하면서 드는 개인적인 생각이다. 딥러닝을 공부할수록 점점 더 그런 생각이 든다. 그러니까 정말, 외국어를 직접 다룰 수 있어야만 할 수 있는 그다음 것, 그러니까 오직 외국어로만 이해할 수 있는 외국어 그 자체 말고 그다음 레벨의 무언가라는 것이 있기는 한가? 나는 딱히 잘 상상이 안 된다.
세탁기가 나온 뒤로 사람들이 빨래를 연구하지 않는다. 직접 빨래를 할 줄 알아야 할 수 있는 그다음 레벨의 일이 없기 때문이다. 그래서 빨래는 세탁기 만드는 사람들만 연구한다. 언어도 혹시 우리가 그동안 부여해 온 온갖 가치가 알고 보면 허상일 뿐이고, 그냥 겨우 빨래 같은 것은 아닐까? 기분 나쁜 생각이다. 인정한다. 과학은 가끔 기분 나쁜 생각으로 이어지기도 한다.
딥러닝의 대부, 존경하는 제프리 힌튼은 마치 컴퓨터가 픽셀을 보고 픽셀로 그린다고 해서 내부 논리도 픽셀로 구성된 게 아니듯이 사람이 언어를 보고 듣고 언어로 말하고 쓴다고 해서 생각도 언어로 하는 것은 아닐 것이라고 했다. 이건 힌튼의 언어를 나의 언어로 옮겨 적은 거고 정확히 이렇게 얘기한 것은 아닐 수도 있는데 다시 좀 찾아봐야겠다. 아무튼.
또 다른 인공지능의 석학 (고) 마빈 민스키 등을 비롯한 많은 사람이 고양이 인식 문제를 알고리즘으로 어떻게든 풀어보려 노력했으나 지난 몇십년간 계속 실패만 했다. 사람이 그런 식으로 언어로 기호로 논리로 알고리즘으로 생각하지 않는데 그걸 억지로 알고리즘으로 풀려고 했기 때문이라고 힌튼은 얘기했다.
언어와 기호를 기술하는 것이 아닌 뇌의 동작 원리를 흉내낸 방법으로 딥러닝은 고양이 인식 문제를 풀어 냈다. ‘에이, 설마 되겠어’ 하던 게 진짜 되었다. 어떤 것이 고양이라고 정확하게 사람의 언어로 표현은 못 하지만 정확히 그러니까 적어도 사람보다는 정확히 고양이를 인식한다. 어떻게 인식의 근거를 표현도 제대로 못 하면서 인식은 하기는 할까? 생각이 말로 다 표현이 안 된다면, 과연 생각은 말로 하는 건가? 진짜? 생각은 말로 하는 거라고 말이 생각을 속이는 것은 아닐까?
아무튼 명료하게 기술이 안 되는 논리 회로의 조합인 딥러닝 인공지능으로 이미지 인식을 했다. 그리고 현재의 딥러닝, 인공지능, 4차산업혁명 난리가 시작되었다. 딥러닝으로 음성 인식도 하고 음성 합성도 하고 바둑도 둔다. 그리고 무엇보다도, 번역을 한다. 번역이라니. 명확한 논리도 없이 번역을 한다고? 같은 슈스터가 다른 인터뷰에서 얘기한 내용을 보자. 지난 2월에 한 인터뷰이다. 아, 게다가 같은 조선비즈구나.
인공신경망, 즉 딥러닝을 통해서 번역 품질을 획기적으로 개선했다는 얘기다. 다시 말하지만 인공신경망의 내부 논리는 사람이 명확히 이해할 수 없다. 알파고가 왜 그런 수를 뒀는지 모르는 것처럼, 구글 번역기가 왜 그렇게 번역했는지 사람은 명료하게는 파악할 수 없다. 이런저런 방법으로 추정만 가능할 뿐이다.
그리고 슈스터는 더 나아가서 “인간은 쉽게 이해하지만 기계가 번역하지 못하는 짧고 난해한 문장 등도 번역할 수 있도록 개선하는 것”이 목표라고 했다. 전혀 불가능하다고 생각하는 것을 목표로 세울까? 그것도 한 기업의 중요한 서비스 책임자가. 그러니까 사실은 그렇게 사람처럼 잘 번역하는 것이 어렵지만 가능해 보이기도 한다는 뜻이다.
언어를 이해해야 문화를 이해할 수 있다는, 언뜻 당연해 보이는 주장은 썩 그렇게 훌륭한 아이디어가 아닐 수도 있을 것 같다. 당연해 보이는 것이 당연하지 않은 경우는 많다. 너무 많다. 평평해 보이는 지구는 사실은 둥글고, 열쇠와 깃털은 진공에서는 같은 속도로 떨어진다. 반대로 이상해 보이는 것이 맞는 경우도 많다. 시공간은 막 휘고, 양자들은 막 이도저도 아닌 상태에 있다. 나도 잘 이해가 안 되지만 그러하다고 한다.
언어를 이해하는 것이 사람이나 문화를 이해하는 데 별로 도움이 안 될지도 모를 일이다. 언어란 것이 수학과 같이 그렇게 기초적인 것이 아닐 수 있다. 오히려 언어는 피상적이고 결과적인 것일 수 있다. 언어는 바람, 불, 물, 흙과 같은 것일 수 있다. 옛날에는 그런 것들이 원소, 즉 핵심 구성요소인 줄 알았으나 사실은 그렇지 않았다.
언어가 겨우 흙과 같은 것이라는 것이 밝혀진다면, 일반인들의 언어에 대한 공부의 중요성뿐 아니라, 언어, 문화, 인류 등을 연구하는 학자들에게조차도 언어에 대한 연구의 중요성 또한 줄어들지도 모를 일이다. 바람을 연구하는 사람보다는 원소와 원자를 연구하는 사람이 많은 것과 같이, 언어를 연구하는 사람보다 신경망 및 인공지능을 연구하다 알게 될 그 무언가를 연구하는 사람이 많아질 것이다.
슈스터는 위의 인터뷰에서 알파고가 나왔어도 사람들은 바둑을 계속 둘 거라고도 했다. 그렇다. 자동차가 나와도 육상 경기는 계속한다. 다만 육상 선수가 아닌 보통 사람은 이제는 잘 걷지도 뛰지도 않게 되었다. 평소에 얼마나 안 뛰면 일부러 어딘가에서 따로 뛸까. 그것도 부지런한 사람이나 뛴다. 많은 사람은 뛰지 않고 티비 앞에 앉아서 육상 경기를 본다. 그것도 올림픽 때만.
알파고를 만든 데미스 하사비스 또한 슈스터와 같이 구글에서 일한다. 그는 알파고가 이세돌을 이긴 후에는 최대한 겸손하게 얘기했다. 대략 알파고는 아직 한계가 많고 이세돌을 존경하고, 그런 얘기들이었다. 1년 하고 반 정도가 지나기도 전에 알파고는 인간들을 모두 격파하고, 더 이상 인간들에게서는 바둑을 배울 필요가 없다고 느꼈는지 은퇴해 버렸다.
인공지능의 발전 속도는 그렇다. 터미네이터는 공상과학이지만 인공지능 신경망 번역기는 공상과학이 아니라 과학이고 공학이다. 지금도 돌아가고 하루하루 발전 중이다. 슈스터의 얘기는 하사비스의 얘기처럼 최대한 겸손하게 포장된 얘기일 수 있다. 나는 그렇게 본다.
원문: Sedong Nam의 페이스북