※ Julian Togelius의 「Some advice for journalists writing about artificial intelligence」를 번역한 글입니다.
기자 여러분에게
여러분이 인공지능에 관한 기사를 쓸 때, 더 잘 그리고 더 정확하게 쓰는 방법을 조언할까 합니다. 제가 이 글을 쓰는 이유는 인공지능에 관한 매우 나쁜 기사들이 신문과 잡지에 게재되기 때문입니다.
그 기사 중 일부는 아주 터무니없고, 오보에 가까우며, 일부는 무엇이 일어나는지 요점은 짚지만 오해로 가득 차 있습니다. 제가 그 예시를 들지는 않겠지만, 인공지능 업계에서 일하고 뉴스를 접하는 사람이라면 누구나 충분히 예를 들 수 있을 겁니다. 물론 좋은 기사도 많이 있지만, 좋은 기사와 나쁜 기사의 비율은 더 나아질 수 있습니다.
먼저 저도 이해합니다. 여러분은 전문 용어와 높은 이상을 가진 열정적인 사람들로 가득한 극도로 빠르게 움직이는 분야에 관해 씁니다. 이런 흥분 속에서는 작성할만한 것도 잔뜩 있겠지만, 여러분은 이 분야에 관해 별로(심지어 전혀) 모릅니다. 여러분은 아마 제가 가죽 공장(tannery)에 관해 아는 정도로 인공지능에 관해 아는 게 없을 겁니다.
하지만 가죽 공장이 매우 느리게 변화하고 유형의 재료와 기술을 다룹니다. 인공지능은 무시무시한 속도로 움직이고, 던져대는 용어 중에 당신이 만지거나 볼 수 있는 뭔가 나타내는 것은 거의 없습니다. 최근의 발전에 관해 당장 써야 할 것 같이 느끼기는 하지만, 인공지능 연구자들이 말하는 이상한 것들을 어디서부터 해독해야 할지도 모르겠죠. 게다가 읽기 편하고, 클릭해볼 만한 뭔가 써야 하는데 시간은 많지 않습니다. 어려운 일이죠.
그래서 더 비판적이고 수준 높은 보도를 위해 명심해야 할 몇 가지와 구체적인 권장 사항을 여기에 적습니다. 이들 중 일부는 다양한 기술적 이해도와 제가 팔고 싶어 하는 스토리를 사려는 여러 의향을 지닌 기자들과 인터뷰한 경험을 바탕으로 했습니다. 네, 우리는 모두 뭔가 팔고 싶어 하고, 상아탑의 괴팍한 사람들인 우리도 여러분에게 뭔가 팔고 싶어 합니다. 자세한 내용은 아래와 같습니다.
1. 인공지능은 큰 영역이고 주제와 방법에 관한 용어도 다양합니다.
사실 어떤 의미에서는 필요한 만큼 다양한 것도 아닙니다. IJCAI, AAAI, ICML, NIPS 같은 주요 인공지능 콘퍼런스들은 수천 명의 참가자가 있고, 대부분의 참가자는 콘퍼런스에서 일어나는 것들의 일부분만 이해합니다.
제가 이들 콘퍼런스 중 하나에 가면 발표의 20%만 따라갈 수 있을 것이고 그 안에서 뭔가 얻어가겠죠. 좀 겸손하게 말하긴 했지만 제약 조건 전파, 딥러닝, 확률론적 연구와 같이 다양한 영역(sub-fields)에 관해 최신 정보를 따라가는 누군가 찾기란 거의 불가능할 겁니다.
권장 사항
여러분과 대화하는 연구자들이 “인공지능에서 지금 무슨 일이 일어나는가”를 알 거라고 여기지 마세요. 더 중요한 것으로는, 만약 누군가가 인공지능에서 무슨 일이 일어나는지 안다고 말한다면, 그가 큰 그림의 작은 영역만을 안다고 생각하세요. 인공지능의 다른 분야에서 일하는 누군가에게 다시 확인하세요.
2. 하나의 ‘인공지능’ 같은 것은 없습니다.
인공지능이란 사람의 두뇌로 할 수 있는 무언가 할 수 있는 소프트웨어를 만들기 위한 방법과 아이디어의 집합체입니다. 연구자들과 개발자들은 게임을 한다거나 고양이 그림을 그리는 것과 같이 인상적인 뭔가 할 수 있는 소프트웨어(가끔은 하드웨어도)를 만들기 위해 새로운 인공지능 방법을 만듭니다. (기존의 방법을 사용하기도 하고요.)
하지만 같은 시스템으로 게임도 하고 고양이 그림도 그릴 수는 없을 거라고 생각해도 문제없습니다. 사실 제가 들어본 어떤 인공지능 기반의 시스템도 몇 가지 이상의 다른 작업을 해낼 수 없었습니다. 같은 연구자가 같은 아이디어를 가지고 개발하더라도 서로 다른 작업을 하는 시스템을 위해서는 서로 다른 소프트웨어를 만들어야 합니다.
만약 기자가 “X사의 인공지능은 원래 운전을 할 수 있었지만 이제 시도 쓸 수 있습니다”라고 쓴다면, 이것들이 서로 다른 시스템이라는 사실을 애매하게 만들고 마치 범용의 인공지능을 지닌 장치가 있는 것처럼 보이게 합니다. 그렇지 않습니다.
권장 사항
‘인공지능’이라는 표현을 사용하지 마세요. 항상 시스템의 한계가 무엇인지 물어보세요. 정말로 같은 신경망이 ‘스페이스 인베이더’와 ‘몬테주마의 복수’를 둘 다 플레이할 수 있느냐고 물어보세요. 아마 아닐 겁니다.
3. 인공지능은 오래된 영역이고, 정말로 새로운 것은 거의 없습니다.
대단하긴 하지만 좀 과장된 최근 딥러닝의 진보는 그 근간을 1980년대와 1990년대의 신경망 연구에 두고, 기반이 되는 아이디어와 실험들은 1940년대까지 거슬러 올라갑니다. 많은 경우에 최신 연구들은 그 연구자들이 태어나기도 전에 고안된 방법의 변주와 개량으로 구성되어 있습니다.
오늘날 대부분의 딥러닝을 움직이는 알고리즘인 역전파(Backpropagation)는 수십 년 전에 서로 다른 개개인에 의해 독립적으로 발명되었습니다. IBM의 딥 블루(Deep Blue)가 가리 카스파로프(Garry Kasparov)를 이기고 컴퓨터가 사람보다 체스를 잘할 수 있다는 걸 보여줄 당시, 그 소프트웨어의 핵심은 앨런 튜링이 1940년대에 처음 고안한 최소최대(Minimax) 알고리즘이었습니다.
인공지능과 컴퓨터과학의 넓은 영역에서 아버지라 불리는 튜링은 1950년에 「온 컴퓨팅 머시너리 앤드 인텔리전스(On Computing Machinery and Intelligence)」 논문을 작성하기도 했습니다. 이 논문이 튜링 테스트를 소개한 것으로 유명하긴 하지만, 인공지능의 핵심 아이디어가 될 씨앗들을 담기도 합니다.
권장 사항
튜링의 1950년 논문을 읽으세요. 놀라울 정도로 읽기 쉽고 재미있으며, 수학적인 표기들도 없고, 기술적인 용어들도 쉽게 넘어갈 수 있습니다. 초기 형태이긴 해도 얼마나 많은 인공지능의 핵심 아이디어들이 이미 거기에 있었는지 감탄할 겁니다.
흥분되는 새 발전에 관해 쓸 때는 나이 들었거나 최소한 중년의 연구자에게 자문하세요. 인공지능이 멋진 것이기도 전부터, 아니면 심지어 멋없는 것이기도 전부터 연구해온 사람이라면 인공지능이 과장되는 순환과정을 모두 봐왔을 겁니다. 이 사람은 새로운 진보가 어떤 오래된 아이디어에서 (약간만?) 발전된 것인지 알려줄 수도 있습니다.
4. 연구자들은 언제나 팔고 싶은 뭔가가 있습니다.
당연하게도 스타트업 등에서 일하는 이들은 회사의 가치를 높이고 투자나 인수의 기회를 노립니다. 학문 영역에서 일하는 이들은 연사 초청, 인용, 진급 등등을 찾습니다. 큰 회사에서 일하는 이들은 그들의 실적과 관련되었건 그렇지 않건 어떤 제품의 관심을 만들어내고 싶어 합니다.
권장 사항
과대광고에 속지 마세요. 당신이 쓰려는 대상이 아닌 다른 연구자를 찾아가서 그들이 하는 말을 믿는지 물어보세요.
5. 대부분 ‘인공지능’은 사실 인간의 재주입니다.
연구자들과 개발자들이 인공지능을 로봇공학이나 게임, 번역과 같은 특정 분야(domain)에 적용하는데 특화되어있는 것은 이 때문입니다: 문제를 푸는 시스템을 만들려면, 도메인 지식 등 실제 문제에 관한 다양한 지식이 시스템에 포함되어야 합니다. 이는 시스템에 특별한 입력을 제공하거나, 특별히 준비된 학습데이터를 사용하거나, 시스템 일부를 직접 코딩하거나, 문제를 재구성해서 더 쉽게 만드는 등의 역할입니다.
권장 사항
“인공지능 솔루션”의 어느 부분이 자동이고 어느 부분이 재치 있게 인코딩된 인간의 도메인 지식인지 이해하는 좋은 방법은 이 시스템이 살짝 다른 문제에서 어떻게 작동할지 물어보는 것입니다.
마치며
이 글이 이미 너무 심술궂게 보일 것 같으니 여기까지 쓰겠습니다. 이봐요, 난 심술궂은 것도 고리타분한 것도 아닙니다. 인공지능에서 최근에 놀랄만한 진보가 없었다는 인상을 주려는 것도 아닙니다. 새로울 것 없지만 새로운 것처럼 파는 연구로 기사를 부풀리지 않더라도 보도할만한 진정한 발전이 많이 있습니다. 정직하고, 비판적이고, 정확하게 해 볼까요?