트럼프가 당선됐다. 가짜 뉴스 덕분이라는 사람도 있다. 대부분의 언론이 트럼프에게서 돌아선 상황에서, 힐러리를 비판하는 가짜 뉴스들이 SNS에서 전파되며 트럼프의 승리를 도왔다는 주장이다.
SNS가 나서서 가짜 뉴스를 폐기 처분해야 하지 않느냐는 주장도 들린다. 트위터는 가짜 뉴스든 진짜 뉴스든 똑같이 전파된다. 페이스북은 유저의 ‘호불호’에 따라 유저가 좋아할 만한 종류의 기사를 추천해준다. 둘 다 가짜 뉴스는 유저가 직접 구별할 수 있다는 믿음에 따라 움직이고 있다.
하지만 많은 이들은 가짜 뉴스와 진짜 뉴스를 구별하지 못한다. 스탠포드 대학교에서 진행한 실험에 따르면 중학생의 82%가 네이티브 애드(기사형 광고)와 진짜 뉴스를 구별하지 못했다.
deeplearning4j.org의 공동 창업자 크리스 니콜슨은 테크 크런치에 글을 기고했다. 딥러닝을 통해 SNS가 얼마든지 가짜 뉴스를 잡아낼 수 있을 거라고 주장하기 위해서다. 그가 밝힌 가짜 뉴스를 찾아내는 법은 다음과 같다. 기사를 벡터로 만든다. 이를 통해 기사를 프로그램이 이해할 수 있는 ‘숫자’로 바꾼다. 그리고 이를 딥러닝을 통해 분석해서 기사가 가짜일 확률을 찾는다. 가짜인 확률이 높은 기사일 경우 기사의 노출 확률을 줄이거나 낮춘다.
마치 SF에 나올 법한 기술이다. 이게 가능할까? 가능하다. 구글은 이미 가짜 콘텐츠를 삭제하고 있다. 뉴스가 아니다. 구글 플레이스토어의 가짜 리뷰 삭제다. 구글은 앱 개발자들에게 가짜 리뷰를 남기지 말라고 경고했다. 특히 마케팅 에이전시를 고용할 경우 거짓 정보를 올리는 행위는 소용이 없을 거라 밝혔다. 가짜 리뷰와 별점은 자동으로 삭제될 방침이다.
구글은 어떻게 가짜 리뷰를 찾는지 밝히지 않았다. 방식을 밝힌다면 역설적으로 가짜 리뷰를 만드는 데 활용 될 수 있으니 방식을 공개하지 않을 법하다. 하지만 방식을 모른다 해도 구글이 ‘자신들이 필요하다고 생각할 경우’ 얼마든지 잘못된 정보를 거를 수 있다고 볼 수 있다는 건 확실해 보인다.
구글은 앱스토어에 거짓 별점과 거짓 리뷰가 생기는 걸 규제했다. 그래야 구글 플레이스토어라는 플랫폼의 신뢰가 유지되기 때문이다. 그렇다면 같은 방식으로 SNS도 거짓 정보의 유통을 규제해야 하는 건 아닐까?
크리스 니콜슨은 ‘그래야 마땅하다’고 말한다. 트위터, 페이스북 등의 SNS들은 본인들이 ‘아랍의 봄’등의 민주화 운동을 촉진시켰다며 자랑해왔다. 하지만 트럼프의 당선에는 아무런 영향을 끼치지 않았다고 말한다. 하지만 둘은 본질적으로 같은 종류의 영향력이다. 둘 중 하나만 영향을 끼쳤을 수는 없다.
큰 힘에는 큰 책임이 따른다. 대다수 사람들이 모바일을 통해서 뉴스를 본다. 그렇다면 모바일 플랫폼에는 올바른 정보를 전달해야 할 의무가 있다. 이를 위해서라면 가짜 정보를 규제하는 방식은 반드시 필요하다.
민주주의는 사람들이 올바른 정보를 갖고 있다는 가정 하에 만들어진 제도다. 물론 그랬던 적은 거의 없다. 링컨 또한 가짜 뉴스 덕분에 실각될 뻔 했다. 링컨 본인 또한 전쟁 전보를 검열하고, 전쟁에 반대하는 신문들을 일시적으로 폐간하는 등 정보를 적극적으로 조작했다.
그러나 항상 그래왔다고 해서 그 책임이 사라지지는 않는다. 무엇보다 잘못된 정보로 인해 유저들에 신뢰를 잃을 수 있다. 어느 순간 그 임계점이 넘어버리면 유저들은 그 플랫폼을 통해 정보를 얻지 않게 된다.
가짜 뉴스를 제거하는 일은 굉장히 어려운 일이다. 얼핏 생각해도 ‘검열’이 떠오른다. 삭제의 기준은 무엇인가? 어디까지 그 기준이 공개되어야 할까? 기업이 평가하는 뉴스의 신뢰성을 과연 사회가 신뢰할 수 있을까? 수많은 질문이 떠오른다.
쉽게 해결될 일은 아니다. 이제까지 SNS가 그래왔듯이, ‘유저의 판단에 맡긴다’라고 방관하는 태도가 훨씬 더 쉽다. 하지만 이는 해답이 아니다. 그렇다고 지나치게 가짜 뉴스를 잘 찾아내려 하면 검열으로 오해받을 수 있다.
통계학에는 ‘1종 오류’와 ‘2종 오류’가 있다. 1종 오류는 사실을 거짓으로 오인하는 경우다. 2종 오류는 거짓을 사실이라고 오해하는 경우다. 뉴스에 대입해보면 1종 오류는 실제 기사를 가짜 기사라고, 혹은 저품질 기사라고 판단해 유통을 막는 일이다. 2종 오류는 가짜 뉴스를 진짜라고 오해하여 유통을 방관하는 일이다. 둘 다 좋지 않은 상황이다.
통계적으로 어려운 점은 1종 오류와 2종 오류를 일으킬 확률을 동시에 줄일 수 없다는 거다. 여기서 모든 비극이 생긴다. 지나치게 거짓 뉴스를 잡아내려 하면 진짜 뉴스가 폐기된다. 지나치게 모든 진짜 뉴스를 유통시키려 하면 가짜 뉴스도 같이 유통하게 된다.
결국 해답은 ‘적절한 비율을 찾는다’는 뻔한 해답이 될 수밖에 없다. 적어도 ‘유저의 판단에 맡긴다.’는 해답이 아니다. 적절한 수준이 어느 정도인지 지금부터 사회적 토론이 필요한 이유다.
원문 : 김은우 블로그