모르는 문제의 답을 찍는 방법
오랜만에 해온 언니와 데이트를 했다. 요즘 알바 시간이 줄었는지 가끔 수다를 떨 시간이 생겼다. 수능시험 이야기를 했다. 결론은 하기 싫은 걸 안 하려면 공부를 열심히 해야 한다는 것이었다. 언니는 공부도 잘하면서 왜 그렇게 만날 공부를 하지? 하기 싫지 않나? 난 공부하기 싫은데. 돈을 많이 벌어야 해서 그런가? 처음 만났을 때부터 뭔가 수상한데 아직도 잘 모르겠다.
언니가 물었다. “넌 모르는 문제를 만나면 어떻게 해?” 나는 바로 답했다. “찍어.” 다시 물었다. “어떤 기준으로 찍어?” 잠시 생각했다. 내가 찍는 기준이 뭐더라. “객관식 문제는 번호의 분포와 선생님의 성격을 반영해서 찍어.” 해온 언니는 웃었다. “나도 예전엔 그렇게 찍었던 적이 있지.”
OMR 카드 같은 곳에 답을 입력하면 1부터 5까지 답이 배치된 위치가 눈에 들어온다. 멀리서 바라보면 빈도와 함께 경향이 보인다. 1번은 몇 개, 2번은 몇 개, 그리고 왔다 갔다 움직이는 모양을 미루어 짐작해보면 이번엔 3번 답이 나올 차례. 내가 고른 답이 그 경향을 벗어나게 되면 불안하고 초조해진다. 알고 쓸 때는 괜찮은데 모르고 찍을 때는 오답인 것 같은 느낌이 강하게 든다.
그러면 문제를 낸 선생님의 성격을 떠올린다. 아이들을 괴롭히는 걸 좋아하면 엉뚱한 곳에 답을 배치할 것이고, 착하고 책상 줄 맞추는 걸 좋아하는 선생님은 규칙적으로 배치할 것이다. 근거는 없지만 그동안의 시험 결과를 보면 제법 잘 맞는 것 같다. 이런 이야기를 언니에게 이야기를 하자 “그게 바로 알고리즘이야.”라고 말했다.
“아라가 그동안의 경험과 추론으로 자신만의 답을 찾는 방법을 발견한 것처럼 컴퓨터 프로그래머들도 가장 정확한 답이나 효율적인 일 처리를 위해 알고리즘을 개발해. 한 가지 방법이 잘 먹힌다면 계속 한 가지 알고리즘만 쓰겠지만 요즘처럼 빠르게 돌아가고 엄청난 데이터가 만들어지는 세상에선 늘 새로운 알고리즘이 등장하고 사라지지.”
고개를 끄덕이다가 물었다. “그럼 모르면 무조건 3번만 찍는 애도 자기만의 알고리즘을 가진 거야?” 언니는 말했다. “그럼. 정답일 확률은 20%라 꽤 낮지만 한국 사람은 숫자 3에게 이끌리는 유전자를 갖고 있거든. 많은 한국인이 애용하는 알고리즘이지.”
스포티파이?
갑자기 알고리즘 이야기를 하게 된 데는 이유가 있다. 아까 언니와 서울 대학로에 갔었다. 다방이라 쓰인 간판을 보고 내가 궁금해하자 언니가 내 손을 이끌고 들어갔다. 문을 열자 눈앞에 새로운 세계가 펼쳐졌다. 한쪽 벽면에는 내가 태어나기 전에 쓰던 전자제품이 쭉 줄지었고 방향을 틀자 컴퓨터와 태블릿, 스마트폰 같은 요즘 제품이 전시되어 있었다.
몇몇은 익숙했지만 대부분은 태어나서 처음 보는 물건들이었다. 유독 호빵을 닮은 컴퓨터가 눈에 들어왔다. 만든 연도를 보니 2002년. 나보다 나이가 많잖아. 그런데 요즘 컴퓨터보다 훨씬 예뻤다. 아니, 전혀 컴퓨터처럼 보이지 않았다. 하나 갖고 싶었지만 언니의 설명에 바로 마음을 접었다.
“네가 쓰는 스마트폰 성능이 쟤보다 좋을 거야. 쟨 유튜브도 안 돌아가. 괜찮겠어?”
자리에 앉으니 그제야 음악이 들렸다. 무슨 음악인지 모르겠지만 요즘 노래는 아닌 듯했다. 언니에게 이런 취향이 있었나?
“이런 데 처음 와보지?”
“응. 큰 카페나 햄버거 가게는 몇 번 가봤지만 이런 곳은 처음이야. 되게 신기하다.”
내부 좌석 근처에는 요즘에 보기 드문 레코드판이 잔뜩 걸려 있었다. 음악도 이걸로 틀어주나?
“예전에는 이런 다방이나 찻집에 디제이란 사람이 한쪽에 앉아서 신청곡을 받고 음악을 골라줬대. 나도 직접 본 적은 없어.”
“디제이? 요즘도 라디오 방송은 디제이가 진행하잖아.”
“맞아. 같은 일을 하는 사람이야. 지금이야 컴퓨터나 스마트폰만 있으면 듣고 싶은 음악을 아무 때나 골라 들을 수 있지만 예전엔 쉽지 않았거든. 집집마다 오디오가 있던 것도 얼마 안 됐고. 라디오는 무슨 노래가 나올지 모르니 마냥 기다릴 수밖에 없지. 그래서 진행하는 디제이가 중요했지. 말도 잘 해야 하고 사연 보낸 사람들의 목소리에 귀도 기울여줘야 하고 음악도 잘 골라야 하니까.”
“방송국에서는 뭘 기준으로 음악을 틀어줘?”
“사람들이 많이 신청한 노래를 틀기도 하고, 새로 나온 음반을 틀기도 하고, 진행자나 PD의 기분에 따라 그날그날 혹은 방송 중에 달라지기도 하지. 예전엔 음반사 관계자나 가수 매니저가 홍보용으로 뿌리는 음악을 틀기도 했다는데 요즘처럼 mp3 음원으로 음악 듣는 세상에선 어떻게 잘 봐달라 부탁하는지 모르겠네.”
언니는 음악에 귀를 기울였다. 나도 음악에 집중했다. 매번 다른 곡이 흘러나왔다. 앞에 나온 음악과 다른 분위기의 음악이 나올 때도 있고 비슷한 장르의 음악이 나오기도 했다. 매번 가수가 달라지는 걸 봐서는 한 앨범의 음악이 아닌 건 분명했다. 인기 순위대로 틀어주는 건가?
아무튼 처음 듣는 음악들인데도 듣기에 좋았다. 외국곡이라 무슨 말인지 알아듣기가 힘들어서 그렇지. 언니도 같은 궁금증을 가졌는지 주문했던 음료수를 가져온 직원에게 음악 선곡 기준이 뭐냐고 물어봤다.
“사장님이 스포티파이 추천 플레이리스트 중에서 직접 골라서 틀어요.”
직원 말에 따르면 스포티파이란 음악 서비스 사이트에서 장르나 분위기를 하나 골라 하루종일 튼다고 했다. 또 가끔은 디스커버리 기능으로 전혀 들어보지 못한 노래들을 듣는다고도 했다.
“언니, 스포티파이가 유명한 사이트야? 우리나라 멜론이나 벅스뮤직보다 더 유명해?”
“더 정도가 아니라 세계에서 제일 유명한 음악 스밍(스트리밍) 사이트야.”
언니는 내가 기분 나쁘지 않을 정도로만 웃었다. 다른 사람이 웃으면 기분 나빴을 텐데. 만나면 늘 배우는 느낌이 들어서 좋다.
“너도 스마트폰으로 음악을 듣고 있지?”
“응. 언니가 빌려준 아이디로 우리나라 노래 듣고 있잖아.”
“주로 어떤 노래를 들어?”
“아이돌 가수 신곡이나 인기곡 100 전체를 랜덤 재생하며 들어.”
“그렇구나. 스포티파이는 다운로드가 아닌 스트리밍 방식으로 듣는 일종의 인터넷 라디오 사이트인데 전 세계적으로 없는 노래가 없을 정도로 데이터베이스가 방대해.”
“한국 사이트에도 팝송은 있는데 그거론 부족한가?”
“매우 많이. 많은 나라에서 인기 있는 곡이 비슷할 순 있지만 세상엔 유명하지 않은 가수와 음악도 엄청나게 많고 지금 이 순간도 수백 곡의 신곡이 발표되고 있거든.”
“그럼 스포티파이는 보유곡 수가 제일 많아서 인기 있는 거야?”
“그것도 중요하긴 한데 어차피 대부분의 사람은 듣는 음악만 듣기 때문에 그것 때문은 아닐 거야. 그보단 추천 알고리즘 때문이 아닐까?”
“알고리즘이 뭐야?”
“어떻게 설명하면 좋을까…. 음. 아라 넌 모르는 문제를 만나면 어떻게 해?”
다음에 들으실 곡은…
언니가 쉽게 설명해줘서 알고리즘에 대해서는 조금 알 것 같았다. 그런데 추천 알고리즘은 뭐지?
“인기곡 100을 랜덤으로 들으면 아라는 다음에 어떤 곡이 나올지 알 수 있어?”
“아니, 랜덤이 무작위란 소리잖아. 1위 곡이 나온 뒤에 100위 곡이 나올지 2위 곡이 나올지는 아무도 모르지. 그러니까 랜덤 아니야?”
“맞아. 아라 똑똑하네. 근데 생각해보면 어차피 재생목록에는 100곡밖에 없잖아. 그럼 다음 곡의 확률은 1/99, 그다음은 1/98…. 이런 식으로 줄어들겠지. 또 100곡을 쉬지 않고 듣는다면 10시간도 안 걸릴걸. 만약 정말 좋아하는 게 아닌 노래들만 며칠 반복해서 들으면 지겨워질지 몰라.”
“응. 좋아하는 가수 노래야 반복해서 수십번 들을 수도 있지만 내 취향이 아닌 곡을 여러 번 듣는 건 고문일 거야.”
“그때 필요한 게 추천 알고리즘이야. 스포티파이에는 많은 노래가 있다고 했잖아. 만약 새로운 노래를 듣고 싶은 사람이 수십만 곡을 무작정 랜덤으로 들으면 어떨까. 새롭긴 해도 내 취향과는 거리가 먼 노래도 나올 수 있겠지?”
“근데 랜덤이라면 그걸 막을 수 있나? 아이돌 음악이 나왔다가 아프리카 음악이 나올 수도 있고 그다음에 판소리가 나올 수도 있잖아. 내가 뭘 좋아하는지 모르면서 어떻게 듣기 싫은 음악을 안 들려줄 수 있어?”
“서비스 운영자들은 그 점을 늘 고민해. 어떻게 하면 지루하지 않게 새로운 곡을 틀어주면서도 서비스 이용자의 취향에 맞는 음악만 골라줄 수 있을까. 그러다가 힌트는 결국 이용자가 쥐고 있단 걸 알았지.”
“힌트?”
“응. 아라가 좋아하는 음식이 뭔지 어떻게 알 수 있을까.”
“나한테 물어보면 되지.”
“맞아. 또 다른 방법은 없을까?”
“또 있나?”
“아라의 삼시 세끼를 지켜보는 거지. 무슨 음식은 잘 먹고 무슨 음식은 남기는지, 식당이나 편의점에서 무슨 음식을 주문하는지 지켜보면 알 수 있지.”
“그렇겠다. 근데 그거랑 음악이 무슨 상관?”
“프로그램이나 앱 개발자들은 사용자의 이용습관을 힘들이지 않고 들여다볼 수 있어. 조금 스토킹 같지만 앱을 설치할 때 약관에 다 쓰여 있는 합법적인 감시야. 내가 어떤 노래를 자주 듣는지, 한 달에 몇 번이나 듣는지 다 세고는 그걸 바탕으로 나의 취향을 예측해. 방탄소년단의 신곡 한 곡을 무한 반복으로 듣는다면 ‘아, 이 사람은 방탄소년단을 좋아하는구나. 그럼 다음 곡으로 방탄소년단의 다른 노래를 추천하면 좋아하겠다. 또 재생되고 있는 곡이 힙합댄스 장르니까 유사한 느낌의 다른 그룹의 댄스곡을 들려줘도 좋아하겠지?’ 이런 식으로 추측하는 거지. 이게 바로 추천 알고리즘의 한 사례야.”
“그러니까 내가 그동안 했던 행동이나 판단을 근거로 삼아서 예측한다는 거지?”
“정답. 네가 폰으로 음악을 듣다가 하트 표시를 누르면 이 사람이 이 곡을 좋아하는지를 알 수 있을 거고, 어떤 노래가 나왔을 때 다 듣지 않고 바로 넘기면 그 곡은 싫어한다고 생각해도 되겠지. 그런 식으로 과거의 네 행동을 분석해서 취향일 걸로 추측되는 음악들을 플레이리스트로 만들어 추천하면 넌 그 음악들을 들으며 다음 추천 목록도 기다리게 될 거야. 굳이 네가 직접 무슨 노래를 들을지 고를 필요가 없게 되지.”
“그럼 아까 직원이 알려준 것처럼 스포티파이의 추천 음악을 튼다면 이 다방의 디제이는 사장님이 아니라 스포티파이의 알고리즘이겠네?”
“그렇지. 특히 요즘처럼 모든 사람이 각종 앱과 장치를 이용하며 엄청난 데이터를 생성하는 시대에는 효율적인 분석과 결정을 위해 인공지능 시스템을 도입하는데, 그 말은 곧 인공지능이 디제이의 역할까지 넘겨받는단 소리지.”
“사용 패턴을 분석하는 추천곡은 그럴 수가 있겠지만, 가을에 듣고 싶은 음악, 쓸쓸하거나 기분 좋을 때 듣고 싶은 음악 같은 건 어떡해? 인공지능이 그런 것도 가려낼 수 있어?”
“물론이지. 인공지능이 전 세계의 모든 곡을 분석한다고 생각해봐. 곡 재생시간, 작곡가, 장르 같은 제작자가 제공해주는 정보 말고도 템포, 보컬의 성향, 가사 유무, 악기 종류, 코드, 곡 진행 방식 같은 음악 유전자들을 스스로 학습하는 거지. 거기에 전 세계 방송국에서 특정 계절에 자주 재생되었던 음악의 목록 같은 정보까지 결합되면 어떻겠어. 요즘도 10월만 되면 ‘10월의 어느 멋진 날에’가 자주 라디오 신청곡으로 올라온다고 하는데 인공지능이 골라준다면 굳이 그 곡이 아니라도 그 노래와 유사한 분위기의 노래를 틀어주니 늘 뻔하단 소리는 듣기 어려울 거야.”
해온 언니는 더 놀라운 이야기도 해주었다.
“스포티파이에는 러닝 모드가 있는데 운동 삼아 달리기할 때 듣기 좋은 음악을 알아서 골라줘. 무서운 건 스마트폰의 움직임 센서를 이용해서 사용자의 걷는 속도를 분석한 뒤에 그에 맞는 비트의 음악을 자동으로 골라주고 심지어는 각 곡이 넘어갈 때 끊어지는 느낌이 없게 들려주기까지 하지. 이런 식이면 조도 센서로 주변 밝기를 인지해서 밤이나 노을 질 때 들으면 좋을 음악을 골라주고, 움직임 센서나 GPS를 이용해서 속도를 알아낸 뒤에 운전 중이면 드라이브용 음악을 들려주고, 자주 만나는 연인의 스마트폰이 감지되면 알아서 데이트 음악을 틀어줄지도 몰라.”
나는 네가 다음 연휴에 볼 영화를 알고 있다
다방에서 나와 무작정 걸었다. 걸어가며 여러 가지 이야기를 나눴다. 사생활 침해의 위험성이 있지만 앞으로 데이터가 더 많아지면 인공지능의 예측은 지금보다 훨씬 더 정확해질 거다, 좋은 걸 한데 모아 추천해주는 큐레이터의 자리는 사라질 거다, 가뜩이나 바쁜 세상에서 추천 알고리즘에 의존하는 일은 더욱 늘어날 거다…. 늘 그렇듯 해온 언니의 설명은 정말 멋지고 그럴싸한데 과장이나 허풍이 아닐까 싶을 정도로 좀 넘치는 감이 있다. 앞으로 지켜보면 알겠지.
걷다 보니 종로3가에 있는 여러 극장 앞을 지났다. 언니의 설명에 따르면 예전에는 영화를 보려면 극장 주변에 줄을 서서 기다렸다고 한다. 극장이 많지 않기도 했고, 어떤 영화는 특정 극장에서만 상영되었기 때문이다. 요즘처럼 멀티플렉스가 없을 당시엔 유명한 영화를 보려면 오랫동안 줄을 서거나 개봉 뒤 한참 뒤에야 겨우 볼 수 있었다고도 한다. 물론 웃돈을 주고 암표를 산다면 금방 볼 수 있었겠지만. 극장을 지날 때 언니가 말했다.
“추천 알고리즘이 이젠 예술 영역까지 침범했다.”
“예술?”
“응. 넷플릭스 알아?”
“영화 보는 사이트? 얼마 전 뉴스 같은 데서 나오긴 하던데.”
“원래는 큰 비디오 가게였어. DVD를 우편으로 배송해주다가 인터넷이 널리 보급된 후에는 스트리밍 방식으로 영상물을 서비스해주는 회사지. 인터넷을 기반으로 하는 주문형 케이블 방송사가 지금은 세계에서 제일 잘 나가는 회사가 됐어.”
“어떻게? 스포티파이처럼 많은 영화를 갖고 있나?”
“아니. 제공되는 영화나 드라마는 경쟁사인 아마존의 몇 분의 일밖에 안 된대. 단순히 보유작이 많아서가 아닌 거지.”
“그럼?”
“역시 알고리즘.”
종로3가에서 청계천을 따라 광화문까지 걸으며 해온 언니는 넷플릭스의 사례를 열심히 이야기해주었다. 보통 영화 장르를 구분하면 많아야 수십 개다. 하지만 넷플릭스에는 8만 개에 가까운 장르가 존재한다. 단순히 액션, 로맨스, 코미디 같은 수준을 넘어 ‘20세기 초 미국 범죄자들의 우정을 다룬 작품’ ‘어린이와 동물이 함께 모험을 떠나는 희망찬 드라마’처럼 구체적이고 그 자체만 읽어도 내용이 파악될 정도로 세세한 분류에 따라 수만 개의 작품을 나눴다고 한다. 이유는 간단하다. 이용자들의 까다로운 입맛에 맞는 메뉴를 내밀기 위해서.
넷플릭스는 스포티파이의 음악 추천 플레이리스트처럼 영화나 드라마를 보는 사람들의 시청 습관을 분석해서 더 오랜 시간 동안 자신들의 콘텐츠를 소비하게 만들려고 한다. 한정된 수량의 비디오테이프나 DVD를 대여하던 옛날에야 최대한 회전율을 높이기 위해 안 보는 작품을 그럴싸한 홍보문구로 꼬드겨서 대여하게 만드는 게 목적이었겠지만 무한복제가 가능한 디지털 시대에는 더 이상 그럴 필요가 없어졌다.
대신 자신들이 만든 플랫폼에 입주하여 평생 빠져나가지 못하게 만드는, 이른바 생태계를 조성하는 게 목적이지 않을까 하는 게 해온 언니의 추측이었다. 일리가 있었다. 상영 도중에는 광고도 안 나오고 많이 보든 적게 보든 같은 금액을 지불하는 월정액 회원제 방식으로 운영되기 때문에 지상파 방송이나 케이블 방송처럼 광고 수익을 얻진 못하지만 사용자의 시청 습관을 분석해서 차후 활용할 마케팅 자료로 쓸 수 있고, 작품 속에서 제품을 노출하는 PPL 방식의 광고 제작에도 도움이 될 수 있고, 무엇보다 개인 맞춤의 콘텐츠 제공을 최대 장점으로 살려 많은 가입자를 끌어온다면 그 자체로도 업계에서 엄청난 영향력과 경쟁력을 가질 건 분명하다.
“넷플릭스는 심지어 이용자들의 취향을 분석해서 드라마와 영화를 자체 제작까지 하고 있어. 실상은 더 복잡하지만 간단히 설명하자면 이래. 영화나 드라마 마니아들이 가장 높은 별점을 준 작품들을 보니 데이빗 핀처 감독이 영화가 많네? 또 배우로는 케빈 스페이시가 인기가 있네? 그러면 그 둘을 함께 모아 드라마를 만들어보자. 그래서 ‘하우스 오브 카드’란 드라마를 만들게 된 거지. 결과는 대성공이야. 사람들은 한 번에 공개된 시즌 1 13편의 에피소드를 몰아보기에 바빴고 그해부터 여러 해 동안 에미상과 골든 글로브에서 쏠쏠한 성과를 거두지. 그전에도 시장 조사나 모니터링 관객의 설문에 따라 영상물을 만든 사례는 많았지만 수천만 시청자의 습관에서 나온 빅데이터를 바탕으로 작품을 만든 건 매우 적었으니 아주 이례적인 결과지. ‘하우스 오브 카드’ 이후로도 많은 드라마가 만들어졌고 블록버스터 영화 같은 오락물뿐 아니라 사람들이 잘 안 볼 것 같은 다큐멘터리까지 제작하고 있어. 2016년부터는 우리나라에서도 쉽게 볼 수 있게 됐으니 앞으로 어떻게 활약할지 지켜보는 것도 재미있을 것 같다.”
우리 집에서 텔레비전이란 할머니 전유물이기 때문에 화면 너머로 이런 일이 벌어지고 있는지 전혀 몰랐다.
“그럼 넷플릭스가 시청자들의 취향 분석을 하는 것도 음악 사이트랑 비슷해? 재생 횟수나 별점 같은 걸로 평가하나?”
“이용 기록을 바탕으로 취향을 파악하는 건 비슷한데 음악보단 콘텐츠의 길이가 길다 보니 같은 방식을 쓰긴 어렵지. 아무리 좋아해도 두 시간이 넘는 영화를 수십 번 반복해서 보는 사람은 드물잖아. 대신 별점이나 좋아요 버튼을 통해 얼마나 좋아하는지를 파악하지. 넷플릭스에선 씨네 매치 알고리즘이라고 하는데, 이용자가 좋게 평가한 작품과 관련이 있는 감독, 배우, 장르, 줄거리 등을 기반으로 작품을 소개해줘. 그러다가 SNS 같은 사회관계망이 중요해지던 시점부터는 비슷한 성향을 가진 사람들의 평가를 반영하지. 가령 A 작품과 B 작품을 좋아한다고 평가한 사람은 A와 B를 모두 좋아하면서 C도 좋아하는 사람과 비슷한 안목을 가졌다고 생각해서 C를 추천해줘. 신기하게도 나중에 C를 본 사람의 만족도는 75%에서 90%에 이른다고 하더라고. 그만큼 넷플릭스의 협업 필터링 알고리즘은 효과가 있는 거야.”
“그 정도면 넷플릭스로 영화 보는 사람들은 굳이 기존 방송을 안 봐도 되겠는걸? 처음 보는 프로그램은 재미가 있을 수도 있고 없을 수도 있지만 넷플릭스 추천작은 대부분 만족스럽다는 거잖아. 그러면 휴일 같은 때는 집에서 티비만 봐도 되겠다. 극장 망하겠다.”
“그럴지도 몰라. 아까도 스포티파이의 무서운 점을 말했지만 넷플릭스도 그래. 요즘에는 상황 인지 알고리즘도 도입해서 시청자가 콘텐츠를 소비하는 사회적 맥락까지 분석한대. 누구와 보는지, 언제 보는지, 어디서 보는지, 날씨는 어떤지까지 정보를 모아서 그걸 바탕으로 작품을 추천하고, 심지어는 드라마를 보다가 재미없다고 빨리 감기 버튼을 누른 위치와 시간까지 기억해서 ‘시청자들은 이런 장면을 지루해하고 저런 장면은 자꾸 돌려보는구나’까지 파악해서 다음 작품 제작에 반영할걸.”
“아까 언니가 예상한 걸 따라 해본다면, 만약에 누군가 넷플릭스로 영화나 드라마를 보던 도중에 스마트폰을 자꾸 만지작거렸다면 사전에 연동된 이용 기록을 바탕으로 ‘이 사람은 이 작품을 지루하게 봤다’고 평가할 수도 있겠네?”
언니가 엄지 두 개를 치켜들었다. 칭찬이었다. 원래 컴퓨터나 기술 쪽을 좋아하긴 했는데 해온 언니의 칭찬까지 들으니 더욱 공부하고 싶다는 생각이 들었다. 아까 언니가 하기 싫은 걸 안 하려면 공부를 열심히 하라고 했는데…. 그렇다면 난 무엇을 하기 싫어서 공부해야 하는 걸까?
그들은 당신의 선택을 추천합니다
할머니는 참 주책없다. 언니와 늦게까지 놀다가 들어오니 한껏 잔소리를 시작했다. 여자애가 밤늦게 돌아다닌다고 뭐라 뭐라, 날씨 쌀쌀해졌는데 옷차림이 가볍다고 쫑알쫑알. 그러다 갑자기 언니를 자기 앞에 앉혀 놓고는 나이를 물었다. 스물넷이라고 하니 선볼 생각 없냐고 했다. 내가 못 살아. 요즘 누가 대학생 때 선을 보나.
“해온 학생은 남자친구 있어?”
“없어요.”
언니는 슬쩍 웃으며 대답했다.
“그럼 좋은 사람 있는데 한 번 만나볼래?”
“아뇨. 괜찮아요. 공부하기도 바빠서 연애 못해요. 아직 생각해본 적도 없고요.”
할머니는 잠깐 정색했지만 순간 자상한 표정으로 바꾸며, “누가 시간 있어서 연애하나. 다들 바쁘게 살면서 연애도 하고 결혼도 하고 애도 낳는 거지. 생각하고 준비 다 하고 만나면 아무것도 못해”라고 말했다. 나에게 날아오던 화살이 다른 사람에게 날아가니 다행이긴 했지만 착한 언니가 마지못해 받아주는 것도 모르는 할머니는 참 구제 불능이다. 할머니는 가방에서 수첩을 꺼내더니 사진과 신상정보를 언니에게 들이밀었다. 세 사람쯤 소개받던 중이었나? 방에 있던 휴대폰 벨이 울려서 언니는 겨우 탈출했다.
자기 전에 노크하고 언니 방에 들어갔다. 해온 언니는 컴퓨터를 펼쳐놓고 뭔가 하고 있었다.
“내가 대신 사과할게. 우리 할머니가 좀 그래. 오지랖쟁이야.”
“할머니들이 다 그렇지. 괜찮아.”
내 머리를 쓰다듬어줬다. 노트북 컴퓨터 화면에는 페이스북이 떠 있었다.
“언니도 페이스북해?”
“응. 아라는 안 해? 요즘 학생들 많이 하던데.”
“아직 SNS는 하고 싶은 생각이 안 들어. 필요성도 모르겠고. 언니가 준 스마트폰은 그냥 친구들하고 대화하거나 자료 검색할 때, 동영상이나 음악 감상할 때만 써.”
페이스북 화면에는 몇몇 사람이 올린 글과 사진이 보였다. 문득 궁금했다.
“페이스북은 왜 하는 거야?”
“기본적으로는 지인들이 뭐 하고 사나 구경하려고 하는 거고, 특정 인물이나 단체를 팔로잉하면 그들이 올린 글을 가만히 앉아서 받아볼 수 있어. 사진도 보고 동영상도 보고 뉴스도 보고.”
“그래? 난 페이스북은 개인들이 자기 뭐하고 사는지 소식이나 올리는 사이트인 줄 알았는데 뉴스 사이트랑 비슷하네?”
“페이스북을 만든 마크 저커버그도 페이스북은 미디어 기업이라고 했어. 단순히 개인의 소식을 올리는 곳이 아니라 기업 소식도 올리고 광고도 올리고 뉴스뿐 아니라 각종 형태의 미디어를 다 올리는 플랫폼으로 만드는 게 목표인가 봐. 실제로도 그렇게 나아가고 있어.”
언니는 페이스북이 유튜브를 넘어서고 있다고 했다. 상식적으로 납득이 안 됐다. 글과 사진을 보는 데는 많은 시간이 안 필요하잖아. 유튜브에 올라와 있는 동영상을 보려면 짧게는 몇 분에서 몇십 분 이상 봐야 하는데 어떻게 페이스북을 유튜브보다 더 오래 쓸 수 있지?
“의외로 많은 사람이 원하는 동영상을 직접 찾기보단 미리 구독해둔 동영상을 한곳에서 가만히 보기를 원해. 언론사 뉴스 영상이나 웹드라마 같은 것도 그렇고 재밌는 영상도 미리 좋아요를 누른 뒤 알아서 뉴스피드에 뜨면 클릭하는 거지. 또 지인들이 좋아하고 공유하는 영상을 함께 보며 댓글로 의견을 나누기도 하고. 이제 페이스북은 단순히 여러 미디어를 올리는 운동장 같은 공간이 아니라 그 자체가 세상의 모든 자료를 삼키고 있는 블랙홀이 되고 있지. 굳이 밖에 나갈 필요가 없어진 거야.”
그냥 카톡이나 카스 같은 SNS 사이트인 줄 알았는데 아니었다니. 조금 놀랐다.
“그럼 구글은? 구글이 더 큰 회사 아냐? 모든 자료를 검색할 수 있잖아.”
“구글도 엄청난 회사긴 한데 한계가 있어. 검색할 땐 구글을 이용하지만 원하는 자료를 찾은 뒤엔 더이상 그 사이트에 머물 필요가 없지. 따라서 어떤 힘을 행사할 기회도 없어. 필요한 정보를 정확하게 찾아주는 것으로 역할을 다 하는 거니까. 그래서 구글은 열심히 다른 종류의 회사들을 인수하고 육성하고 있지. 검색만으로는 한계가 있는 걸 알고 있는 거야.”
페이스북은 알아서 맛있는 음식을 갖다 주는 호텔 룸서비스고 구글은 매번 먹을 걸 골라야 하는 푸드 코트일까?
“아까 할머니가 남자친구 소개시켜준다고 했잖아? 거기도 알고리즘이 들어간다.”
“진짜? 어떻게?”
“많은 소개팅 앱은 이용자들이 사전에 입력한 취향과 조건에 따라 가장 적당한 짝을 소개시켜줘. 그때 최적의 결과를 이끌어내기 위해 각종 알고리즘을 동원하지. 가까운 곳에 사는 사람끼리 매치해주거나 원하는 성격, 키, 직업 등으로 판단하기도 하지. 또 잘 생기고 예쁜 사람만 뽑아서 이어주는 앱도 있고 심지어는 예전 남친 여친의 얼굴과 닮은 사람을 연결시켜주는 앱도 있어. 아마 너희 할머니도 나름대로의 알고리즘을 갖고 소개시켜주셨을 거야.”
“에이, 그럴 리가….”
“진짠데. 주변에 나이 잔뜩 먹고 장가 못 간 아들들은 많은데 그들은 어떤 여자를 좋아할까? 젊은 여자! 마침 내 집에 젊은 여자가 세 들어 사네? 그럼 됐다. 일단 만나게 해주자. 뭐 이런 아주 단순한 알고리즘이지.”
언니는 웃었다. 정말 할머니가 그런 식으로 생각하셨을까? 하긴, 아까 수첩에 적힌 사람을 보니까 나이 마흔 돼서 영화 만든다고 빈둥대고 있는 옆집 장 씨 아저씨도 있는 걸 보면 별다른 고민은 없었던 것 같다. 잠시 정적이 흘렀다. 그리고,
“아라야! 넌 정신 똑바로 차리고 정말 네가 원하는 거, 네게 필요한 걸 선택하면서 살아야 돼. 주변에서 아무리 좋은 거라고 추천해도 고민 없이 순순히 따르고 그러면 안 돼.”
갑자기 무슨 소리지? 언니의 분위기가 진지해졌다.
“페이스북의 뉴스피드 알고리즘도 그렇고 구글의 검색 알고리즘도 그렇고, 사람들은 다들 자기가 구글이나 페이스북을 이용해서 원하는 정보를 찾고 있다고 생각하지만 천만의 말씀이야. 오히려 그들은 운영자와 프로그래머들이 짜놓은 알고리즘에 따라 생각하고 결정할 뿐이야. 그저 주어진 결과만 수동적으로 받아보고 있는 거지.”
언니는 필터 버블을 언급했다. 예전에 가짜뉴스가 떠들썩했을 때도 해줬던 말이다. 평소에 친하게 지내는 사람들만 팔로잉하다 보면 비슷한 성향의 소식만 받아보게 된다고. 얼핏 보면 다양한 의견을 접하고 있는 것 같지만 사실 알고 보면 매우 편향된 정보들만 받아보게 된다고 했다.
또 구글이나 네이버에서 검색할 때도 조심해야 한다. 그저 많은 광고비를 낸 사이트를 검색 결과 맨 위에 띄울 수도 있고, 자사 블로그에 있는 정보를 먼저 보여줄 수도 있다. 검색어 자동완성이나 실시간 검색어라는 편해 보이는 기능을 통해서 사람들의 관심사를 매우 좁게 만들 수도 있다.
그 모든 게 다 알고리즘이었구나. 그럼 나같이 평범한 사람들이 할 수 있는 게 있나? 세상 모든 정보의 옳고 그름을 따질 수도 없고 어떤 알고리즘이 더 정확한지 판단할 능력도 없는데?
“편리하려고 만든 알고리즘이 이젠 사람들의 사고를 지배하고 있어. 음악을 랜덤으로 들을 때조차 알고리즘이 짜놓은 방식대로 듣게 되는 거지. 알고리즘은 중립적이지 않아. 누군가의 가치가 반영되고 어떤 이유로든 편향될 수밖에 없어. 만약 고민 없이 알고리즘이 시키는 대로 살다 보면 누군가의 의도대로 사는 게 되는 거야. 정말 네가 네 삶의 주인이 되고 싶다면 너만의 알고리즘을 찾아야 해.”
이후로도 언니는 뭔지 모를 말을 계속 떠들었다. 종일 돌아다녀서인지 언니의 말이 한쪽 귀로 빠져나갔다. 그런데 순간 이상한 걸 발견했다. 모니터에 떠 있는 페이스북 창이 두 개였는데 하나는 김해온, 하나는 이효정이었다. 이효정…. 예전에도 언니 책에서 봤던 이름이다. 계정을 두 개 쓰나? 아무리 그래도 성이 다른 건 좀 이상하지 않나? 뭐지? 물어볼까? 언니는 이런 내 고민도 모른 채 한참 동안 알고리즘에 대해 떠들다 잠들었다.
원문: 진보적 미디어운동 연구저널 ACT! / 필자: 주일
참고
- 알고리즘에 대한 TED.com 영상(한글 자막)
- 영화 추천 기술과 서비스(한국콘텐츠진흥원)
- 음악 취향과 빅데이터(한국콘텐츠진흥원)
- 스포티파이 음악 추천 알고리즘에 대한 글
- 스포티파이 소개 글
- 스포티파이 러닝 홍보 영상
- 애플뮤직 음악 추천 서비스에 대한 글
- 넷플릭스 추천 알고리즘에 대한 글
- 넷플릭스 오리지널 시리즈 제작에서 빅데이터 활용 비중에 대한 반론 1
- 넷플릭스 오리지널 시리즈 제작에서 빅데이터 활용 비중에 대한 반론 2
- 왓챠의 추천 알고리즘에 대한 글
- 넷플릭스 알고리즘 대회 이야기
- 넷플릭스 알고리즘을 체험해보는 순서도
- 음악 영화 업체의 빅데이터 촬영 사례 기사
- 가장 많은 시간 이용하는 SNS서비스는 페이스북
- 20억 명이 이용하는 페이스북
- 소셜 데이트 앱 30가지
- 구글 검색(자동완성) 알고리즘에 대한 글
- 구글 검색 방법 설명에 대한 공식 사이트(영문)
- 페이스북 알고리즘에 대한 글
- 최적의 여행 경로를 찾는 법에 대한 글
- 시 쓰는 인공지능에 대한 TED.com 영상(한글 자막)