언젠가부터 버즈피드는 세계적으로 언론사들의 화두가 됐다. 버즈피드를 사례로 드는 게 식상할 정도다. 2014년 9월 기준으로 월간 순 방문자수가 1억 5000만 명. 소셜 네트워크 유입이 75% 이상이고 모바일 트래픽 비중이 60% 이상이다. 버즈피드의 발행인(publisher), 다오 능웬(Dao Nguyen)은 “버즈피드 뉴스 서비스의 지표는 철저하게 페이지뷰를 늘리는 방향과 소셜 공유를 늘리는 방향, 이 두 가지 요소를 극대화하는 방향으로 설계된다”고 설명한다.
결국 잘 팔릴 것 같은 기사에 집중한다는 이야기다. 모든 뉴스를 다 만들어야 하는 전통적인 뉴욕타임스 등과는 애초에 출발선이 다른 셈이다. 뉴욕타임스는 2014년 5월 유출된 뉴욕타임스 혁신 보고서에서 “우리는 리스티클이나 고양이 동영상 따위나 만드는 버즈피드를 우습게 취급해도 되느냐”고 반문하기도 했다. 버즈피드는 가십성 이슈로 트래픽을 끌어모았지만, 본격적으로 기자들을 뽑고 전통 저널리즘으로 영역을 확장하고 있다.
버즈피드의 데이터 전략을 총괄하고 있는 능웬은 굉장히 독특한 캐릭터다. 1974년생이고 하버드대 출신의 데이터 전문가로 버즈피드에는 2012년에 합류했다. 데이터 부문 부사장을 맡다가 2014년 10월 발행인으로 승진했다. 그 2년 동안 능웬은 새로운 편집 방향과 소셜 미디어 전략, 데이터 테크놀로지를 동원해 버즈피드의 월간 순방문자 수를 2,800만 명에서 1억 5,000만 명으로 다섯 배 이상 끌어 올렸다.
방문자를 다섯 배 늘린 데이터 과학의 마법
능웬은 이렇게 말하곤 했다. “데이터 분석은 무슨 일이 일어나고 있는지 말해 줄 수 있지만, 그 일이 왜 일어나는지는 말해주지 못한다. 한계를 받아들여야 한다. 데이터를 적절하게 활용하려면 꾸준한 실험과 피드백을 병행해야 한다. 우리는 전체의 일부를 알 수 있을 뿐이고 그 결과는 반복해서 적용할 수가 없다.” 데이터를 분석하고 가설을 세우고 오류를 보정하는 작업을 계속한다는 이야기다. 능웬은 이런 원칙을 시스템화했다.
우리가 버즈피드에 접속하는 순간부터 개인정보가 빠져나간다. 로그인이 돼 있는지 안 돼 있는지 확인하는 건 기본이고 성별과 나이 정보는 입력돼 있는지, 페이스북이 버즈피드와 연결돼 있는지, 이메일 업데이트는 활성화돼 있는지 등등을 체크하고 부족하다면 확인하라고 권유한다. 버즈피드는 내가 이 사이트에 몇 번이나 방문했는지 어떤 기사를 읽었는지 모두 알고 있다.
여기까지는 일상적인 정보 수집이라고 할 수 있다. 그러나 한 컴퓨터에서 다른 브라우저로 두 개의 다른 계정으로 버즈피드에 접속했는데 동일한 사람으로 취급하더라는 한 블로그의 글이 논란이 되기도 했다. 버즈피드가 단순히 계정뿐만 아니라 이메일이나 다른 개인정보로 이용자들을 식별하고 있다는 이야기가 된다. 더욱 무서운 일(scary bit)은 버즈피드의 대표 상품인 퀴즈를 푸는 과정에서 벌어진다.
흔히 보는 “너는 무한도전의 누구와 가장 닮았을까?” 같은 퀴즈는 심각한 개인정보가 담기지 않지만, 꽤나 사적인 정보를 기록하는 퀴즈들이 많다. 이를테면 205만 명 넘게 읽은 “당신은 특권 계급인가?” 같은 퀴즈는 당신이 백인인지, 이성애자인지, 강간이나 성추행을 당한 적 있는지 등등을 물어본다. 이 문항을 답변하면 버즈피드는 당신의 개인정보에 이 답변을 연결시켜 당신에 대해 더욱 잘 알게 된다.
능웬에 따르면 버즈피드의 문화는 시작부터 데이터 기반이었다. 이를 테면 버즈피드는 거의 모든 기사에 A/B 테스트를 한다. 기사를 쓰고 두 개 이상의 제목을 만들어 두 그룹의 독자들에게 노출시켜서 어떤 제목이 많이 읽히는지(클릭을 부르는지) 분석한 다음 많이 읽히는 제목을 선택해 내보낸다. 이런 과정을 통해 편집자들은 최적의 기사 길이와 헤드라인 등이 어떻게 트래픽과 연결되는지 체득하게 된다.
능웬은 “섹시한 헤드라인으로는 부족하다”면서 “제목이 약속한 콘텐츠를 본문에서 충분히 담고 있어야 하고 충분히 쉐어러블(sharable)해야 한다”고 강조한다. “우리는 사람들이 인터넷을 켜면 버즈피드가 아니라 페이스북이나 트위터로 간다는 걸 알고 있다. 우리는 그 플랫폼에 올라타고 거기서 바이럴을 만들면 된다.” 굳이 방문자를 끌어모으기보다 콘텐츠를 많이 퍼뜨리는 이른바 멀티 플랫폼 전략이다. 어디서 읽든 읽기만 하면 된다는 발상의 전환이 필요하다.
어떤 콘텐츠가 쉐어러블한가
버즈피드의 전략과 산업 개발 담당 부사장 조너선 페렐만(Jonathan Perelman)은 “콘텐츠는 왕이고 유통은 여왕”이라고 말한다. 브랜드를 홍보하는 것 못지않게 소비자들과 공명하는 게 중요하다는 의미다. 콘텐츠는 반드시 기능적일 뿐만 아니라 감성적이어야 하고 결국에 공유할 수 있는 형태와 내용을 담고 있어야 한다는 게 버즈피드의 콘텐츠 전략이다. 콘텐츠는 바이럴 센세이션을 불러일으킬 수 있도록 소셜 친화적인 형태여야 한다는 이야기다.
버즈피드의 독특한 콘텐츠 전략은 애초에 배너 광고가 핵심 수익모델이 아니기 때문일 수도 있다. 불특정 다수에게 노출되는 배너 광고는 페이지뷰와 클릭률이 매출의 변수지만, 버즈피드는 배너 광고보다는 네이티브 광고에서 돈을 번다. 배너 광고는 기사의 내용과 관계없이 많이 노출되는 게 중요하지만, 네이티브 광고는 기사를 읽도록 만들고 공감을 끌어내는 게 중요하다. 그 기사를 굳이 버즈피드에 방문해서 읽을 필요는 없다.
아마존이 당신이 무엇을 사고 싶어 하는지 안다면 버즈피드는 당신이 무엇을 클릭하고 무엇을 공유하고 싶어하는지를 안다. 버즈피드는 노하우를 타임이나 폭스뉴스 등에 전수하고 독자 데이터를 받기도 한다. 만약 여러 언론사의 데이터를 교차 집계할 수 있다면 독자들에 대한 더 풍성한 데이터베이스를 구축할 수 있다. 버즈피드가 킹피시랩을 인수한 것도 페이스북에서 바이럴 확산을 일으키는 요소가 무엇인지 연구하기 위해서였다.
능웬이 데이터 분석을 총괄한다면 실무는 데이터 팀의 디렉터 카이 할린(Ky Harlin)이 진두지휘하고 있다. 이를 테면 “당신이 가장 여름에 가봐야 할 도시 35곳” 같은 테스트는 어떤 독자에게는 파리를, 어떤 독자에게는 도쿄를 먼저 보여준다. 할린은 복합적인 순열을 이용해 A/B 테스트를 하고 그가 직접 개발한 알고리즘으로 결과를 분석한다. 이 알고리즘은 언제 어떻게 기사가 바이럴을 타는지 예측할 수 있게 해준다.
할린은 의료 영상 관련 스타트업에서 일하다가 2010년에 버즈피드로 이직했다. 버즈피드의 CEO 조나 페레티(Jonah Peretti)는 “의료 영상과 콘텐츠 퍼블리싱은 수학적 영역에서 상당 부분 겹친다”면서 “둘 다 패턴을 발견해서 이를 활용한 알고리즘을 만드는 일이기 때문”이라고 설명했다. 실제로 할린은 콘텐츠가 확산되는 경로를 추적하는 데 흥미를 보였고, 그가 합류한 뒤 유머 리스트와 GIF ‘움짤(움직이는 이미지)’의 공유 건수가 크게 늘었다.
페리티는 농담처럼 말하곤 한다. “알고리즘은 매우 중요하고 당연히 모두 톱 시크릿이다. 아무것도 말해줄 수 없다.” 할린은 버즈피드의 데이터 알고리즘을 다음과 같이 설명한다. “양적인(quantitative) 변수와 기술적(descriptive)인 변수를 둘 다 살펴보는데 양적인 변수는 페이스북에서 얼마나 많이 공유됐는가와 같은 지표이고 기술적인 변수는 그 기사의 텍스트에 어떤 내용이 담겨 있는가에 대한 지표다.”
어떤 제목이 더 읽고 싶을까
버즈피드는 여러 지표와 실제 공유 가능성(shareabliity) 사이의 상관관계를 지도로 나타내기 위해 컴퓨터 알고리즘을 가동한다. 할린은 이 알고리즘을 활용해 각각의 콘텐츠가 얼마나 바이럴을 불러일으킬 수 있는지 예측하기 위해 콘텐츠의 특성을 분석하는 수학적 수식을 개발했다. 페리티는 “콘텐츠가 확산되는 과정에서 발생하는 수많은 변수와 소셜 네트워크 지수를 분석하는 데 좀 더 투자가 필요하다고 생각했는데 다행히 할린을 만났다”고 말했다.
능웬은 “어떤 데이터가 의미를 갖고 어떤 데이터는 쓰레기고 어떨 때는 데이터를 믿지 말아야 하는지 본능적으로 안다”면서 “그는 편집과 광고 양쪽에서 놀라운 직관을 가졌는데 이건 정말 새로운 영역”이라고 설명했다. 어떤 콘텐츠가 좀 더 바이럴하고 좀 더 오래 지속되는지 분석하는 게 그의 업무지만 실제로 할린은 편집 부서뿐만 아니라 광고 부서와도 가깝게 일을 한다. 서로 다른 업무 부서에서 발생하는 문제를 연결하는 데 많은 시간을 들인다.
뉴욕타임즈에 따르면 버즈피드의 바이럴 지수는 센세이션에 가깝다. 버즈피드의 월 트래픽은 1억 5000만 건에 이른다. 버즈피드는 최근까지 쉐어러블한 콘텐츠를 만드는 데 집중해 왔으나 속보와 심층취재 기사 등을 내보내는 카테고리를 개설하는 등 영역을 확장하고 있다. 이러한 새로운 시도는 550여 명의 전문적인 데이터 분석 팀이 성공적으로 트래픽을 끌어오고 있기 때문에 가능한 일인데, 특히 핀터레스트에서 유입이 크게 늘어나고 있다.
버즈피드의 트래픽 유입량 가운데 75%가량이 소셜 미디어에서 들어오지만, 다른 전통적인 미디어 기업들과 마찬가지로 인터넷 광고 도달률이 떨어지는 문제에 직면하고 있다. 그 때문에 주문형 동영상 제작이나 네이티브 광고 등 더 수익성이 좋은 사업으로 갈아타고 있는데 자세한 숫자를 밝히기는 꺼리지만 2014년 1분기 수익이 전년 대비 두 배 가까이 늘어난 것도 네이티브 광고 덕분으로 추산된다.
트위터와 페이스북 등 소셜 미디어가 버즈피드의 주요 트래픽 유입원이지만, 페이스북이 최근 데이터 알고리즘을 바꾸면서 버즈피드의 소셜 미디어 유입량이 곤두박질치기도 했다. 결국 버즈피드의 새로운 시도들은 소셜 미디어에 대한 지나친 의존에서 벗어나는 과정이라고 할 수 있다. 버즈피드는 리스티클로 성장했지만, 최근에는 경력 기자들을 영입해 탐사 보도로 영역을 확장하고 있다. 네이버 의존도가 절대적인 한국 언론에게도 시사하는 바가 크다.
소셜 엔지니어링, 높은 플랫폼 의존도가 함정
한편으로는 버즈피드의 기사도 결국 고도로 잘 설계된 낚시질(clickbait) 아니냐는 비판도 나온다. “인터넷을 돌아다니다 보면 코니 아일랜드(뉴욕 해안의 유원지)를 거니는 것 같은 느낌을 받는다. 인터넷 신문의 기사는 놀이공원에서 소리치는 사람과 같다. ‘여기 세 발 달린 사람 구경하러 오세요.’ 호기심에 들어가서 보니 목발을 짚은 남자가 서 있었다.” 뉴욕매거진에 실린 칼럼의 한 대목이다.
버즈피드가 이 칼럼을 언급하면서 “우리는 2009년부터 낚시질을 중단했으며 낚시질이 효과가 없다는 건 더 이상 비밀도 아닌 상황이 됐다”고 자랑 아닌 자랑을 하자 덴마크의 미디어 전문가인 토마스 백달(Thomas Baekdal)이 “버즈피드의 글은 논점이 어긋났다”고 반박한 사건이 있었다. “버즈피드만의 문제는 아니지만, 버즈피드가 낚시질을 하지 않는다고 보기 어렵다”는 이유에서다.
백달이 분류한 낚시질의 첫 번째 유형은 독자들이 제대로 된 맥락과 인사이트를 얻을 수 있는 결정적인 정보를 제목에서 빠뜨리는 것이다. 제목에서 정보를 충분히 주면 클릭을 하지 않을 가능성이 크기 때문이다. 달리 말하면 이런 낚시질은 사람들의 시간을 두고 도박을 하는 거나 마찬가지다. 버즈피드의 “당신이 진실이라고 믿고 싶지 않을 17가지 사실” 같은 기사는 특별히 짜증나는 사례지만 대부분 신문에서 볼 수 있다.
또 다른 낚시질의 유형은 새로운 정보를 담고 있는 것 같으면서도 아무런 정보가 없는 경우다. 우리는 이런 기사를 날마다 신문에서 본다. 이를테면 애플 이벤트를 앞두고 수천 개의 기사가 쏟아졌는데 이 기사들은 아무런 새로운 내용이 없다. 이런 기사는 아무 것도 말해주지 않음으로써 아무것도 알지 못한다는 좌절을 부추긴다. 세상은 기자들이 생각하는 것보다 느리게 돌아가기 때문에 가끔 기사 쓸 게 없을 때는 새로운 기사를 발명해내기도 한다.
아예 노골적으로 거짓말을 하는 경우도 있다. 사람들이 뭔가를 말하고 있다고 생각하게 만들면서 정작 기사에서는 그렇지 않다고 말하면 엄청난 트래픽을 끌어모을 수 있다. 이런 기사를 우리는 숱하게 본다. 제목에서는 뭔가를 말하고 기사에서 이를 뒤집는 이런 기사는 클릭하기 전까지 진실이 아니라는 걸 알 수 없다. 이런 기사를 쓰면서 기자들은 진실을 말하고 있는 것처럼 포장하는데 독자들을 기만하는 일이다. 이런 미친 짓을 그만둬야 한다.
카피 앤 페이스트 방식의 콘텐츠는 또 다른 형태의 낚시질이다. 불펌 콘텐츠에 눈길을 끄는 제목을 내걸고 클릭을 유도해 돈을 버는 건 사기에 가깝다. 업워디를 비롯해 대부분의 바이럴 사이트의 수익모델이다. 이들은 낚시질이 아니라 큐레이팅이라고 말할지도 모른다. 그렇지만 이건 사기다. 15년 동안 관찰한 결과 이런 유형의 낚시질은 이메일에서 커뮤니티로, 블로그로, 검색엔진 최적화로, 그리고 이제 소셜 네트워크로 진화했다.
백달은 “이런 사이트들은 당장 폭발적인 트래픽을 즐기고 있겠지만, 이들이 의지하고 있는 서비스에서 콘텐츠 스팸을 제거하기 위해 알고리즘을 바꾸면 사라질 트래픽”이라고 비판했다. “디맨드미디어를 비롯해 검색엔진 최적화로 장사를 했던 언론사들이 어떻게 됐는지 돌아보라”는 이야기다. 몇 년 전 디맨드미디어는 ‘뉴미디어의 업워디’ 같은 존재였지만 트래픽도 사라지고 명성도 사라졌다.
요즘 유행하는 바이럴 사이트들에서도 비슷한 일이 벌어지고 있다. 이들의 명성은 클릭을 얻을 수 있는 동안만 지속된다. 페이스북은 알고리즘을 바꾸기 시작했고 바이럴 사이트들은 가까운 미래에 우리의 시야에서 사라지게 될지도 모른다. 이게 낚시질 콘텐츠 사이트들의 운명이다. 이들의 수명은 매우 짧다. 버즈피드가 펌질 콘텐츠뿐만 아니라 자체 제작한 콘텐츠도 만들기 때문에 써드파티 사이트의 알고리즘 변화에 덜 영향을 받는 건 사실이다.
마지막으로 사람들의 마음을 속이도록 만든 낚시질 콘텐츠도 있다. 소셜 엔지니어링이라 부르는 이런 콘텐츠들은 코카인처럼 위험하다. 물론 코카인이 바이럴 콘텐츠보다 훨씬 나쁘고 낚시질 콘텐츠를 읽는다고 해서 죽지는 않는다. 그렇지만 본질은 거의 같다. 단순히 제목의 문제가 아니라 우리의 두뇌가 감내해야 하는 감정의 경험의 문제다. 만약 이런 낚시질을 하지 않았다면 클릭하지 않았을 기사와 진짜 읽고 싶어서 읽는 기사의 차이는 크다.
버즈피드가 쓴 “당신이 진실이라고 믿고 싶지 않을 17가지 사실” 가운데 8번째는 “아프리카와 가장 가까운 주는 메인주”라는 사실이다. 이건 사람들이 읽고 싶은 뭔가가 아니다. 그렇지만 버즈피드는 사람들이 이걸 읽도록 만든다. 이건 콘텐츠가 아니라 마약이다. 사람들을 속일 수 있는 동안만 효과가 지속된다. 백달은 “이것은 미디어의 미래가 될 수 없다”면서 “더 많은 트래픽을 얻는 장기적인 전략도 될 수 없다, 단순히 낚시질일 뿐”이라고 지적했다.
데이터 적합형 콘텐츠, 누구에게 읽힐 것인가를 결정하라
허핑턴포스트는 버즈피드의 친정 같은 느낌이랄까. 버즈피드의 핵심 임원들 가운데 허핑턴포스트 출신이 많다. 허핑턴포스트의 편집자들은 커스터마이징할 수 있는 관리자 화면에서 어떤 이슈가 뜨고 있는지, 어떤 기사가 읽히고 있는지 실시간으로 확인하고 즉각적으로 대응할 수 있다. 관리자 화면에는 소셜 미디어 유입량과 검색유입 경로, 키워드, 댓글, 태그 등 다양한 빅데이터가 표시된다.
허핑턴포스트의 최고경영자 지미 메이만(Jimmy Maymann)은 빅데이터를 활용해 독자들의 경험(Reader’s experience)을 향상시키는 것이 독자들뿐만 아니라 사이트의 트래픽을 향상시키는 데에도 도움이 된다고 말한다. 허핑턴포스트는 하루에 500개에서 1,600여 개의 기사를 만들어 내는데, 이 가운데 각각의 독자에게 도달하는 기사는 데이터 분석을 통해 최적화된다. 이른바 ‘데이터 적합형 콘텐츠’ 전략이다.
A/B 테스트도 버즈피드와 비슷하지만, 검색용 헤드라인을 따로 뽑는 건 허핑턴포스트의 전략이다. 두 개의 헤드라인을 독자들에게 제공하고 클릭 수가 많은 헤드라인을 노출한다. 메이만은 “우리는 항상 A/B 테스트를 시도한다”고 말했다. 네오데이터그룹에 따르면 허핑턴포스트는 A/B 테스트에 어도비의 ‘테스트&타겟(Test & Target)’이라는 소프트웨어를 활용한다. 메이만은 “데이터 분석이 뒷받침되지 않으면 불가능한 일”이라고 말한다.
이를테면 아이를 가진 부모들은 아이가 잠든 저녁 시간과 주말에 유입이 늘어난다. 이들을 대상으로 잡으면 기사를 바로 발행하기보다는 저녁 시간을 기다려 발행하는 게 효율적이다. 실제로 “갓난아기와 같이 사는 것이 감옥에서 사는 것과 마찬가지인 10가지 이유”라는 기사는 7시간 동안 2만 4천 뷰를 기록했다. 이 기사의 경우 낮 시간에 내보내는 것보다 41% 가까이 트래픽이 늘어난 것으로 분석하고 있다.
버즈피드와 허핑턴포스트의 놀라운 성장은 주류 전통 언론에 충격을 줬다. 뉴욕타임즈도 혁신 보고서에서 이렇게 평가하고 있다. “버즈피드나 허핑턴포스트, USA투데이의 성공은 단순히 리스트나 퀴즈, 유명인들의 사진, 스포츠 기사에 기인한 것이 아니다. 때로는 콘텐츠의 질이 낮아도 그들이 성공하는 이유는 그들이 가진 정교한 소셜, 검색, 커뮤니티 생성 등의 도구와 전략 때문이다.”