트럼프의 승리로 가는 길?
지구의 운명(?)을 결정하는 미 대선이 트럼프 대 클린턴이라는 대진표를 완성했다. 오랫동안 주류 정치인으로 활동해왔던 힐러리 클린턴은 신선함이 떨어지며 가식적이라는 이미지가 약점이다. 한편 다크호스로 화려하게 등장해 결국 공화당의 대선 주자 자리까지 따낸 도널드 트럼프는… 막말로 유명하다(…).
이런 구도가 짜여졌으면 보통은 클린턴의 무난한 승리를 예상하겠지만, 현실은 그렇지 않다. 양당 전당대회 이후 클린턴이 앞서가는 건 사실이지만, 일부 언론에서 트럼프가 앞서가는 여론조사 결과를 내놓는 등 게임이 끝난 건 아니다. 특히 LA 타임즈는 타 언론사와 달리 트럼프에 유리한 여론조사 결과를 잇따라 내놓고 있으며, 한국에도 이런 소식이 전해지며 많은 사람들을 충공깽에 빠뜨리기도.
왜 그런 여론조사가 나왔는가
LA 타임즈는 자사의 독특한 방식 때문에 다른 언론과 달리 ‘정확한’ 여론조사 결과를 제공하고 있다고 주장하지만, 대부분의 통계 전문가들은 뜻을 달리한다. 538의 네이트 실버는 이렇게 말한다.
- Leave The LA Times Poll Alone!, FiveThirtyEight
요약하자면 이렇다. LA 타임즈의 여론조사는 응답자들이 2012년 대선에서 누구를 찍었다고 대답했는가를 기반으로 가중치를 부여한다. 그건 실수일 수 있는데, 사람들은 종종 지난 선거에서 자신의 투표에 대해 거짓말을 하거나 잘못 기억하곤 하기 때문이다.
이 점을 좀 더 자세히 설명하는 글을 찾아보자.
- The Favorable Poll for Donald Trump Seems to Have a Problem, The Upshot, The New York Times
LA 타임즈의 여론조사는 패널 조사 방식을 채택하고 있다. 패널을 선정한 뒤 이 패널을 대상으로 계속 조사를 반복하는 것. 표본이 일정하므로 조사 결과도 안정적이고, 트렌드를 읽기에 유리하다.
하지만 아무리 그래도 LA 타임즈의 여론조사는 다른 여론조사들과 너무 동떨어진 결과를, 트럼프에게 유리한 결과를 보여주는데, 이는 패널을 선정하면서 그들이 2012년에 누구를 찍었다고 대답했는가에 가중치를 두었기 때문이다. 여론조사는 응답자들에게 당시 오바마를 찍었는지 롬니를 찍었는지를 물은 뒤, 오바마에게 투표했다고 대답한 사람들을 패널의 27%, 롬니에게 투표했다고 대답한 사람들을 패널의 25%만큼 배정하였다. 나머지는 신규 유권자와 비투표자.
이런 배분은 당시 오바마와 롬니의 득표율을 고려해볼 때 비교적 합리적으로 보이지만, 사실 그렇지 않을 수도 있다. 네이트 실버가 요약한 것처럼, 사람들은 자신의 과거 투표 행위에 대해 그렇게까지 정확히 기억하고 있지 않다.
특히 낙선자에게 투표한 사람들은 자신이 누구에게 투표했는지 기억하지 못한다고 대답하거나, 전혀 엉뚱한 사람에게 투표했다고 응답하곤 한다. 실제로 무작위로 표본을 추출한 대부분의 여론조사에서, 응답자들은 2012년 당시 실제 득표율보다 훨씬 높은 비율로 오바마를 지지했었다고 대답했다. 이런 현상은 역사적으로 볼 때 꾸준히 나타났다.
따라서 2012년 대선 당시 실제 득표율에 맞춰 패널을 배정한 LA 타임즈의 선택은, 본의 아니게 공화당에 유리해진다. 낙선자인 롬니에게 투표했던 사람들이 오바마에게 투표했다고 말했거나 기억이 나지 않는다고 말함으로써, 친(親) 공화당 성향 유권자들이 실제 이상으로 패널에 더 많이 선정되는 효과가 발생하는 것이다.
물론 반드시 이런 오차가 발생하리라는 법은 없지만, 이런 패널 조사 방식이 위험한 건 분명하다. 업샷은 특히 이번 선거에서 전임자인 오바마의 인기가 높은 편이기 때문에 더욱 이런 오차가 발생할 수 있음을 지적하고 있다.
대신 이런 조사방식은 같은 응답자에게 반복해서 같은 질문을 던지기 때문에, 추이를 파악하는 데 유리하다. 업샷의 기사는 민주당 전당대회 이후 같은 기관의 여론조사에서 클린턴의 지지율이 8% 상승했으며, 이런 변화 추이야말로 이런 방식의 여론조사에서 특히 눈여겨보아야 할 부분이라고 말한다.
여론조사의 체리피킹
네이트 실버는 같은 글에서, 각 기관의 여론조사가 가질 수밖에 없는 한계, 일종의 ‘조사 기관 효과(House Effect)’를 지적한다. 각 조사 기관의 조사 방식 차이 등으로 인해 다른 기관에 비해 한 쪽으로 기울어진 모습을 보일 수밖에 없다는 것. 특히나 수많은 여론조사가 쏟아져나오는 대선이나 총선 같은 빅 이벤트에서는, 수많은 여론조사 가운데 자신이 원하는 결과를 낸 여론조사를 취사적으로 선택하는 일종의 체리피킹(Cherry Picking)이 이뤄지기 쉽다.
미국의 리얼클리어폴리틱스(RealClearPolitics)나 538(FiveThirtyEight)은 이런 체리피킹을 피해갈 수 있는 좋은 도구다. 하지만 이런 툴이 한국에서도 똑같이 성공할 것이라고는 도저히 말할 수가 없다. 당장 지난 한국 총선 여론조사들을 리얼클리어폴리틱스처럼 종합해 평균낸다면 새누리당의 180석 압승이 예상되었을 것이다.
다만 대선이라면 의미가 또 다를 것이다. 총선은 지역구별로 여론조사를 돌려야 하는 까닭에 오차 범위가 커질 수밖에 없는데 비해, 대선은 전국이 한 단위로 치뤄지는 선거이기 때문이다. 지난 대선에서도 포털과 언론사 여러 곳에서 여러 여론조사를 종합해 보여주는 서비스를 제공했던 바 있다. 하지만 서로 다른 여론조사 기관의 조사 결과를 시계열적으로 나란히 놓고 추이를 분석하는 등 아쉬운 점이 있었다. 다만 미국에 비해 규모 자체가 작다는 한계에도 불구하고, 여러 유의미한 시도 또한 존재했음을 잊지 말아야 할 것이다. 이것이 다음 대선을 전망하기 위한 좋은 밑거름이 되어줄 것이다.
원문: 임예인의 새벽 내리는 길