<숫자에 속아 위험한 선택을 하는 사람들> 게르트 기거렌처 지음 (전현우, 황승식 옮김), 살림, 2013
확률과 통계가 어려운 이유: 표기법이 잘못됐기 때문
개인적인 히스토리 하나 먼저 이야기해야 할 것 같습니다. 이 책에서는 통계적 확률을 제대로 해석할 수 없는 개인의 특성을 지칭하여 ‘계산맹’이라고 표현했습니다만, 저는 여전히 ‘산수맹’에 가까울 때가 있습니다. 이 분야의 기록 중 가장 인상적인 것은 고등학교 2학년 기말시험 때, 수학과목 ‘0점'(제대로 읽으신 것 맞습니다)이라는 전무후무한 점수를 남긴 것이죠. 당시 시험범위의 대부분이 ‘확률과 통계’였죠.
이 책은 그런 의미에서 저에게는 힐링서적과 비슷합니다. ‘얘야, 확률과 통계가 두려운 건 니가 멍청해서 그런 게 아니란다. (음.. 조금은 그럴지도 몰라. 하지만 근본적으로) 표기법이 잘못 돼서 그런 거란다’라고 저자가 줄기차게 주장하고 있기 때문이죠.
0.1%라 하지 말고 1,000명 중 1명이라 이야기한다면?
저자인 게르트 기거렌처는 인지심리학계의 거목 중 하나로 막스플랑크협회 인간개발연구소 소장입니다. 기거렌처는 위험과 불확실성을 이해하고 이를 명료하게 소통하는 것에 대한 관심이 지대한데요, 이는 아마도 건강권이나 법적 자유와 같이 개인의 삶과 직결된 전문적 판단에 있어 불확실성을 인정하고 판단자와 수용자가 명확하게 소통하는 것이 인간의 삶에 중요한 영향을 끼치기 때문일 것입니다.
“왜 수준 높은 교육을 받은 사람들조차 확률이라는 재료로 추론하는 과제를 잘 수행하지 못하는가? 한 가지 이유는, 불확실성 또는 불완전한 정보를 기초로 하는 추론에 기반을 제공하는 이론인 확률이론이, 인류의 역사에 비춰보면 비교적 최근에 발전한 분야이기 때문일 것이다.” – 56p.
“역사적으로 최근에서야 불확실성을 표현하는 도구로 확률과 백분율이 등장했다. (…) 20세기 후반부에 이르러서야 확률과 백분율은 일기예보나 야구 통계처럼 불확실성에 대한 표현으로 정착했다. 결국, 인간의 마음은 진화과정 내내 위험을 확률이나 백분율로 나타내는 방법을 배우지 못했다고 할 수 있다.” – 71p.
생각해보면 제가 아주 어릴 때-그러니까 ‘감기조심하세요~’ 기상캐스터님 있을 때-만해도 일기예보를 보면 ‘내일은 비가 올 것으로 예상됩니다’라고 말했던 것 같습니다. ‘내일 강우확률은 OO퍼센트가 되겠습니다’와 같은 표현은 최신 표현인 것이죠. 저자는 아직 우리의 인지력이 확률이나 백분율을 통해 위험을 직관적으로 받아들일만큼 발전하지 못하지 않았나 추측합니다. 그렇다면 거꾸로 우리가 사용하는 확률을 직관적으로 받아들일 수 있도록 표현하는 것이 중요하지 않은가, 라고 주장합니다.
“표기법이 문제가 된다는 증거는 인간의 비합리성을 나타내는 징표로 간주됐다. 하지만 이런 생각은 훌륭한 표기법을 찾아내는 것이 문제를 푸는 핵심이며 서로 다른 표기법을 사용해보는 것 또한 창조적 사고를 하는 데 좋은 도구가 될 수 있다는 사실을 무시하는 관점이다.” – 73p.
그렇다면 훌륭한 표기법이란 무엇일까요? 저자는 핵심적인 방법으로 ‘자연빈도’를 이야기합니다.
“왜 확률이나 백분율보다 ‘자연빈도’로 정보를 표기하는 것이 사람들을 개안시키기 쉬울까? 여기에는 두 가지 이유가 있다. 먼저 계산하기가 간단하기 때문이다. 표기는 계산의 일부분이다. 그리고 진화적이고 발달적인 우선성이 있다. 우리의 마음은 자연 빈도에 적응되어 있기 때문에, 이를 더 자연스럽게 받아들인다.” – 66p.
간단히 말해 자연빈도는’ 0.1%’로 표현된 것을 ‘1,000명 중에 1명’으로 표현하는 것입니다. ‘니 지금 내를 바보로 아냐?’하실 분들이 계실 것이나 이게 중첩되어 조건부확률이 되면 지금 수능을 앞둔 고3 학생들이 낑낑거리며 골치 아파하는 것처럼 퍼센티지로 표시하는 것이 잘 와닿지 않게 됩니다. 저명한 예는 메디컬옵저버뉴스에 나온 이 책의 역자인 인하의대 황승식 교수 인터뷰 앞부분에 있는 유방선별검사에 대한 #1, #2를 찬찬히 읽어보시면서 문제를 풀어보시기 바랍니다.
#1. 여성의 유방암 발생 확률은 0.8%이다. 유방암에 걸렸을 경우 유방촬영술에서 양성이 나올 확률은 90%이다. 유방암에 걸리지 않더라도 유방촬영술에서 양성이 나올 확률은 7%이다. 한 여성이 유방촬영술 검사에서 양성이 나왔다면 실제로 유방암에 걸렸을 확률은 얼마일까?
#2. 1000명 중 8명의 여성이 유방암에 걸린다. 8명 중 7명에서 유방촬영술 검사결과 양성이 나온다. 유방암에 걸리지 않은 992명 여성 중 70명에서도 유방촬영술 결과 양성이 나올 것이다. 유방촬영술 양성 중 얼마나 많은 여성이 유방암에 걸렸을까?
#1을 보고 멘붕에 빠졌다면 정상입니다. 그러고 나서 #2를 보고 #1에 비해 이건 할만한데, 라고 느끼시게 될 것입니다.
이 수술로 사망률 80%가 감소했다고요?: 병원과 제약회사에 유리한 수치를 막는 법
또한 중요한 방법으로 비교위험도를 직접위험도로 이야기하는 것입니다. 예를 들어, 유방암 고위험군 환자에서 예방적 유방절제술을 하면 100명당 1명이 사망하고 절제술을 시행하지 않으면 100명당 5명이 사망한다고 칩시다. 이때 비교위험도 감소는 (5명 중 4명이 목숨을 건졌으므로) 80%가 감소한 것이 됩니다. 그런데 이걸 절대위험도 감소로 이야기하면 (100명 중 5명에서 1명으로 줄었으므로 )100명 중 4명, 즉 4%가 됩니다. 80%와 4%. 천양지차죠.
‘유방암을 예방하기 위해 예방적 유방절제술을 시행하겠습니까?’라고 물어볼 때 두 수치 중 비교 위험도 감소만 제시된다면 어지간해서는 하려고 할 겁니다. 그런데 절대 위험도를 제시한다면 이야기가 달라지죠. 그렇다면 왜 사회는 비교위험도를 선호하는가? 저자는 여기에 여러 가지 이유가 있겠지만, 기본적으로 사인, 직능군, 기관 등의 정치경제적 이해관계가 주요한 이유가 아닌가, 라고 견해를 제시합니다.
“계산맹 상태인 상대방에게 깊은 인상을 심어주고 싶어하는 사람 또는 기관은 일반적으로 치료의 이득을 비교 위험도 감소로 발표한다. (…) 비교 위험도에 따른 용어로 이득을 표기하는 행위는 종종 조직론을 통해 설명될 수 있다. 예를 들어 의학 연구비 지원서를 심사하는 의료 당국이 계산맹 상태에 빠져 있으므로, 지원자들은 좀 더 인상적으로 보이는 비교 위험도 감소로 보고해야 한다는 강박을 종종 느낀다.” – 84p.
“왜 위험 소통을 투명하게 할 수 없는 것일까? (…) 한 가지 답변은 계산맹 상태가 악용될 수 있다는 데서 찾을 수 있다. 수를 불투명하게 다뤄도 무방하다는 것이 ‘탈계산맹’들이 지닌 이점이다. (…) 계산맹인 사람이 확연히 줄어들지 않는 한 투명한 위험 소통은 가능할 것 같지 않다.” – 272p.
가령, 건강관리에 관한 프로젝트를 따기 위한 보고서를 작성하는 1) 입안 전문가들은 위험이 과대평가되어 인지되게 하는 편이 유리하겠죠. 또한, 대중의 불안감이 판매량에 직결되는 2) 제약업계에서 나오는 리플렛 역시 대부분 비교위험도로 서술되고 있습니다. 그리고 진료나 시술하는 횟수에 따라 보상을 얻게 되는 나라의 3) 의사나 병원 코디네이터 역시 되도록이면 의료행위를 많이 할 수 있도록 방향을 선호할 것입니다.
의사와 법률인도 확률과 통계가 어렵다
3)에서 문제가 생깁니다. ‘대중들의 계산맹을 이용해 의사들이 이득을 취하고 있다’라는 결론에 이르게 되면 의사들은 ‘탈계산맹’이라는 전제가 깔려 있어야 합니다. 하지만 의사, 법조인들을 대상으로 연구를 한 기거렌처는 의사들 역시 계산맹이기 때문에 불평등하고 불명확한 소통이 생기는 것을 강조합니다.
“바람직하게도, 점점 더 많은 의사들이 근거 중심 의료를 적용하고 있다. (…) 의사와 환자가 의학적 치료 방법에 대해 함께 결정하는 것이 이상적이다. 이때 의사는 가능한 치료가 무엇이 있고 어떤 효과를 낼지 전문가로서 의견을 제시해야 한고, 환자는 자신이 원하는 것과 필요한 것이 무엇인지 결정하는 데 참여해야 한다. 하지만 불행하게도 실제 의학적 결정은 이런 건전한 이상에 도달하는 데 종종 실패한다. (…)
WHO대표는 미국에서 진료를 하는 의사들의 40퍼센트만이 환자를 치료하는데 과학적 근거에 기반해 치료방법을 선택한다고 밝혔다. (…) 근거 중심 의료에 대한 이와 같은 저항은 아직도 많은 의사들이 통계로부터 진단적 추론을 이끌어내는 데 어려움을 겪기 때문이다.” – 123p. ~ 124p.
이 책에도 나오지만 의과대학의 통계학과정에서 카이스퀘어, T값, P값 등 유의성 검정방식을 배우는 것만으로도 벅차기 때문에 바른 진단과 위험 평가, 위험 소통 등에 통계적 사고의 방식은 고사하고 중요성을 배우는 경우도 거의 없습니다. (308p.) DNA 지문증거와 같이 과학적 증거가 형사사건의 주류가 되어가고 있는 법조계의 경우는 더욱 안습입니다. 과학적 증거라는 것은 실질적으로 불확실성을 지니게 되는 것임에도 로스쿨에서 불확실한 증거에 기초하여 통계적으로 추론하는 방법론을 배우는 곳은 전무하다고 하니까요. (309p.)
여기서 나온 ‘과학적 증거가 불확실하다’는 표현은 조심스러우면서도 중요합니다. 한편으로는 ‘과학적’이라는 수사 때문에 확신의 함정이 생기고 이것이 계산맹의 근원이 되어 사회적 비용을 만들어내기도 하지만, 한편으로는 한국 사회에 만연한 과학적 기반을 무시하는 태도로 인해 생기는 사회적 비용 역시 만만치 않기 때문입니다.
특히 사이비의료나 유사의료의 피해자들을 자주 접하게 되는 의사들은 그러한 치료를 받은 민도가 낮은 환자들에게 어디까지 정확히 이야기해야 하는지에 대해서 망설이게 되지요. 이에 대해 기거렌처는 의사들이 자연빈도나 직접비교도처럼 쉬운 표현법을 써서 불확실성에 대해 환자들이 정확히 인지하도록 하고 어떤 것이 더 불확실한지 (더 위험한지)에 대해서 환자 스스로 판단해야 한다고 단호하게 처방을 내립니다. 어떤 것이 맞을까요?