상관관계와 인과 관계, 그리고 역학이라는 젊은 데이터 과학
과학 철학에 대한 상세한 연구서는 많은 경우 잘 팔리지 않는다. 많은 요인이 있겠지만, 과학 자체도 어려운데 그 과학에 대한 철학은 얼마나 더 어렵겠냐는 생각이 무엇보다도 큰 걸림돌일 것이다. 과학 철학에 대한 연구를 책으로 출간해 더 많은 독자를 만나고 싶은 사람들에게, 이 걸림돌은 때로 연구 자체보다도 훨씬 넘기 어려운 장벽이다.
글쓴이는 <역학의 철학>이라는 책을 번역해 작년(2015년) 봄에 출간했다. 군대에서 병으로 복무하던 시점이었지만 상세한 교정지를 만들어 넘기던 기억이 난다. 이후 병으로 올해 7월까지 복무하면서 과학의 근본적인 쟁점을 골라 철학적으로 깊이 탐구한 책 몇 권을 수기로 옮겼지만, <역학의 철학>을 작업했던 분들과 함께 준비한 책인 <증거기반의학의 철학>을 제외하면 아직 출간 작업을 진행시킨 책은 없다. 글쓴이는 방금 언급한 장벽을 실감하고 있는 상황에 처해 있다.
그런 와중에, <역학의 철학> 판매에 대한 소식을 들을 수 있었다. <역학의 철학> 1쇄가 모두 팔려 2쇄를 찍어야 하는 상황이라는 내용이었다. 영어책도 1쇄를 모두 팔지 못한 상태라는 소식과 함께였다. 사람들이 그 이름이 무엇을 지시하는지도 잘 모르는 ‘역학’을, 그것도 철학적으로 다루는 책이 한국어권에서 영어권보다도 더 많이 팔려나갔다는 소식이니 놀라운 일이었다. 글쓴이는 1쇄에서 발견했던 몇 가지 오류나, 반드시 개선해야 하는 몇 가지 부분에 대한 수정 요구 사항이 담긴 파일을 작성하면서 깊은 생각에 빠지게 되었다.
이 실적에 감탄하며, 한국의 많은 현장 과학자들이 과학에 대한 철학적 반성에 갈증을 느껴왔다고 선포하는 것은 쉬운 일이다. 하지만 단순히 그렇게 선포하는 데는 큰 의미가 없다. <역학의 철학>이 왜 의미 있는 성과를 거두었는지, 그 요인을 상세히 분석해 두는 것이 가장 먼저 해야 할 일이다.
그것이 <역학의 철학> 1쇄에 성원을 보내 준 천여 명의 독자들, 그리고 2쇄를 구매하실 수백 명의 독자들에게, 그리고 손실이 예상되는 책을 기꺼이 출간해 준 “생각의 힘” 출판사에게 보답하는 길이라고 생각한다.
글쓴이는 <역학의 철학>이 의미 있는 성과를 거둔 요인이 다음 다섯 가지라고 생각한다.
- 역학에 대한 교과서 이외의 창구.
- 역학이 인과에 그토록 주목했던 이유가 <인과 해석 문제> 때문이었다는 점을 지적.
- 역학 연구자들이 주목하지 않았으나 역학 연구에 꼭 필요한 인식적 덕목을 발굴.
- 실제로 역학 연구자들이 씨름하는 개념적 쟁점들을 분석.
- 법률적 맥락에서 역학적 증거를 어떻게 다뤄야 하는지를 연구.
역학에 대한 교과서 이외의 창구
역학은 의학 분야 가운데서도 점점 더 중요한 분야가 되어 가고 있다. 이미 수십 년 전부터 계속된 금연 캠페인과 그로 인한 흡연율 하락은 역학 없이는 벌어지지 않았을 변화이다. 또한 수많은 사람들이 여러 해에 걸쳐 호흡기에 큰 피해를 입은 사실이 밝혀진 가습기 살균제 사건 역시 역학이 없었다면 그 전모를 밝혀낼 수 없었을 것이다.
하지만 글쓴이는 새로 만나는 사람들에게 내 책을 소개하기 위해 역학이라는 이름이 무엇을 지시하는지 설명하는 일부터 해야만 했다. 그도 그럴 것이, 역학이라는 이름을 사용하는 분야가 세 개나 있기 때문이다. 물리학 분야의 力學, 그리고 주역을 다루는 易學, 마지막으로 의학의 한 분야인 疫學까지.
이름과 이 책 사이에 얽힌 에피소드도 있다. 이 책이 막 출간되었던 2015년 3월 당시, 인터넷 서점 알라딘은 이 책을 易學 분야의 책으로 분류했다. 작업 당시 이런 하드코어 학술서가 팔리기 위해서는 易學으로 이 책이 분류되는 것이 훨씬 더 낫지 않겠느냐는 농담을 가끔 하기는 했으나, 정말로 이런 일이 일어날 줄은 몰랐다. 며칠 뒤 분류가 바로잡히기는 했지만, 역학이라는 이름이 얼마나 낯선 것인지 다시 한번 확인할 수 있는 일이었다.
이런 상황은 일정 부분 역학에 대해 믿을만한 교양서적이 없었다는 점에서 유래할 것이다. 영어권에서도 역학 분야의 철학적 쟁점은 저자 브로드벤트에 의해 사실상 처음 연구되었다. 역사책으로도 모라비아의 저술 이외에는 손꼽을만한 것이 없는 것으로 알고 있다. 오늘날 역학은 분명 활발한 연구를 통해 공중보건 정책에 깊은 영향을 끼치고 결국 인구집단 일반의 건강에, 아니 그들의 건강이 무엇인지에 대한 생각에도 상당한 영향일 끼치고 있으나, 실제로 그 과정에 참여하고 있는 일부 소수 연구 인력 이외에는 깊이 이해되고 연구되지도 못하고 있는 상황인 셈이다.
<역학의 철학>의 1장과 2장은 바로 이런 상황에서 역학의 뼈대를 이해하고 싶은 사람들에게 제공할만한 읽을거리가 된 듯하다. 다시 말해, 그 이후 부분에서 전개되는 철학적 논의나 역학의 전문 논의가 어렵게 느껴진다고 하더라도 1장과 2장만은 역학에게서 영향을 받는 누구나 읽어둘 만한 내용이다. 역학이 대체 무엇이고 무엇을 연구하는지, 그리고 다른 과학과 어떤 차이가 있는지를 쉽게 대조하고 있기 때문이다. 1장에서 브로드벤트가 보여준 내용은 표 1과 같다.
내용 | |
첫 번째 | 역학은 인과 연구 |
두 번째 | 증거 수집에서 실험이 중요하지 않음 |
세 번째 | 추론에서 이론이 중요하지 않음 |
네 번째 | 방법이 건강과 관련된 모든 것에 적용됨 |
다섯 번째 | 인구집단을 다룸 |
여섯 번째 | 공중보건을 책임짐 |
표 1 역학 연구의 특징
<역학의 철학>은 바로 이 1장과 2장 덕분에 역학이 무엇인지 소개하는 교양서적의 역할을 잘 수행할 수 있다. 아마도 앞으로도 이 분야에서 교과서나 논문 이외의 저술이 나오기는 어려울 것이니, 역학을 배우는 학생들이나 보도에서 접하고 그 정체를 궁금해할 많은 독자들에게 <역학의 철학>은 오랫동안 추천할 만한 책의 자리를 차지할 것이라고 본다.
인과 해석 문제: 상관관계와 인과관계
데이터를 다루는 수많은 과학에서, 금과옥조처럼 취급되는 슬로건이 있다. 바로 “상관관계는 인과관계가 아니다”라는 슬로건이다. 그런데 역학은 놀랍게도 상관관계와 그리 잘 구별되지 않는 방식으로 연구의 결론을 내린다. 바로 다음과 같은 방식이다.
- 흡연의 기여로 인해 흡연자들이 폐암에 걸리게 될 생애 위험의 초과분율 은 95%이다.
이 문장은 노출과 결과 사이에 특정한 양적 연관성, 다시 말해 일종의 상관 관계가 있다는 내용이다. 하지만 역학자들은 이 문장을 흡연과 폐암 사이에는 특정한 인과 관계가 있다고 주장하기 위해 사용한다. 양적 연관성 또는 상관관계로부터 인과 관계를 주장하기 위해, 역학자들은 대체 어떤 방식으로 이들 연관성 측정 지표를 해석하는가? 다시 말해, 역학이 내놓은 측정지표는 어떤 함축을 가지고 있기 때문에 상관관계가 아니라고 할 수 있는가? 바로 이 문제가 브로드벤트가 말하는 ‘인과 해석 문제’이다.
이 문제에 답하기 위해 브로드벤트가 제시하는 많은 논의들은 현대 철학에서 인과 이론을 다루는 핵심 이론들이며, 몇몇 인물이나 논의는 역학자나 데이터에 기반해 연구 활동을 전개하는 많은 과학자들에게도 익숙한 것이다. 브로드벤트는 ‘확률적 접근’이나 ‘반사실적 접근’에 대한 논의가 인과 해석 문제를 푸는 데 어떤 한계가 있는지 지적하는 한편, 자신이 옹호하는 “설명적 접근”이 가장 설득력 있는 답변을 제시한다는 점을 보여준다. 이 서평에서 인과 이론의 전문적인 내용을 다루기는 어려울 것이다. 다만, 선행 논의에 대한 상세한 평가와 자신의 이론에 대한 적절한 옹호가 어우러져, 역학을 비롯한 많은 데이터 과학자들이 자신이 사용하는 인과 추론이 어떤 구조인지 반성해 볼 만한 논의가 이뤄졌다는 평가만은 덧붙이고 싶다 .
진술과 해석 | |
역학자의 진술 | 흡연의 기여로 인해 흡연자들이 폐암에 걸리게 될 생애 위험의 초과분율은 95%이다. |
확률적 해석 | 흡연은 흡연자가 폐암에 걸릴 확률을 비흡연자보다 95% 높게 만든다 |
반사실적 해석 | 흡연은 폐암의 필요조건이다. 즉 흡연이 폐암을 일으키는 데 반드시 필요하다. |
설명적 해석 | 흡연은 비흡연자에 비해 흡연자의 폐암이 20배 더 많다는 사실을 설명하는 핵심 차이다. |
표2 역학자의 진술과 세 가지 해석 방식에 따른 각각의 해석 내용
역학의 인과 추론이 이뤄야 할 덕목: 안정성과 예측
역학자들은 데이터로부터 인과를 찾아내기 위해 오늘도 분투하고 있다. 하지만 최소 수년, 길면 수십 년간의 연구를 거쳐 얻은 데이터가 단순한 상관관계와 구분되는지 알기 위해 사용할 수 있는 일반적인 도구는 역학자들의 손에는 없다.
역학 연구의 많은 결과는 당시의 과학적 상식과도 어긋나는 것이 많았다. 산부인과 진료를 보는 의료진의 손을 소독해 산욕열의 유행을 저지한 젬멜바이스의 사례는 과학사를 조금이라도 알고 계신 분께는 너무나 유명할 것이다(<역학의 철학> 2장에 이 사례에 대한 깔끔한 정리가 있다). 현대 역학의 가장 대표적인 성과인 흡연-폐암 사이의 관계 역시 1950년대 후반 처음 제기되었을 때는 역학계 내부에서도 상당한 비판을 받았다. 통계가 당연해 보이는 것을 숫자로 보여주는 기법에 불과하다는 주장은 역학에서는 전혀 통하지 않는다.
지금 문제는 이것이다. 역학은 아무도 모르던 인과 관계를 데이터에서 뽑아낸다. 하지만 그것을 대체 어떻게 지지할 수 있는가?
다른 과학의 성과에 의존해, 그 현상을 설명할 수 있는 메커니즘을 찾아내면 될지도 모른다. 하지만 젬멜바이스처럼 연구 시점의 과학에 의존해서는 어떠한 설명도 할 수 없는 상황에 부딪친다면, 역학자들은 다른 과학과 고립된 상태에 처한 채로 판단을 내려야 한다. 실제로 젬멜바이스의 메커니즘 설명은 틀렸다. 이런 경우에도 역학은 올바른 인과관계를 찾아낼 수 있었다는 점을 의학사는 보여준다. 그렇다면 그런 주장들은 어떤 덕목을 공유하고 있었는가?
브로드벤트는 그 덕목이 바로 안정성이라고 주장한다. 여러 유명한 역학적 성과들은 연구 결과가 안정적이었기 때문에 그리 설득력 없는 메커니즘 추론에 의해 뒷받침되었음에도 널리 수용되었다는 것이다. 그가 말하는 안정성은 다음과 같은 속성이다.
어떤 결과, 주장, 이론, 추론, 또는 다른 과학적 성과물은 다음 조건을 만족할 경우 오직 그 경우에만 안정적이다.
- 실제로, 좋은 과학적 증거에 의해 곧장 반박되지는 않는다.
- 현재 사용할 수 있는 최선의 과학적 지식에 비춰볼 때, 해당 주제에 대해 적절한 수준의 연구가 수행될 경우에도 문제의 성과물은 좋은 과학적 증거에 의해 곧장 반박되지는 않을 것이다. (<역학의 철학> 140쪽)
문제가 되는 역학 연구가 내놓은 인과 추론이 이런 특징을 가지고 있는지, 그리고 역학 연구가 제안한 가설이 중요한 대조 가설에 비해 더욱더 안정적인지 평가하는 것이 중요하다. 안정성은 좋은 역학 연구, 나아가 데이터 과학 연구가 가져야 할 덕목이었고, 또 그래야만 한다.
이런 제안은 관련 과학 연구가 어떤 덕목을 가져야 하는지, 그리고 무엇을 목표로 해야 하는지에 대한 제언이다. 이 제언은 역학과 같은 의학의 중요한 목표인 예측에 대해서도 중요한 함축을 가진다. 브로드벤트는 좋은 역학의 예측이 되기 위해서는 바로 방금 말한 안정성을 가져야 한다고 주장하기 때문이다. 다시 말해, 어떤 인과 가설에 의한 예측을 정당화하기 위해서는 그 인과 가설이 안정적이어야 한다는 것이 브로드벤트의 주장이다.
이런 주장은 역학과 같이 예측을 하고 그것을 정당화하려 하는 (사회과학을 포함하는) 여러 과학이 무엇을 추구해야 하는지에 대한 중요한 문제 제기도 포함하고 있다. 많은 (사회)과학자들은, 어떤 법칙이나 예측의 쟁점이 된 현상 기저의 메커니즘을 찾아내야만 좋은 예측을 해낼 수 있다고 믿고 있는 듯하다.
브로드벤트는 좀 더 깊은 질문을 제기한다. 그런 탐구가 왜 좋은 예측이 될 수 있는가? 또는, 많은 역학 연구처럼 아예 쟁점 현상 기저의 메커니즘에는 접근조차 할 수 없는 상황에서도 좋은 예측을 하려면 어떻게 해야 하는가? 이에 대한 철학적 답변이 안정성이라는 점을 <역학의 철학> 4~7장의 논의에서 확인하길 바란다.
역학에 고유한 몇 가지 쟁점들
<역학의 철학>은 인접 과학에 영향을 줄 수 있는 이들 일반적인 주제를 넘어, 현장 역학자들이 실제로 고민하고 있는 주제를 직접 다루고 있다는 점에서도 주목할만한 책이다. 다만 이 서평에서는 8장과 9장의 주제는 아주 간략히 언급하고 넘어가도 무방할 것으로 본다. 이들 챕터는 실제로 역학자들이 데이터나 연구 결과 얻은 지표를 해석할 때 있어 범하는 오류를 비판적으로 검토하는 부분이기 때문이다.
8장은 기여 분율을 해석할 때 역학자들이 자주 범하는 오류에 대응하기 위한 논의가 이뤄진 부분이다. 9장은 역학이 위험을 표기할 때 상대 위험도를 사용하는 경향에 대한 비판이 이뤄진 부분인데, 이 문제에 대해 역학을 전공하지 않은 일반 독자에게 권하고 싶은 저술은 글쓴이의 다른 번역서인 <숫자에 속아 위험한 선택을 하는 사람들>(살림 2013)이다.
다만 10장에 대해서는 조금 더 상세히 이야기하고 넘어가고 싶다. 이 장은 우리가 질병에 대해 어떻게 생각해야 하느냐는 의학의 뿌리 깊은 문제에 대해 현대 역학이 끼친 개념적 충격을 다루고 있는 부분이기 때문이다.
19세기 후반부 생리학의 발전 이래, 질병은 하나의 원인을 통해 규정되었다. 결핵균이 일으키는 것이 결핵, 비타민 C의 결핍이 일으키는 것이 괴혈병 등. 이런 생각은 여전히 많은 감염병과 결핍 질환을 어떻게 이해해야 하는지에 대한 답을 준다. 하지만 현대 역학은 암처럼 다양한 요인과 관련되어 일어나는 질환을, 그리고 비만이나 흡연처럼 다수의 결과를 일으키는 현상을 주로 다룬다.
결국 현대 역학은 질병을 하나의 원인과 하나의 결과로 이뤄진 단순한 사슬이 아니라 다수의 요인이 결합해 일으키는 인과적 그물망의 결과로 다룬다. 이런 사고방식을 ‘다요인주의’라고 부른다. 브로드벤트는 이 다요인주의가 가지는 매우 중요한 결과를 비판한다. 현실 세계에서 일어나는 모든 결과는 다수의 원인을 가지고 있다. 하지만 다요인주의는 무엇이 중요한 요인인지, 그리고 중요한 원인이 아닌지 지적해 보여줄 수는 없는 사고방식이다. 이 문제점에 어떻게 대응할 것인가? 이 문제가 바로 10장의 핵심 쟁점이다. 브로드벤트의 해결책인 “대조 모형”의 상세한 내용은 <역학의 철학>에서 직접 살펴보시길 권한다.
역학과 법률
<역학의 철학>의 마지막 장은 역학과 법률의 관계를 다룬다. 역학적 증거가 말하는 노출과 결과 사이의 연결은 앞서 살펴봤다시피 통계적 상관관계이다. 이것은 이 관계를 인과적으로 해석할 수 있는 여러 설명이 있다고 하더라도 달라지지 않는다. 하지만 한국 법원은 합리적 의심이 배제될 수 있는 만큼의 증거만이 증거로서 유효한 능력을 가진다고 본다. 그리고 아직 한국 법원은 역학적 증거를 그렇게 인정하지 않은 상태이다.
역학적 증거가 가진 법적 입증 능력 문제는 바로 지금 한국사회에서 진행되고 있는 문제이다. <역학의 철학>의 저자 브로드벤트가 속한 영미권에서는 상대 위험도가 2보다 클 경우, 즉 역학적 증거에 따르면 쟁점 원인 때문에 문제의 질환에 걸린 것으로 보이는 사람이 쟁점 원인과 무관하게 걸린 사람보다 더 많은 경우 역학적 증거가 입증 능력을 가진다고 본다. 하지만 글쓴이가 대화와 문헌으로 살펴본 결과, 어떠한 한국 법학자도 이러한 견해에 찬동하지 않을 것 같다. 이런 상황에 대해 어떻게 대처할 것인가?
이 질문은 가습기 살균제 피해에 대한 결정적인 증거로 역학 연구 결과가 제출된 상황인 만큼, 여전히 현재 진행형이고 동시에 많은 사람들의 관심을 받을 자격이 있다. 비록 법학 전통이 다른 영미권의 저술이지만, 바로 이 논쟁에 중요한 시사점을 던져줄 수 있는 저술인 만큼, 그리고 앞으로 발전할 수많은 데이터 과학이 산출한 증거들 역시 법정에 증거로 제시될 것인 만큼 법학도들에게도 일독의 가치가 있는 저술이라고 글쓴이는 생각한다.
결론
이렇게 <역학의 철학>을 사람들에게 권하고 싶은 이유, 그리고 많은 사람에게 도움이 되어 예상외로 많이 판매된 이유 다섯 가지를 짚어보았다.
먼저, 이 책은 점점 더 중요한 과학이 되어 가는 역학이 무엇이고 무엇 때문에 현대 의학에서 의미 있는 부분인지 간략히 보여줄 수 있다는 점에서 일반에게 읽힐 만했다. 또한, 상관관계에서 인과관계를 읽어내야 하는 역학의 본성, 그리고 그와 같은 과업을 주변 과학이 제시하는 사전 정보가 극히 부족한 상황에서 해내야만 하는 역학의 어려움 속에서 자연스럽게 제기될 몇 가지 방법론적 질문에 답한 책이라는 점에서 역학과 생의학 전공자들에게 중요한 책이다.
물론, 인과관계나 안정성 같은 쟁점은 사회과학을 비롯한 다양한 유형의 데이터 과학도 공유할 수 있는 만큼, 역학자뿐만 아니라 데이터 과학자 일반에게도 이 책을 권하고 싶다. 역학에 고유한 쟁점에 대한 논의는 의학에서 사용하는 숫자에 대한 논의를 깊이 있게 해 줄 수 있을 뿐만 아니라, 우리가 질병에 대해 가지고 있는 개념 일반을 반성하는 데도 도움이 될 것이다. 마지막으로, 전혀 다른 지적 전통인 역학과 법학 사이에서 긴장이 벌어지는 우리 사회의 몇몇 장면을 이해하기 위해서도 일독을 권할만한 부분이 있다.
글쓴이를 비롯한 역자들은 저자 브로드벤트와의 서신 교환을 통해 미진한 논의를 보충하기도 했고(<역학의 철학> 379~394쪽), 역주를 통해 대부분의 독자들에게 낯설 철학적 개념과 의학적 개념을 최대한 이해하기 쉽도록 해설하기도 했다. 모두가 책이 가진 가치를 더욱더 알아보기 쉽게 만들고, 더 넓은 범위의 독자들이 역학과 철학의 가치를 알아보았으면 하는 마음에서 했던 일들이었다.
이 서평 역시 그런 독자들이 더 늘어났으면 하는 마음에서 쓴 글이다. 2쇄를 통해 더 많은 독자를 만날 수 있다면, 그보다 더 <역학의 철학>에 좋은 일도 없을 것이다. 그리고 그렇게 된다면, <역학의 철학>은 서두에서 이야기했던 장벽 역시 훌륭한 연구가 잘 소개되고 널리 알려진다면 넘을 수 있을 것이라는 증거가 될 것이다. 여러 과학의 개념적∙방법론적 쟁점에 대한 정확한 이해가 이뤄지고, 좀 더 풍부한 논의가 학계에 만개하는 데 과학 철학이 기여하는 이상에 <역학의 철학>이 조그마한 기여를 하게 되기를 바란다.