“땅볼을 유도했는데 안타가 되는 것은 나로서는 어쩔 수 없는 일이다.” -박찬호
“나는 평소대로 타구 유도를 하고 있다. 그런데 왜 이렇게 안타를 많이 맞는지는 나도 모른다.” – Greg Maddux
2012년, 한국의 야구팬들은 충격적이면서도 자랑스러운 소식을 마주하게 되었다. 국내 현역 중 최고 좌완 투수로 평가받는 류현진이 2,500만 달러의 포스팅을 통해 LA Dodgers로 영입된 것. 그와 동시에, 한국의 야구팬들 사이에서는 MLB에 대한 제2의 열광적인 관심이 생겨났다. 이후 한국프로야구 팬들에게는 낯선 통계들이 찾아왔다. 서브컬쳐에 가까웠던 한국의 MLB 팬들이 다루던 야구 통계들이 류현진의 활약으로 인해 MLB에 대한 관심이 폭발하면서, 그리고 류현진이 마운드에서 던지는 투구 그 자체에 대한 분석에 대한 수요가 증가하면서 말이다.
세이버매트릭션의 질문 : 안타는 실력이 아니라 운이 아닌가요?
그 첨단에는 세이버매트릭스(sabermetrics)가 존재한다. 세이버매트릭스는, 통계를 통해 야구의 본질 그 자체를 알아내려 한다. 과연 야구는 어떤 스포츠고, 무엇을 잘 하는 것이 야구에서 이기게 하는 것인가? 야구에서 정말로 중요한 것은 무엇인가?
세이버매트릭스는 그것에 대해서 완전한 해답을 제공하지 않는다. 다만 조금은 다른 결론을 제시한다. 물론 필자는 여기서 그 전부를 다룰 능력도, 다룰 의향도 없다. 필자가 다루어보고자 하는 것은 세이버매트릭스의 일부이면서 동시에 류현진의 활약상을 보는 한국의 야구팬들이 가장 관심이 있을, 투수의 피칭에 관한 부분이다. 그리고 아마도 그 내용은, 많은 야구팬들의 직관과는 거리가 먼 내용이다.
자, 한 야구 경기를 생각해 보자. 경기장에는 투수와 포수, 야수가 있을 것이고, 타석에는 타자가 있으리라. 여기서 생각해 보자. ‘안타’는 어떻게 나오는 것일까. 우선 투수가 공을 던지면, 타자가 맞추어야 할 것이다. 그리고 그 타구는 야수들의 위치와 순간적인 수비동작을 넘어서 야수들이 잡을 수 없는 코스로 날아가야 할 것이고, 또한 적절한 타구의 속도가 뒷받침되어야 하겠다. 또한, 비거리는 너무 멀면 안 된다. 너무 멀면 홈런이 될 것이므로. 너무 가까워도 일반적으로는 좋지 않다. 너무 가까우면? 속 터지는 병살타가 될지도. 그에 비해서 홈런은 어떤가? 투수의 공을 타자가 맞춘다. 그리고 멀리 날아가 담장을 넘기면 된다. 삼진은 어떤가? 공이 어떤 곳으로 연속해서 들어가든지, 아니면 세 번 휘둘러서 못 맞추면 된다.
여기서 돌이켜 보면, ‘안타’라는 현상은 다른 현상에 비해서 훨씬 많은 변수를 갖고 태어나는 현상임을 깨달을 수 있다. 때문에, 야구에는 그런 말이 있다. ‘정말로 잘 맞은 공은 안타가 될 수 없다’는 말.
여기서 많은 야구팬들은 결과적으로 점수가 났는지 안 났는지를 가장 주목할 것이다. 그런데 어떤 사람들은, 이런 야구 경기에서 득점을 하고 실점을 하는 것에 대해, 정확히 얼마만큼 투수가 기여를 했고, 타자가 기여를 했고, 야수들이 기여했는지를 알고 싶어 한다. 그렇다면 아마도 류현진 경기를 즐겨보는 야구팬들은, 바로 ‘류현진’의 기여도에 대한 관심이 생길 것이다.
물론 점수를 안 내줬으면 잘 던진 것 아니냐는 결과론적인 생각을 할 수도 있다. 인정한다. 그러나 야구는 과학적인 스포츠이고, 어느 스포츠보다도 기록에 의지한다. 때문에 어떤 사람들은 연구를 시작했다. 과연 야구 경기에서 실점에 있어서 ‘투수의 퍼포먼스’는 어떻게 해석되어야 하는가? 과연 야구 경기에서 얻고 잃는 점수에서 무엇이 투수 본연의 몫으로 돌아가는 것이며, 무엇이 다른 무언가, 즉 ‘운’이든 ‘잘 친’ 것이든 다른 무언가로 설명될 수 있는가? 서두에 인용한 박찬호와, ‘전후 최고의 투수’ 그렉 매덕스의 발언은 어떻게 말하면, 그 문제의식을 한 줄로 압축한 것이기도 하다. 일련의 세이버매트리션이라 불리는 야구기록 덕후들의 연구는, 여태까지의 야구팬과, 심지어 현장에 있는 야구인들의 통념조차도 배신하는 결과였다.
DIPS의 등장 : 볼넷, 삼진, 홈런을 제외한 모든 타구는 운이다.
1999년, 세이버매트리션 Voros McCracken은 한 칼럼을 썼다. 그는 DIPS(Defense Independent Pitching Stats)라는 스탯(통계)을 제시하면서, 투수를 평가하는 전혀 다른 관점을 내놓았다. 다음 두 투수를 보자. 직관적으로 누가 더 뛰어난 투수인가?
Aaron Sele : 18승 9패 ERA 4.79 205이닝 244피안타 21피홈런 70볼넷 12 몸에 맞는 볼 186K
Jose Rosado : 10승 14패 ERA 3.85 208이닝 197피안타 24피홈런 72볼넷 5 몸에 맞는 볼 147K
아마도 최소한 과반수의 야구팬들은 호세 로사도의 손을 들어주실 것이다. 소화 이닝 수도 근소하게 많고 방어율은 아예 비교하기 민망한 수준이다. 구태여 많은 야구팬들이 더 이상 중요하게 생각하지 않은 투수의 승패를 감안하지 않더라도. 그런데 보로스 맥크라켄은 뜻밖에 애런 실리의 손을 들어주었다. 도대체 왜?
그는 DIPS, 즉 ‘수비 무관계 투구 기록’ 쯤으로 번역이 가능한 스탯을 만들었다. 이 스탯에서 놀랍게도 그는 양 투수의 ERA와 피안타를 완전히 제외했다. 이유는 단순하다. 그의 표현에 따르면 ‘피칭이라 생각되던 것이 수비였다는 것을 알게 되었’기 때문이다. 앞서 생각한 ‘안타’의 과정을 돌이켜 보자. 안타가 되기 위해서는 우선 타자가 투수의 공을 어떻게든 맞추어야 한다. 이것이 쉬운가? 쉽다면 오승환의 공에 WBC에서 메이저리그 타자들이 선풍기를 돌리지 않았겠지. 그리고 맞추고 나서도 앞서 언급한 – 그라운드의 상태, 야수들의 수비 위치, 타구의 방향, 속도 등 수많은 요인 –을 통해 안타는 비로소 형성된다. 그리고 이 모든 것이 투수의 역량이라고 진짜로 말할 수 있나?
보로스 맥그라켄은 그러므로 아예 투수의 역량에서 ‘피안타’라는 상황을 제외하고, 야수가 개입하거나 잠실 그라운드에서 올 시즌 자주 벌어진 막장스러운 바운드와 같은 상황이 발생하지 않고 어지간하면 야수들이 호수비로 도둑질할 수 없는 홈런과 타자가 아예 치지도 않거나(볼넷) 타자가 치지 못한(삼진)을 가지고 투수의 역량을 알아보기로 한 것이다. DIPS가 그 결과물인데, DIPS를 계산하는 공식은 그다지 중요하지 않다(다소 복잡하기도 하고). 둘은 이닝이 거의 똑같은데 로사도는 실리에 비해 피홈런이 조금 많고, 사사구는 조금 적고, 그에 비해 삼진은 많이 적다는 것만 보면 된다.
즉 ‘야수가 개입할 수 없는 상황’에서 로사도는 실리에 비해 더 안 좋은 결과를 얻었다. 좀 더 정확히 말하면, 삼진과 볼넷의 비율을 따져 보면 로사도는 실리에 비해 적은 사사구 이상으로 삼진이 적다는 사실에서 안타를 포함한 인플레이(투수가 던진 공이 파울이 되지 않고 페어지역으로 날아가는 상황)를 제외했을 때, 인플레이가 아닌 상황에서 로사도가 보여준 피칭의 내용이 실리보다 좋지 않다는 얘기가 된다. 자세한 전문 번역은 여기를 참조하자.
발전형 BAFIP, FIP의 등장 : DIPS가 옳았다?!
물론 여기서 의문이 생기지 않을 수가 없다. “아니, 그러니까 그것만 가지고 실리가 로사도보다 더 나은 투수란 말입니까? 삼진도 없이 노히트노런 한 장호연은 무슨 운빨 쩌는 3류 투수인가요?“ 맞다. 이 칼럼은 그 때문에 엄청난 논쟁을 일으켰다. 심지어 세이버매트릭스의 아버지로 불리는 빌 제임스조차 말도 안되는 논리라 평가했다. 그런데 후속 연구가 진행될수록 결과물은 보로스 맥그라켄을 지지하는 쪽에 가까워졌다. 이른바 이 글의 핵심이 될 소재인 BABIP와 FIP의 탄생이다.
보로스 맥그라켄의 주장은 한 가지의 전제 논리를 필요로 한다. 일단 타구가 타자의 배트에 맞아서 파울이나 홈런이 된 게 아니라면, 그것이 안타가 될지, 범타가 될지를 “투수가 결정할 수가 없다”는 것. 쉽게 말해 맞춰 잡는 피칭이라는 것은 운칠기삼의 다른 표현이라는, 직관을 터무니없을 정도로 거부하는 소리다. 이 전제에 대해 후속 연구의 결론은 다음과 같았다.
“인플레이 시 안타가 되는 상황에서 각자의 영향력은 운이 44%, 투수가 28%, 구장이 17%, 수비가 11%”
이 결과를 곧이곧대로 받아들인다면, 일단 투수의 공을 타자가 맞추고 그게 파울이 아닐 경우 그게 안타가 될지 범타가 될지는 신의 장난이 절반이요 구장과 야수들의 수비능력이 1/4에 나머지 1/4가 투수의 피칭에 관계가 있는, 즉 72%는 투수가 어떻게 할 수가 없이 운이나 수비 시프트, 야수의 순간적인 판단이나 속도, 구장의 형태와 크기에 의해 좌우되는 부분이라는 충격적인 결론이 나온다. 보로스의 생각보다 좀 유연하지만, 어쨌든 투수보다는 다른 요인이 인플레이 상황의 피안타율을 더 많이 결정한다는 거고, 결과적으로 말하면 투수가 잡은 아웃카운트에서 삼진을 제외하고 살려 보낸 타자들에서 볼넷을 제외할 경우 남는 안타와 그에 상응하는 실점기록의 대부분이 투수의 능력과는 관계가 없다는 소리다!
이런 구체화된 연구결과를 통해 세이버매트리션은 두 스탯을 고안했다. DIPS의 개량된 형태인 FIP(Fielding Independent Pitching : 수비 무관 평균자책점)이라는 수치(쉽게 말하면 ERA와 비슷한 형태로 표현한 DIPS다)와 BABIP(Batting Average on Balls In Play : 인플레이 타구에 대한 타율)이 그것. 두 스탯의 산출법은 다음과 같다.
BABIP = (총안타-홈런) / (타수-삼진-홈런+희생플라이)
FIP = (13*피홈런+3*사사구-2탈삼진)/이닝 + C
C = (9*리그 총자책점 – 13총*홈런 – 3(총사사구-총고의사구) + 2*총탈삼진)/총이닝
C는 쉽게 말해 FIP를 평균자책점의 형태로 나타내 주기 위한 수치고, 현대야구에서는 일반적으로 3~3.2 정도의 수치를 갖고 있다. 자세한 산출 근거는 여기서 언급하진 않겠고, 다만 FIP를 구해 보면 ERA와 비슷한 수치로 표현이 된다는 것만 알면 된다. 어쨌든, 이 모든 계산법에는 안타에 관련된 것이 없다. 문제는 앞서 언급한 직관을 배신하는 전제와 그에 따른 이 모종의 희한한 계산법이 진짜로 설득력이 있냐는 부분이 된다. 결론부터 말하면, 상당한 설득력을 갖고 있었다. 다음은 1962년 이후 태생 투수들 중 1만번 이상 타자를 상대한, 평균자책점 상위 10명의 선발투수들의 ERA와 FIP다.
음.. 외계인도 있고, 2미터도 넘는 아저씨도 있고, 약 안했으면 명예의 전당은 그냥 가실 분도 계시고, 배나온 아저씨도 계시고, 피 묻은 양말 신은 아저씨도 계시고.. 대충 90년대 최강 투수들의 집합이라고 봐도 무방하겠다. 아무튼 이 투수들의 ERA와 FIP를 보자. 별다른 확연한 차이가 있는 투수는 ‘단 한명도’ 없다. 전설은 아니고 레전드급 투수들 중에서 좀 그나마 차이가 있는 편인 선수가 Tom Glavine이다. 글래빈은 ERA가 3.54, FIP가 3.95로 조금 차이가 있는 편.
물론, 여러분들은 여기서 다시 의문 몇 개를 제기하실 수 있다. “아니 C를 통해서 ERA랑 비슷하게 보정했으니 당연히 ERA랑 FIP랑 비슷해야 하는 거 아닙니까?” “저게 어쨌다는 건가요? 의미를 모르겠어요” 뭐 등등. 문제는 한 시즌, 혹은 한 기간을 놓고 봤을 때 이 두 수치간의 차이가 지금처럼 좁지 않더라는 것이다. 어떤 시즌은 ERA>FIP, 어떤 시즌은 FIP>ERA 등의 수치가 기록되면서. 다르게 표현하면, FIP는 (상대적으로 ERA에 비해서) 초장부터 잘 했든 전성기를 맞았든 어쨌든 일정한 추세를 기록하면서 변하는데, ERA는 FIP보다 높았다가 낮았다가 요동을 치다가 종국에는 커리어 전체를 놓고 보면 FIP에 ERA가 수렴하는 현상이 발생한 것.
단적인 예로 Greg Maddux의 리즈시절인 94,95,96시즌을 살펴보겠다. 이 시즌 FIP는 2.39-2.26-2.73을 기록했으나, ERA는 1.56-1.63-2.72(!!)를 기록했다. 그 외에도 통계(커리어 동안 소화한 이닝)가 쌓이면 쌓일수록, 거의 대부분의 투수들의 통산 ERA와 FIP는 비슷하게 수렴해 갔다. 결론적으로, 수비와 구장, 운과 같은 제어할 수 없는 요인을 벗긴 FIP라는 지표가 통산 ERA와 비슷하게 수렴한 것이다. 왜 이런 일이? 그 답은 BABIP에서 찾을 수 있다.
앞에서 설명했지만 FIP는 탈삼진, 사사구, 피홈런을 통해 계산된다. 그러므로 그렇다면 FIP와 ERA의 갭은 안타를 통해 발생한다. 그런데 인플레이 시 안타에 투수의 영향력은 28%이니, 결국 통산 커리어를 통해서 안타라는 운동물리학적인 기적이 평균적으로 발생하게 되는 것을 통해 둘의 차이가 적어진다는 얘기가 된다. 야구를 지배하는 평균(Average)의 마술이다.
좀 더 디테일하게 생각해 보자. 어떤 투수가 예전 5년과 올해, 볼삼(K/BB)비율이 같고 피홈런도 딱히 늘어나지 않았는데 피안타만 많이 맞았다, 즉 투수의 BABIP가 작년보다 높게 형성된다면 ERA와 FIP의 갭은 크다. 그러나 이 BABIP는 언젠가는 작년이나 그보다 낮은 시즌이 찾아올 것이고, 그 투수의 K/BB나 피홈런을 비롯한 FIP를 구성하는 요소들이 변하지 않았다면 투수의 ERA는 FIP로 회귀하게 될 것이라 예측할 수 있고 실제로 그런 예측을 지지하는 결론이 MLB 투수들의 기록을 통해 지지되고 있는 것이다. 간단한 설명은 아래 영상을 참조해 보자.
반론과 재반론 : 말이 안되는 것 같은데 말이 된다?!
물론 직관적인 반론 역시 많이 제기할 수 있다.
1. 땅볼유도형 투수들은 어떤가? 삼진이 적으니 FIP가 과소평가하는 것 아닌가?
2. ‘위기관리능력’이 있다면 장기간 ERA를 FIP보다 낮게 유지할 수 있는 것 아닐까?
3. 아무리 그래도 에이스 투수와 평범한 투수의 BABIP가 정말 같나?
4. ‘FIP를 의식하는 투수’도 존재할 수 있는 거 아닌가?
1에 대해 세이버매트리션들은 FIP의 공식을 다시 보기를 주문한다. 그리고 땅볼유도형 투수들에 대해서도. 땅볼유도형 투수들은 일반적으로 가라앉는, 투심(2-Seam)이나 싱커 등의 구질을 구사한다. 그런데 생각해 보자. 땅볼을 유도해 아웃을 시키기 위해서는 타자가 볼넷으로 출루해서는 안 되지 않은가? 즉 땅볼을 유도하는 투수들은 삼진률이 낮은 게 사실이지만, 그 이상으로 (성적이 준수하다면) 낮은 볼넷을 기록해야 하고 기록한다. FIP가 시사하는 것은 ‘모든 투구 관련 지표가 동일한데 하필 BABIP만 줄어들거나 늘어나는 상황)에 관한 것이고, ’맞춰잡는 것‘은 ’땅볼 유도‘와는 다른 말이다.
2번의 경우 역시 세이버매트리션들은 반론한다. 위기관리능력은 아마도 주자가 출루한 상황에서 땅볼을 유도하든 삼진을 잡아내든 실점을 안 하는(줄이는) 것으로 정의가 가능하겠는데, 애초에 이런 능력이 있다면 주자를 왜 출루시키느냐는 것. 투수가 주자가 출루했을 때 이런 평상시에 보여주지 않는 퍼포먼스가 있다면 왜 그것을 일상적으로 이용하지 않느냐는 반문이다.
3번의 경우, 대체로 에이스 투수들이 BABIP를 낮게 유지하는 경향이 있는 것은 사실이다. 그러나 이에 대해서도 세이버매트리션들은 반론한다. 에이스 투수들은 3류 투수들에 비해서 넘사벽으로 좋은 K/BB, 피홈런 등을 기록하며, 에이스 투수들도 통산 커리어에서 유난히 BABIP가 널뛰기를 하며, 오히려 3류 투수들이 일시적으로 낮았던 BABIP(소위 말하는 플루크)가 회복되면서 리그에서 방출당하는 결과(…)로 이어진다는 것.
4번은 2번의 거울과 같은 상황이다. 즉 실점하더라도 FIP를 위해서 공격적으로 피칭하고, 단타를 맞더라도 볼넷을 주지 않는 방향의 피칭을 투수가 ‘FIP를 의식해서’ 의도적으로 수행할 수 있는 게 아니냐는 질문. 실제로 LA dodgers의 2선발로 영입된 Zack Greinke 역시 비슷하게 ‘FIP를 의식하고 던진다’는 얘기를 한 적이 있다. 다만 어느 투수가 실점을 좋아하는지, 그리고 공격적인 피칭이 늘상 투수에게 강조되는 덕목임을 생각한다면…
그러나, 이 많은 그럴듯한 세이버매트리션들의 주장에도 불구하고 어떤 투수들은 FIP에 비해 낮은 ERA를 꽤 오래 끌고 가기도 한다. 탬파베이 레이스의 Hell Boy, Jeremy Hellickson이 대표적이다. 2010년 MLB에 첫 선을 보인 탬파베이의 영건 헬릭슨의 ERA는 2010년 36 1/3이닝 3.47, 11년 189이닝 2.95, 12년 177이닝 3.10을 기록했다. 그러나 같은 기간 FIP는 3.88-4.44-4.60을 기록했다. 꾸준히 악화된 FIP에도 불구하고 ERA는 그것을 완전히 무시했다! 물론 올 시즌에는 ERA 5.82, FIP 4.68로 그동안의 운을 보상하는 악운이 뒤따르고 있는 것처럼 보이지만(그리고 헬릭슨은 이제 400이닝을 소화한 투수일 뿐이다 – 이닝이터 에이스의 경우 400이닝은 2년이면 아예 넘어서는 수치다).
헬릭슨의 피칭을 설명하는 데 있어서는 크게 두 가지의 방식이 존재한다. 전자는 헬릭슨이 BABIP에 따른 ‘운’이 사라졌다는 거시적인 설명이고, 후자는 헬릭슨의 구위와 레퍼토리, 제구력 측면에서 변동이 생겼다는 주장. 물론 헬릭슨이 잘 던졌던 작년까지 역시 같은 설명이 가능하다. BABIP를 통한 ‘운’이라는 설명, 또는 헬릭슨이 주자가 나간 시점에서 와인드업을 비롯한 투구모션 등의 변동이 있거나 셋 포지션이 우수해서 실점의 원인이 될 수 있는 도루를 잘 억제하고 주자가 나간 시점에서 더욱 위력적인 구위를 내는 어떤 요인이 존재하거나. 현재로서는 두 설명 모두 일리가 있어 보이며, 메이저리그 내에서도 강경한 세이버매트리션이 아니면 대부분 ERA와 FIP를 동시에 보는 것이 양호하다는 견해를 가지고 있다.
여러분이 염두에 두셔야 하는 것은, FIP에 ERA가 수렴하는 경향이 있다고 해서 FIP가 ‘미래를 예측하기 위한’ 스탯이 절대 아니라는 것이다. FIP는 어디까지나 노이즈가 확연한 피안타를 제외하는 것을 통해 ‘투수 그 자체’의 퍼포먼스에 ERA에 비해서 근접하는 것을 통해서 야구의 본질에 더 가까워지기 위해서 생각해낸 스탯이고, DIPS도 마찬가지며 BABIP도 그렇다. 그리고 FIP가 개선이 안 되거나 하는 스탯도 아니다! 또한 FIP는 충분한 수준의 데이터가 동반되지 않으면 통계적으로 충분히 설득력을 갖기 힘들며, 류현진의 스탯을 FIP를 보는 것은 또 하나의 재미겠지만 한 경기 한 경기를 FIP로 설명하기에는 사실 부적합하다.
단적인 예로, 류현진의 Fangraph 성적을 잠시 보면, 4월에는 FIP가 ERA보다 훨씬 좋았지만 5월에는 마치 다른 투수라도 된 것처럼 K/BB가 악화되면서 FIP가 ERA보다 훨씬 높게 형성되고 있다. 세이버매트릭스는 기본적으로 통계적 경험을 통해 그 설득력이 입증된 것이고, 통계의 힘은 데이터의 양에 크게 요동친다. 헬릭슨같이 400이닝씩의 데이터가 있어도 부진의 원인이 운인지 아닌지 의견이 갈리는데 우리의 현진류야 뭐(…)
통계는 통계일 뿐이라고? 그렇습니다, 하지만…
통계는 만능이 아니고, 세이버매트릭스 역시 야구의 본질을 캐치해낸 것은 아니다. 타자가 플루크건 말건, 투수가 플루크건 말건 지금 당장 치고 막아준다면 그것만큼 팬들을 기쁘게 하는 일도 없을 것이다. 그러나 야구는 기록의 스포츠이고, 또한 팬들이 열광하고 실망하는 순간들이 쌓인 지층 속에서는 또다른 것이 발견되기도 한다.
팬들 역시 OPS나 WHIP같은 지표를 이제 별 거부감 없이 받아들이고 있고, 먼 미래가 되면 ERA 역시 그것을 뒷받침하는 새로운 스탯이 보편화될지 모른다. 또한 FIP나 BABIP도 타구의 질 등 세부적인 지표들을 감안한 xBABIP, xFIP, 무사 만루에 나오면 병살보다 속이 터지는 내야 플라이를 포함한 IFFIP 등의 다양한 지표들이 나오고 있고, 야구의 본질이 무엇인가, 어떻게 하면 야구에서 이기는가에 대해서 다양한 통계들은 또 다른 대답을 제시하고 있으며 그 또한 야구를 보는 하나의 즐거움이 되리라고 생각한다.