미디어

세이버매트릭스의 발전, 그리고 통합 비즈볼프로젝트

류지호 (gulakk***)
2016.04.23 04:26
  • 조회 1949
  • 하이파이브 4

[비즈볼 프로젝트 오연우] “야구란 일정한 규칙에 따라 공을 던지고 치는 경기에 불과하다.”


이 문장에 동의하는 사람은 야구에 관해서 환원주의적인 견해를 갖고 있는 것이다. 환원주의란 추상적인 사상이나 개념을 더 기본적인 요소로 설명하려는 것을 말한다. 철학이나 과학 등에서 복잡하고 높은 단계의 사상이나 개념을 하위 단계의 요소로 세분화하여 명확하게 정의할 수 있다고 주장하는 견해이기도 하다. 위의 문장과 같이 생각하는 것이 환원주의적 견해의 하나이며, ‘야구 방망이는 죽은 나무 조직들이 특정한 모양으로 모여 있는 것’이라고 생각하는 것도 환원주의적 견해라고 할 수 있다. 이렇게 어떤 대상을 보다 근원적인 개념으로 나누어 생각하는 기조는 여러 학문에서 공통으로 나타나고 있는데, 이는 야구에서도 예외가 아니다. 야구를 분석하는 학문인 세이버메트릭스의 발전도 환원주의적 성향을 띠기 때문이다.


세이버메트릭스의 환원주의는 크게 2가지 방향으로 발전해 나갔다. 첫째는 플레이 하나하나를 가장 미세한 부분까지 쪼개어 분석하는 것이고, 둘째는 그것을 ‘팀 승리’라는 지표로 재조합하는 것이다. 하나씩 살펴보자.



sptPostArticleImage-64755.jpg

NC 다이노스는 국내에서 가장 세이버메트릭스를 잘 활용하는 구단이다.

(사진 출처: NC 다이노스 페이스북)


 

쪼개기


플레이의 쪼개기는 과학 기술의 발전과 그 궤를 함께한다. 레이더 기술이 발전하기 전까지 투수에 대한 분석은 어떻게 하더라도 그 최소 단위가 ‘투구’일 수밖에 없었다. 투구라는 행위를 조합해 볼카운트가 나오고, 삼진이 나오고, 홈런이 나왔다. 하지만 레이더 기술의 발전으로 투구라는 단위를 더 작게 나누는 것이 가능해졌다. 투구 자세가 어떻고 공을 놓는 위치는 어떠하며 공이 어떤 각도와 어떤 속력으로 날아가 스트라이크존 어디를 지나가는지를 알 수 있게 된 것이다. 그 결과 투수 연구의 최소 단위가 투구가 아닌 그 투구를 구성하는 세부 항목들로 바뀌게 되었다.


타자의 경우도 마찬가지다. 이전까지는 ‘타격’이라는 큰 틀에서 플레이를 분석했다면, 이제는 타격을 함에 있어 어떤 스윙 각도에서 어떤 스피드로 배트가 나와 어떤 각도로 공과 만나는지를 모두 알 수 있게 되었다. 그에 따라 이전까지는 안타, 삼진, 홈런 등과 같이 ‘타격 결과’로 타자를 분석했다면 이제는 타격 자체를 구성하는 세부 요소들로 타자를 분석할 수 있게 된 것이다. 수비에서도 타구에 대해 수비수가 몇 초 만에 반응하는지, 수비수의 수비 범위는 얼마인지 등이 모두 추적 가능해지면서 단순히 실책이냐 아니냐를 세는 데에서 벗어나 수비 행위 하나하나를 계량할 수 있게 되었다.


결국 이전의 세이버메트릭스가 플레이 단위로 야구를 환원했다면 이제는 선수의 움직임 하나하나에 대한 수준으로 환원시키고 있다는 것을 알 수 있다. 이런 기조가 이어진다면 언젠가는 선수의 움직임을 다시 분해하여 각 움직임이 있을 때 생체 호르몬이 얼마나 나오는지, 뇌 시냅스에서 공에 얼마나 빠르게 반응할 수 있는지 등도 분석이 가능할지도 모른다. 그때는 호르몬과 성적의 상관관계에 관한 분석이 등장하더라도 전혀 이상한 일이 아닐 것이다.


 

재조합


다음으로 세이버메트릭스는 플레이를 잘게 쪼갠 후 이들을 팀 승리라는 지표로 재조합하고 있다. 이러한 재조합은 야구장에서 일어나는 모든 플레이는 궁극적으로 팀 승리를 위한 것이라는 점에서 매우 타당한 접근방식이며, 대체선수대비승리기여도(WAR)와 추가승리확률(WPA)이 그 결정체다.


세이버메트릭스의 발전 이전에는 타자의 타격을 볼 때 타율이 얼마고 타점이 얼마며 홈런이 몇 개라는 식의 분석만 가능했다. 하지만 이렇게 원 데이터를 거의 가공하지 않은 ‘일차 스탯’들은 매우 단편적인 정보들만 제공하기에 타율만 갖고 그 선수의 장타력을 알 수 없었고, 장타력만 갖고 출루율을 알 수 없었으며, OPS로도 주루 능력은 알 수 없는 등 선수를 종합적으로 평가하기에는 많은 한계가 있었다.


하지만 플레이 하나하나의 가치가 ‘득점’으로 환산되기 시작하면서 세이버메트릭스는 야구 분석의 신기원을 열었다. 세이버메트리션들은 수천 게임을 분석해 각 아웃카운트/주자 상황에서 평균적으로 몇 점을 득점할 수 있는지 구했다. 이를 통해 각 플레이(1루타, 2루타, 3루타, 홈런, 볼넷, 사구 등)가 평균적으로 팀 득점에 몇 점을 기여할 수 있는지 알게 되었고, 다시 몇 점이 1승으로 환산될 수 있는지도 알게 되었다. 플레이를 득점으로, 득점을 승리로 변환시키는 과정을 통해 플레이 하나하나가 팀 승리에 얼마나 기여하는지 계산할 수 있게 되었으며 이것이 WAR의 토대가 되었다.


WPA는 어떠한가. WPA란 한 플레이가 팀의 승리 확률을 얼마나 올려 주었는지를 나타내는 것이다. 예를 들어 똑같은 솔로홈런이라도 10 : 0으로 뒤진 9회 말 2아웃에 친 홈런은 WPA가 0.01(1%)도 되지 않지만 1 : 1로 맞선 9회 말 2아웃에 친 홈런은 WPA가 0.45(45%)에 달한다. 전자는 10 : 0이든 10 : 1이든 기대 승률은 둘 다 한없이 0에 가깝지만, 후자는 기대 승률이 약 55%에서 100%로 상승하기 때문이다.


WPA는 WAR과는 반대로 온전히 상황 의존적이라는 점에서 대척점에 있어 보이기도 하지만 WPA도 결국 ‘승리’ 확률을 얼마나 높였는지를 알려주는 것이다. 수천 경기의 통계를 통해 각 이닝/아웃카운트/주자 상황에 따라 승리 확률이 어떻게 변하는지 연구했고, 그 결과 각 상황에서 각 행위가 팀 승리 확률을 얼마나 높여주는지 알게 되었다. WAR은 선수 개인 중심이고 WPA는 환경 중심적이라는 점에서는 서로 반대 방향에 있지만, 선수의 행위를 팀 승리라는 공통 지표로 환산했다는 점에서는 같은 방향에 있다.


여러 지표가 승리라는 단일지표로 환산되면서 생긴 장점은 종합적인 비교가 편리해졌다는 것이다. 가령 이전에는 홈런은 많이 치지만 타율이 낮은 선수와 타율이 높지만 홈런이 적은 선수, 타율이 적당하고 도루가 많은 선수 등이 있으면 직접적인 비교가 어려웠다. 어느 한 부분에서는 A가 좋고 다른 부분에서는 B가 좋기 때문에 누가 더 승리 기여도가 높은지 정량적으로 알 수 없었다. 하지만 각 플레이가 득점으로 환산되고 득점이 다시 승리로 환산됨에 따라 각 선수를 하나의 기준으로 비교할 수 있게 되었고, 이는 분명 큰 성과다. 또 완벽하지는 않아도 투타 간 비교나 세대 간 비교의 정확성이 이전에 비해 훨씬 높아진 것 역시 괄목할 만하다.


 

평균과 아웃라이어


이렇게 플레이를 잘게 쪼개고 다시 승리로 재조합함에 따라 세이버메트릭스의 객관성과 정교함은 높아져만 갔다. 그렇지만 여전히 세이버메트릭스가 제대로 해결하지 못하는 문제가 남아 있는데, 그중 하나가 바로 ‘평균의 함정’에 빠지기 쉽다는 것이다. 평균은 흔히 특정 집단의 특성을 대표하는 값으로 사용된다. 예를 들어 특정 팀에 소속된 선수의 연봉이 얼마쯤 될지를 가장 쉽게 설명해줄 수 있는 값은 그 팀 선수들의 평균 연봉이다.


하지만 평균이 그 집단을 대표하는 값으로 사용될 수 없는 경우가 몇 가지 있는데, 그중 하나가 집단 내에 한쪽으로 극단적으로 치우친 값(outlier, 아웃라이어)이 있는 경우다. 만약 팀 내 선수가 총 10명인데 그중 9명은 연봉이 3,000만 원이고 나머지 1명은 7억 3천만 원이라고 하자. 이때 평균 연봉은 1억 원이지만 이것만을 갖고 이 팀 선수들이 대체로 1억 원가량 받고 있다고 말하는 것은 정확하지 않다. 연봉이 3,000만 원인 선수들이 대부분인 가운데 단 한 명의 고액 연봉 선수에 의해 왜곡이 일어났기 때문이다.


이는 선수의 성적을 평가함에서도 마찬가지다. 다소 극단적으로 예시를 들면, 등판 당시 상황이 모두 같고 탈삼진, 볼넷, 피홈런 등의 세부지표가 모두 같다는 가정하에 시즌 중에 1이닝 무실점씩 9경기를 치른 후 10번째 경기에서 1이닝 10자책점을 기록한 투수 A와 1이닝 1자책점씩 10경기를 치른 투수 B는 ERA, FIP를 비롯해 WAR에 이르기까지 여러 지표에서는 아무런 차이가 없는 것으로 나타날 수 있다. 하지만 1점만 주면 패배하는 절체절명의 순간에 누구를 쓸지 결정해야 한다면 누구나 A를 선택할 것이다.


평균에 의한 왜곡 문제는 특히 표본(이닝)의 크기가 작은 구원투수에서 더 심각하게 일어날 수 있는 문제다. 집단에 한두 개의 아웃라이어가 존재하더라도 집단의 크기가 충분히 크다면 평균에 미치는 아웃라이어의 영향은 그리 크지 않을 수 있다. 1년에 600타석에 나서는 타자가 하루 정도 5타수 무안타를 쳤다고 시즌 타율이 몇 푼씩 떨어지지 않고, 1년에 30경기 선발 등판하는 투수가 하루 정도 자책점이 많다고 해서 시즌 평균자책점이 1점씩 오르는 일은 드물다. 하지만 구원투수는 대부분 시즌 총 이닝이 100이닝에도 미치지 못하고, 그에 따라 한두 경기를 크게 망치면 평균이 크게 흔들릴 수 있다. 그렇기에 구원투수는 세부 지표와 등판 일지를 참고하지 않고 몇 개의 지표만으로 평가하면 오차가 생기기 쉽다.


아웃라이어와 작은 표본에서 오는 평균의 맹점을 어떻게 해결할 수 있을 것인가. 이에 대한 해답은 역설적으로 세이버메트릭스에 점차 자리를 내주고 있는 ‘클래식 스탯’에 있다.


 

클래식 스탯과 조건 스탯


클래식 스탯이란 세이버메트릭스의 태동 전부터 있던 스탯 전반을 일컫는다. 경기에서 발생한 결과들(타석, 안타, 볼넷, 삼진 등)을 그대로 기록한 것들이나 그것들 사이의 비율(타율, 평균자책점 등)이 대표적인 클래식 스탯이다. 연말 시상식의 시상 항목들을 연상해도 좋을 것이다.


또한, 세부 기록과 관계없이 특정 조건을 만족하면 주어지는 스탯(이하 “조건 스탯”)도 클래식 스탯에 포함된다. 대표적으로는 승이나 패가 있고 구원투수라면 세이브, 홀드가 있으며 타자라면 결승타 등이 이에 해당한다. 조건 스탯들의 특징은 경기에서 선수의 활약을 명확히 성공 또는 실패로 규정해준다는 것이다. 예를 들어 야구에서는 구원투수가 팀의 리드를 마지막까지 지켜냈다면 그것을 성공으로 규정하고 ‘세이브’라는 기록을 주기로 약속했으며 반대로 등판 중에 동점을 허용하면 그 등판을 실패로 규정하고 ‘블론세이브’라는 기록을 주기로 약속했다. 기준에 따라 기록원이 부여하는 하나의 약속 체계인 것이다.


조건 스탯의 또 다른 중요한 특징은 스탯 안에서 구체적인 플레이 내용이 모두 사라진다는 것이다. 요컨대 투수가 등판 중에 안타를 맞았든 홈런을 맞았든 팀의 리드를 경기 끝까지 지켜내기만 하면 그 과정은 모두 무시하고 세이브라는 기록만 남게 된다. 성공과 실패를 간단하게 볼 수 있다는 장점은 있었지만 바로 이런 점 때문에 조건 스탯은 세이버메트릭스에서 외면받았다. 하지만 머니볼에서 빌 제임스가 말했듯, “모든 장점은 다른 측면에선 약점의 시작이고, 반대로 모든 약점은 강점이 된다.”

 

 

약점을 강점으로


스탯 안에서 구체적인 플레이 내용이 사라진다는 약점 때문에 외면받은 조건 스탯이지만, 이는 반대로 아웃라이어를 완벽히 배제할 수 있다는 강점으로 작용할 수 있다. 특히 아웃라이어에 의한 문제가 큰 구원투수의 평가와 같은 영역에서 더욱 효과적이다. 예를 들어 마무리 투수가 0.1이닝 5실점으로 무너진 아웃라이어 경기가 있다고 해도 조건 스탯의 기준에서는 단순히 블론세이브 하나가 기록되고 세이브 성공률이 조금 내려갈 뿐이다. 플레이 내용을 무시해주는 덕분에 평범한 블론세이브와 똑같이 취급되어 한 경기의 불운이 시즌 전체 성적을 망치지 않도록 해 주는 것이다.


다만 홀드나 세이브와 같은 기존의 조건 스탯은 지나치게 상황 의존적이라는 단점이 있다. 투수가 아무리 잘 던져도 등판 상황이 기준에 맞지 않으면 기록을 얻을 수 없기에 이런 단점을 보완하는 작업이 이루어져야 한다.


기존의 조건 스탯을 보완함에 있어 짚고 넘어가야 할 스탯이 바로 퀄리티스타트(QS)다. QS는 선발투수가 6이닝 이상 3자책점 이하를 기록하면 부여된다. 눈여겨보아야 할 점은 QS가 조건에 의해 부여된다는 점에서는 일반적인 클래식 스탯과 유사하나 그 조건이 상황 의존적이지 않고 개인 성적에 달려 있다는 점에서는 다르다는 것이다. 6이닝 이상 3자책점 이하라는 조건은 승, 패, 세이브, 홀드와는 달리 경기 상황과 무관하게 달성할 수 있기 때문이다. 이런 점에서 QS는 클래식과 세이버메트릭스 사이의 과도기적인 스탯이라고도 할 수 있으며, 아웃라이어 제거를 위한 세이버메트릭스와 클래식 스탯의 접목에서 중요한 모델이 된다. 상황과 무관하게 선수 개인 성적을 어느 정도 반영하는 동시에 아웃라이어도 제거할 수 있기 때문이다.


예를 들어 구원투수를 평가하기 위해 Quality Relief(QR)라는 기록을 개발한다고 하면, 부여 기준을 QS와 같이 개인 기록으로 하고 ‘QR 성공률’(QR%)로 선수를 평가함으로써 두 마리 토끼를 잡을 수 있다. 그밖에도 대타나 대주자 등 표본이 적은 대상을 평가할 때 ‘QS적 접근 방식’을 다양하게 응용할 수 있을 것이고, 필요에 따라 경기 결과를 성공/실패 2가지로 나누는 대신 몇 개의 등급으로 나눈다든가 상황적 요인을 일부 반영한다든가 하는 변화를 줄 수도 있을 것이다.


다만 여기서 주의할 점은 QS적 접근 방식 그 자체보다 다양한 방법을 통해 세이버메트릭스의 단점을 보완해 나가려는 시도가 더 중요하다는 것이다. 세이버메트릭스가 환원주의적 방법으로 많은 발전을 이룬 것은 분명하지만, 그것만이 정답은 아니다. 때로는 다른 방향에서의 접근이 필요하고, QS적 접근은 하나의 예시일 뿐이다.


 

통합적 접근


클래식 스탯에서 세이버메트릭스로의 환원주의적 발전 과정, 그리고 세이버메트릭스를 보완하기 위한 도구로서 클래식 스탯의 재발견 과정을 살펴보았다. 세이버메트릭스는 분해와 재조합을 통해 야구를 가장 밑바닥까지 분석할 수 있게 되었다. 하지만 평균에서 오는 맹점을 비롯해 아직 완전히 해결하지 못한 문제들도 남아 있으며, 이에 대한 해답은 의외로 기성 세이버메트릭스 밖에서 발견될지도 모른다.


지금까지 환원주의적 접근은 많은 성과를 이루어냈지만 현대 사회는 환원주의를 넘어 여러 학문이 융합되는 통합의 시대로 나아가고 있다. 세이버메트릭스도 언젠가 유사한 길을 걸을 것이다. 통합의 시대, 세이버메트릭스는 어떻게 발전해 나갈 것인가.


기록 출처 : http://gregstoll.dyndns.org/~gregstoll/baseball/stats.html#H.-7.9.2.1


euler@bizballproject.com

 

 

bizball project [페이스북] [홈페이지]

저작권자 ⓒ bizball project, 무단 전재 및 배포 금지

하이파이브 4 공감하면 하이파이브 하세요!

댓글 1

세이버매트릭스, 2차스탯, 클래식 스탯, qr 성공률, 대체선수대비승리기여도, 추가승리확률, WAR, WPA, OPS, 퀄리티스타트

    • 등급 김필중
    • 2016.04.26 14:10
    • 답글

    이런 기사 좋아요~

등급
답글입력
Top
등급
답글입력
  • 등급 닉네임 어쩌고
  • 2014.03.16 23:43
수정취소 답글입력
닫기
TOP