골드 글러브, 투표와 지표 사이

메이저리그에서는 매 시즌 포지션별 최고의 수비수에게 ‘골드 글러브’ 상을 수여한다. 1957년부터 이어져 온 골드 글러브 시상은 오랜 시간동안 감독과 코치들의 투표로 수상자를 선정했다. 하지만, 수비는 기록지만으로 판단하기 어려운 플레이가 많을 뿐더러 개인의 주관이 개입되기 쉬운 영역이다.
양키스의 레전드 유격수인 ‘데릭 지터’가 그 예시다. 그는 커리어 내내 총 5번의 골드 글러브를 수상했다. 그러나 그가 골드 글러브를 수상했던 시기인 2004년부터 2010년까지의 수비 지표를 살펴보면, 하위권을 맴도는 수비 수치를 기록했다. 그럼에도 불구하고 수비력이 뛰어난 동시대 유격수들을 제치고 5번이나 골드 글러브를 수상한 부분에 대해 의문을 남긴다. 또한 1999년 1루수로 단 28경기 출장에 그쳤음에도 1루수 골드 글러브를 수상한 ‘라파엘 팔메이로’ 같은 어처구니 없는 수상 사례도 존재한다.
이러한 한계를 보완하기 위해 메이저리그는 2013년부터 세이버매트릭스 기반의 수비 지표를 일부 반영하여 수상자를 선정하기 시작했다. 여기에 더해, ‘라파엘 팔메이로’와 같은 사례를 다시 낳지 않기 위해 수상 자격 요건을 수정했다. 그렇다면 수비 지표를 반영한 2013년 이후의 골드 글러브는 정말 포지션별 최고의 수비수를 가려내고 있을까?
현재 골드 글러브 수상자 선정은 SDI(SABR Defensive Index)와 감독·코치진의 투표를 각각 25%1, 75% 반영하는 것으로 알려져 있다. SDI는 SABR2의 회원들의 연구를 통해 주요 수비 지표들을 균형있게 종합하여 만든 하나의 종합적 수비 지표다.
SDI는 두 가지 유형의 수비 지표로 구성된다. 타구 위치 기반 데이터에서 산출된 지표 70%, 플레이 바이 플레이 기록으로 산출된 지표 30%를 반영한다. 타구 위치 기반 지표에는 DRS, UZR, RED라는 세 가지 지표를 반영하고, 플레이 바이 플레이3 기반 지표에는 DRA와 TZ를 반영하는 것으로 알려져 있다.

그렇다면 타구 위치 기반 지표는 무엇일까? 대표적으로 UZR(Ultimate Zone Rating)이 있다. UZR은 그라운드를 78개의 구역으로 나눈 후, 각 구역의 포지션별 평균 아웃 처리 비율을 산출하는 것으로 시작한다. 이후 야수가 기록한 아웃 처리 비율에서 리그 평균을 빼고 가중치를 부여하는 등 복잡한 보정 과정을 거쳐 최종적인 UZR 값이 산출된다.
DRS(Defensive Run Save)도 기본적인 틀 자체는 유사하다. 다만 UZR보다 그라운드를 더 작은 단위로 나눈다는 차이가 있으며, 보정 과정에서도 차이가 발생한다.
상술한 UZR과 DRS는 모두 BIS(Baseball Info Solutions)에서 제공한 데이터를 사용하지만, TZ(Total Zone)는 Retrosheet에서 제공하는 플레이 바이 플레이 데이터만을 활용하여 계산되는 수비 지표다.
TZ의 계산 방식은 Retrosheet 데이터의 상세 수준에 따라 세 가지로 나뉜다. 데이터가 제한적인 시기에는 타자의 커리어 타구 분포를 기반으로 수비 책임을 추정하고, 타구 유형과 처리 수비수가 명확해진 시기에는 포지션 간 책임을 분배해 보다 정교한 계산을 수행한다. 1989년부터 1999년까지는 Project Scoresheet의 존 데이터를 활용해, 타구 위치별 난이도까지 반영한다. 외야 송구, 내야 더블플레이, 포수 관련 데이터는 모든 시즌에서 동일한 방식으로 계산된다.
TZ는 추가적인 타구 추적 시스템이나 관측 데이터 없이도 값을 산출할 수 있다. 덕분에, 야구 역사상 어떤 선수에 대해서도 TZ 점수를 산출할 수 있다는 장점이 있다. 이러한 이유로 베이스볼 레퍼런스, 팬그래프 닷컴도 2002년 이전 선수 WAR 계산에 TZ 점수를 사용한다. 현대 지표와 동일한 정밀도는 아닐지라도, 서로 다른 시대의 선수를 같은 잣대로 비교할 수 있는 거의 유일한 대안이다.
표기 방식은 UZR이나 DRS와 동일하다. ‘수비로 억제한 득점'(Runs Saved)로 표기되며, 리그 평균을 0으로 설정한다. 양수는 리그 평균 이상의 수비력을, 음수는 리그 평균 이하의 수비력을 나타낸다. +10이라면 평균적인 수비수보다 10점을 더 막아낸 것이고, -10이라면 평균적인 수비수보다 10점을 더 허용한 것이다.
SDI는 단일 지표의 한계를 피하기 위해, 서로 다른 관측 방식에서 산출된 수비 지표들을 혼합해 보다 안정적인 평가를 지향한다.

<아시아 내야수 최초로 골드 글러브를 수상한 김하성>
SDI가 반영된 이후 수상자들이 각 포지션별 최고의 선수인지에 대해서는 완벽히 그렇다고 대답하긴 어렵다. 실제로 도입 이후 10시즌의 결과를 살펴보면, 매 시즌 평균 5.9명의 선수가 해당 포지션에서 수상자보다 더 높은 SDI 점수를 기록했음에도 글러브 수상에 실패했다. 일례로 2023 시즌의 김하성은 내셔널리그 2루수 중 가장 높은 SDI를 기록했지만, 니코 호너에 밀려 2루수가 아닌 유틸리티 부문 수상에 그쳤다4.
이러한 점은 수비 지표가 일정 부분 반영되고 있음에도, 여전히 투표 비중이 높은 주관적 평가가 결과에 상당한 영향을 미치고 있음을 시사하는 단적인 예시다. 다시 말해 SDI의 도입은 고전적이던 이전까지의 수상 방식에 상당한 진전이지만, 그것만으로 공정성에 대한 논란을 해소했다고 보긴 어렵다. SDI와 현장 투표의 반영 비율을 조정하는 등, 제도적 보완이 여전히 필요하다는 점을 보여준다.
그렇다면 골드 글러브는 어떤 방향으로 나아가야 할까. 가장 현실적인 대안은 SDI의 반영 비율을 단계적으로 확대하는 것이다. 현재 25%에 불과한 반영 비율은 ‘보조 지표’ 이상의 역할을 수행하기 어렵다. 이를 상향한다면, 투표 왜곡을 막는 최소한의 안전장치가 될 수 있을 것이다.
또한, 정확한 SDI의 계산식을 공개하여 투명성을 강화하는 것도 수상에 대한 논란을 잠재울 수 있는 요소가 될 것이다.

<10년 연속 3루수 부문 골드 글러브를 수상한 놀란 아레나도>
통계 지표는 어디까지나 참고 자료일 뿐, 맹신의 대상이 될 수 없다. 롤링스 측에서도 “골드 글러브는 전반적인 수비 우수성을 나타내는 상이며 단순히 수비 지표나 통계에만 기반한 상이 아니다”라고 설명한다. 수비 지표 역시 객관성을 추구하지만, 그 기준을 설계하고 가중치를 부과하는 과정엔 사람의 주관이 개입된다. 따라서 최고의 수비수를 평가하는 데 있어 수비 지표만으로 결론을 내리는 것은 또다른 한계를 낳을 수 있다.
그렇다고 해서 여전히 감독·코치진의 투표가 수상에 크게 반영되는 현행 방식이 옳다는 것은 절대 아니다. 이는 현장의 경험과 ‘기록에 나타나지 않는 부분’을 반영한다는 장점이 있지만, 동시에 객관적 기준과의 조화가 필요하다는 과제를 남긴다.
수비 지표와 현장의 시선은 대립하는 개념이 아니다. 오히려 서로를 보완해야 할 관계에 가깝다. 골드 글러브의 의미 또한 두 가지 시선이 어떻게 균형을 이루느냐에 따라 더욱 공정한 상이 될 것이다.
골드 글러브는 무작정 수치로만 선수를 나열해야 하는 상도, 누군가의 주관으로 시상하는 상도 아닌, ‘가장 설득력 있는 수비 평가’여야 한다.
각 팀의 감독과 최대 6명의 코치가 자신의 팀 선수를 제외한 선수들에게 표를 행사한다. SDI는 약 25%가 반영되지만 실제 투표율에 따라 반영 비율에 차이가 발생할 수 있다. ↩︎
SABR은 미국야구연구협회(Society for American Baseball Research)로, 야구 역사와 기록 연구를 위한 비영리 학술·연구 단체이다. ↩︎
플레이 바이 플레이(Play-by-play)란 경기에서 발생한 모든 플레이를 단위별로 기록한 원천 데이터다. ↩︎
해당 시즌 김하성이 유틸리티 플레이어로 기용되었으나, 2루수로 856.2이닝을 소화하여 자격은 충분했다. ↩︎