야구 데이터 시각화 프로젝트

nacyot
4 min readJul 26, 2015

--

野信(야신) Project

  1. 야신(野神) — 야구의 신
  2. 야신(野信)— 야구에서 발생하는 신호

소개

야신 프로젝트에서는 야구에서 발생하는 신호(기록)들을 수집해서, 이 데이터들을 ‘다른 관점’으로 조망한다. 우리는 같은 정보에 대한 ‘다른 관점’을 찾는다.

다른 관점으로 승패 데이터 살펴보기

예를 들어 2014년 시즌을 마친 삼성 라이온스의 승패 데이터를 살펴보자.

삼성 라이온스 128전 78승 47패 3무, 승률 0.624

일반적으로 이러한 데이터는 각 팀에 대한 ‘최종’ 승패 정보와 승률 그리고 거기에 추가적인 정보가 담긴 표 형태로 정리된다. 이 정보는 간결하다. 하지만 정보가 지나치게 압축되다 보니, 한 시즌 동안 진행된 각 팀의 구구절절한 이야기와 각 경기에 대한 모든 정보가 사라져 버린다.

이 정보를 다른 관점에서 조망해보자. 단순한 표를 넘어서 이제, 데이터를 평면 위에 배치한다. X 축은 패를 의미하고 Y 축은 승을 의미한다. 이 ‘승패 평면’ 위에 한 시즌 동안 한 팀의 모든 경기를 점으로 기록한다. 이렇게 하면 X 축과 Y 축의 기하학적인 관계에 의해서, 데이터들이 스스로 자신의 승률을 나타내게 된다. 물론 이 데이터는 문장 하나로 표현했던 승패 데이터와 똑같은 결과를 보여준다. 하지만 이렇게 시각화된 결과물은 문장 형태의 승패 데이터를 고스란히 담고 있을 뿐 아니라, 한 시즌의 모든 게임도 평면 위에서 보여준다.

2014년 삼성 라이온스 승패 시각화

이 그림에는 우리가 알고 있는 것보다 더 많은 이야기가 그려져 있다. 단순히 삼성 라이온스의 2014년 최종 성적 뿐만 아니라, 한 시즌에 치른 모든 경기가 담겨 있다. 각 점들은 경기 결과(승/패)에 따라서 이동한다. 각 점의 위치는 승률과 승패에 대한 기록을 모두 나타내며, 또한 각 점의 크기는 경기의 결과(점수차)를 보여준다. 나아가 승패가 쌓여감에 따라 점들이 점점 우상단으로 이동하고, 이를 통해서 한 시즌의 최종 승률이 아닌 한 시즌 동안의 승률 추세를 함께 볼 수 있다.

여러 팀의 승패 데이터 살펴보기

이번엔 모든 팀에 대해서 생각해보자. 한 시즌 동안 모든 팀의 최종 결과는 보통 다음과 같은 표로 나타난다.

2014년 프로야구정규시즌 결과(표)

이번에는 이 모든 팀의 경기를 ‘승패 평면’ 위에 올려보자. 한 시즌 전체를 온전히 하나의 그림 위에 펼칠 수 있다. 승패 표에는 최종 결과만 존재하지만, 승패 평면 위에는 한 시즌의 모든 경기가 그려져 있다.

2014년 프로야구 정규시즌 승패 시각화

승패 데이터를 넘어

야구는 데이터의 스포츠다. 야구에서는 승패 데이터 뿐만 아니라 타석 정보나 다양한 스탯 등 굉장히 다양한 신호들이 발생한다.

데이터들을 숫자로 보여주는 것도 가능하다. 하지만 우리는 이 데이터들이 스스로 다른 모습을 드러내도록 만든다.

결론

매우 단순하지만, 우리는 지금껏 이러한 정보를 접해본 적이 없다. 시각화는 작은 탐험이다. 이 탐험은 우리가 모르는 것들을 발견하기 위한 탐험이기도 하지만 — 이러한 탐험을 보통 데이터 분석이라고 부르고, 야구에서는 세이버메트릭스라고 한다 — , 우리가 이미 충분히 알고 있는 것들을 ‘다른 관점’에서 보기 위한 탐험이기도 하다.

그리고 야신 프로젝트는 야구 기록에 대한 탐험이다. 우리는 우리가 알고 있는 단순한 데이터로부터 출발해, 다양한 깊이와 ‘다른 관점’을 보여주기 위해 노력할 것이다.

이 모험을, 야구를 사랑하고 시각화에 관심있는 모두와 함께 할 수 있기를 희망한다.

--

--

nacyot
nacyot

Written by nacyot

당근마켓 클라우드 엔지니어 / SRE. 루비 프로그래머.