Small Multiples: 수많은 작은 창들을 통해 데이터를 거시적으로 조망하기

Sidney @HEARTCOUNT
4 min readJan 26, 2018

--

데이터 분석은 수학과 마찬가지로 사람이 배우지 않아도 자연스럽게 잘 할 수 있는 일이 아니라는 점에서 비인간적인 행위입니다. 하지만, 인간이 다른 숨쉬는 것들과 비교해서 뛰어난 점은 인공적인(Artificial) 일들을 배워서 곧 잘 해낸다는 데 있습니다.

사람이 추상화 과정을 통해 믿음(마음 속의 Mental Model)을 형성하듯 통계적 알고리즘 역시 (현실의 반영인) 데이터에 대한 추상화 과정을 거쳐 모형을 만들게 됩니다. 그래서 모든 모형은 필연적으로 큰틀에서는 맞지만 세부를 꼼꼼히 따지고 들면 틀릴 가능성을 내포하고 있습니다.

데이터 시각화의 가치는 큰 경향성과 세부를 함께 보여주어 큰틀과 세부(Outliers)에 대해 함께 이해할 수 있다는 것입니다.

주어진 세계(데이터셋)에 대한 거시적 이해를 위해서 추상화(Modeling) 과정은 피할 수 없습니다. 통계적 모형은 (모형의 작동방식이 투명한 경우) 모형에 담긴 내용에 대해 여러 사람들로부터 객관적으로 평가를 받을 수 있는데 반해 우리 마음 속의 모형은 마음 속에 뚜렷한 형체없이 존재하기 때문에 객관화가 어렵다는 차이가 있습니다.

전체에 대한 포괄적 이해와 세부에 대한 미시적 이해를 통한 앎의 객관화가 더 좋은 의사결정을 위해 중요한 가치라는데 동의할 수 있다면 데이터 분석은 한 번 배워볼만한 비인간적인 행위라고 생각합니다.

오늘은 HeartCount의 새로운 기능인 Small Multiples(스몰 멀티플즈)에 대해 소개드리겠습니다.

아래 그림은 삼부작으로 만들어진 역대 영화들에 대한 관객들의 만족도를 Small Multiples로 표현한 내용입니다.

삼부작 영화들에 대한 평가를 Small Multiples로 시각화

Small Multiples은 데이터 시각화의 선구자인 Edward Tufte가 처음 선보였는데 다양한 차원(변수/칼럼)을 가진 데이터를 여러(multiples) 작은(small) 창에 표현하여 하나의 화면에 너무 많은 변수를 표현하여 보는 사람을 당황스럽게 하는 우(Overplotting)를 범하지 않도록 해줍니다.

또한, 하나의 창에 표현된 내용을 시각적으로 해석하는 요령을 터득한 후 동일한 요령으로 나머지 창들을 해석할 수 있어 분석가(데이터 소비자)가 차트를 해석하는 노력을 최소화하고 데이터가 이야기하는 것에 온전히 집중할 수 있도록 해줍니다.

그리고, 동일한 분석 주제(Y)를 데이터셋에 담긴 여러 변수들(X) 각각의 관점에서 한눈에 조망, 비교할 수 있어 주어진 데이터셋에 대한 거시적 관점이나 비교를 통한 패턴을 찾도록 도와줍니다.

아래는 HeartCount에서 새롭게 추가된 Small Multiples 화면입니다. 특정 변수(Y; KPI)와 다른 모든 변수들의 관계를 거시적으로 관찰하는데 활용될 수 있습니다. 특히, 설문 데이터와 같이 문항 사이에 상관관계가 높은 경우 특정 문항과 다른 문항들 간의 상대적 관계 크기를 전체적으로 비교하는데 유용하게 활용될 수 있습니다.

숫자형 변수(Y)를 선택하면 엑셀에 포함된 나머지 모든 변수에 대해

  • 숫자형 변수는 Y와의 상관관계와 밀도(density; 농담이 짙을수록 레코드가 밀집해 있음)를 상관관계가 높은 순서에서 낮은 순서로 보여주고
  • 범주형 변수는 개별 클래스(범주형 변수[색상]에 포함된 개별 변수값[빨강, 노랑, 파랑 등])에 대한 평균값을 보여줍니다.
[HeartCount의 Small Multiples 화면; 한글로 스몰 멀티플즈라고 적으니 왠지 촌스럽다. ㅠㅠ]

개별 창을 Zoom-in하여 자세히 살펴보고 싶으면 선택된 창 우측에 나타나는 스마트링크를 클릭하시면 됩니다. (새로운 창에서 확인하려면 Alt+마우스클릭 또는 우클릭 후 “새로운 창에서 열기” 선택)

[스마트링크를 통해 상세화면으로 이동]

짧은 동영상도 준비했습니다.

--

--