HEARTCOUNT 사용법] 바차트

Sidney @HEARTCOUNT
HEARTCOUNT
Published in
5 min readJul 14, 2018

서로 다른 범주가 갖는 변수값의 크기(Quantitative Amount)를 비교하는 가장 효과적인 시각화 방법은 바차트이다.

스마트 플롯 메뉴에 새롭게 추가된 바차트 기능을 살펴보자. (사용법에 익숙한 고급진 사용자들은 아래 움직이는 그림만 보아도 충분하겠다.)

Bar Chart(Plot)

  • X축에 나타낼 변수를 숫자형 변수 말고 범주형 변수 선택 (아래 X: 사업장)
  • 하위그룹: X축 선택 (노랑색; 뿔뿔이 흩어져 있던 개별 레코드를 X축 기준으로 그룹핑하겠다는 의미)
  • 바차트 아이콘 클릭(파랑색)
  • 바 크기 순으로 정렬하고 싶으면 정렬버튼 클릭(보라색)

그런데, Y축이 0부터가 아니라 47부터 시작되어 있다. 이게 싫다면 (Y축에 0이 보이게 하려면) 아래 그림(노랑색)처럼 하면 된다.

일부 순수주의 데이터 시각화 이론가들은 Y축의 시작점을 인위적으로 조정하면 절대 안 된다고 주장하는데, 이건 작은 차이를 과장하기 위해 Y축을 잘라냈던 사람들과 그리고 여기에 속았던 사람들이 있었기 때문이다.

Y축의 시작점을 0이 아니라 화면에 표현해야 하는 전체 Y값의 분포에 따라 온당하게 조정하는 일은 차트를 보는 사람들이 주어진 차이를 보다 쉽게 인지하게 하려는 의도라면 칭찬받을 일이다. 다만, 겨자씨만한 차이를 막 과장하려고 하는 의도가 있다면…차트가 아니라 그 사람이 나쁜 사람이다…

[참고: https://qz.com/418083/its-ok-not-to-start-your-y-axis-at-zero/]

우리는 종종 두가지 범주를 동시에 사용하여 범주들 간의 차이를 비교해야 하는데 이 때 사용하는 바차트가 Grouped and Stacked Bar Plot이다.

Grouped Bar Plot

Grouped Bar Plot에서는 첫번째 범주를 X축에 배열한 후, 두번째 범주(하위그룹)를 각각의 첫번째 범주 내에 배열하게 된다.

예제를 통해 살펴보면

  • X축에 범주형 변수 (아래에서는 나이_bin[나이를 균등한 구간으로 나눈 파생변수]) 선택
  • 하위 그룹에 두번째 범주형 변수 선택(초록색; 직군 선택)
  • 정렬을 알파벳 순으로 변경(보라색; 직원만족도 순으로 나이_bin을 정렬하지 않고 나이 구간이 증가하는 순으로 나이_bin을 정렬)
  • 첫번째 바차트 아이콘 선택(이미 활성화되어 있다면 불필요)

Grouped Bar Plot은 범주의 가짓수가 너무 많은 경우, 우리가 처리해야 하는 정보가 너무 많아져서 해석이 어려워진다. 내가 궁금한 게 직군별 나이에 따른 만족도의 차이라면 X와 하위그룹을 서로 바꾸어 아래처럼 표현해 볼 수도 있다.

Stacked Bar Plot

막대들을 나란히 세워놓지 않고 종으로 차곡 차곡 쌓는게 더 효과적일 때가 있는데 이 때 사용하는 시각화 방법이 Stacked Bar Plot이다.

하위범주(그룹)를 차곡차곡 위로 쌓는 Stacked Bar Plot은 개별 범주들의 “평균”값보다는 “갯수”나 “총합”으로 쌓아야 시각적 효과와 해석이 어긋남이 없다.

남학생 숫자 + 여학생 숫자 = 전체 학생수

남학생 몸무게 총합 + 여학생 몸무게 총합 = 우리반 몸무게 총함

남학생 키 평균 + 여학생 키 평균 = 그냥 할 수 있어서 평균을 더한 것임.

아래는 Y축을 직원만족도의 “평균”이 아니라 “갯수”(=직원수)로 변경한 후 하위그룹(나이_bin)을 Stacked Bar Chart(두번 째 아이콘)로 표현한 그림이다.

사업장별 직원수의 차이, 개별 사업장 내에서 나이 구간별 직원 수의 차이를 한 눈에 비교할 수 있다.

아래는

  • Y축에 표현할 변수를 [불량건수]로 변경한 다음
  • 변수에 대한 계산을 “갯수"에서 “합”으로 변경한 후
  • 정렬 방식을 내림차순으로 변경한 그림이다.

관심있는 세그먼트를 클릭하면 해당 세그먼트에 대한 상세정보를 볼 수 있다.

소소하지만 유용한 기능들이 많지만 미지의 세계를 탐험하는 마음으로 이렇게 또 저렇게 사용하면서 스스로 발견하는 기쁨을 위해 여기서 끝.

--

--