[D3] 차원값과 측정값

circlegiven
오늘만 사는 개발자 🥹
5 min readApr 26, 2022
Photo by Justin Morgan on Unsplash

D3에 들어가기 앞서 차원값(Dimension)측정값(Measure)에 대해 알아야 한다.

사실 차원값측정값이라는게 정확한 모든 차트에 통용되는 용어는 아니다.
단지 유명한 프로그램이나 차트에서 불리는게 차원값, 측정값 일 뿐이다.

통계에서 사용되는 말처럼 연속성이냐 불연속성이냐, quantitative 하냐 categorical 하냐 가 정확하지만 너무 어려워지기 때문에 앞으로는 차원값 측정값이라 하겠다.

두 값(차원값 측정값)을 어떻게 설정하느냐에 따라 Chart가 아예 그려지지 않거나, 원하는 형태로 그려지지 않을 수 있다.

그러므로 차트를 그리기 위해
어떤 데이터를 기준으로 분류 할 것이냐
어느 데이터를 측정하고 집계 할 것이냐
가 중요하다.

데이터가 보통 같은 형태로 나오는데 이 데이터들을 보고 측정값과 차원값을 결정해줘야 된다.

간혹 차트가 이상하게 나온다고 말하는 경우가 있다.

“line 차트가 겹쳐서 나와요!”

보통 이 경우에는 한 차원값에 여러 측정값이 있기 때문이다.

“bar 차트인데 bar 상단에 표시되는 value가 겹치네요?”

이 경우에도 한 차원값에 여러 측정값이 존재하기 때문이다.

차원값 Dimension

분류적인(categorical) 정보를 포함하거나 불연속적인 데이터이다.
주로 차트에서는 분류 값을 의미한다.
기준이 되는 축에 주로 표시된다.

측정값 Measure

양적인(quantitative) 정보를 포함하거나 연속적인 데이터이다.
주로 차트에서는 집계 값을 의미한다.
차트에 주로 표시된다.

용어만 보면 감이 안 잡히니 예제를 봐보자.

// data, name, category, value
2000-01-01,Intel,Technology,39048
2000-01-01,Nokia,Technology,38528
2000-01-01,GE,Diversified,38127
2000-01-01,Ford,Automotive,36368
2000-01-01,Disney,Media,33553
2000-01-01,McDonald's,Restaurants,27859
...
2004-01-01,Intel,Technology,33499
2004-01-01,Disney,Media,27113
2004-01-01,McDonald's,Restaurants,25001
2004-01-01,Nokia,Technology,24041
2004-01-01,Toyota,Automotive,22673

위 예제는 date, name, category, value로 구성된 데이터이다.

여기서 차원값과 측정값을 정해본다면
어느것이 차원값이 될 수 있고, 측정값이 될 수 있을까?

분류적인 성격을 띄는 데이터는 date, name, category 이므로 차원값이 될 수 있다.
양적인 성격을 띄는 데이터는 value 이므로 측정값이 될 수 있다.

2000년(date)에 해당하는 기업(name)의 수익(value)을 bar차트로 그려본다면 아래와 같이 표시될 것이다.

여기서는 차원값과 측정값은 무엇일까?

차원값은 기업(name)이고, 측정값은 수익(value)이다.

그렇다면 항상 차원값과 측정값은 한 개씩만 존재 해야되는걸까?

꼭 그런것은 아니다.

차트의 형태마다 다르고 어떻게 구성하냐에 따라 달라 질 수 있다.

이런 히트맵 차트의 경우는 차원값이 2개가 되는 것이다.

어떤 것을 기준으로 분류를 하고 어떤 값을 표시할 지가 중요하다.

참고 링크

--

--