HC 사용 tip) 업로드할 엑셀 파일 형식

Sidney @HEARTCOUNT
HEARTCOUNT
Published in
2 min readNov 27, 2017

데이터 분석에 Tidy DataSet(분석하기 좋게 잘 정리된 테이블 형식의 데이터)이라는 개념이 있다. HeartCount에서도 캠페인을 등록할 때 아래와 같이 Tidy하게 정리되어 있는 엑셀(xlsx, csv, tsv) 파일을 올려야 한다.

  • 첫번째 칼럼: 변수 명으로 구성 (예, 나이, 국가, 매출, 할인율 등)
  • 열(Column; Variable): 동일한 속성/변수(예, 국가)에 대한 측정값(예, 미국, 일본, 한국, 프랑스, 중국 등)으로 칼럼(Column)을 구성;
  • 행(Row; Observation): 동일한 대상(사람/사물)이나 사건에 대한 다양한 측정값들(예, 국가=미국, 인구수=242,454, 환자수=457 등)로 개별 레코드(Row)를 구성
  • 측정값(Values): 행과 열로 구성된 개별 Cell들에 담긴 변수값을 지칭

특정 열은 숫자형 변수(나이, 매출, 연봉 등) 또는 범주형 변수(학력, 상품군, 고객군 등) 두가지 중 하나로 자동 구분되는데 사용자가 변수의 종류를 지정하기 위해 추가적인 작업을 할 필요는 없다. 하지만, 동일한 열에 숫자와 텍스트가 섞여 있는 경우 범주형 변수로 인식되거나 경우에 따라 업로드가 잘 안될 수 있다.

HeartCount에서는 날짜 형식의 데이터(2017/01, 2017/02, 2018–01–24 등)와 [0, 1] 달랑 두가지 값만을 갖는 숫자형 변수는 자동으로 범주형 변수로 처리된다.

업로드하기(=캠페인으로 등록하기) 좋은 몇가지 엑셀 데이터 양식을 살펴보면 다음과 같다.

[업로드하기 딱 좋은 매출 데이터 예제]
[업로드하기 좋은 인사 데이터 예제]

--

--