HEARTCOUNT) 시계열 분석

Sidney @HEARTCOUNT
HEARTCOUNT
Published in
3 min readFeb 10, 2022

시계열(時系列, time-series) 데이터는 일정한 시간 간격으로 관측, 수집된 데이터를 말합니다. 시계열 모델 개발이 아니라 탐험적 분석(EDA) 또는 의사결정을 위한 실무적 관점에서 시계열 데이터를 분석하는 주요 목표는 날짜 변수에 내재된 주기적 특성이 매출과 같은 다른 주요 변수에 어떠한 영향을 주었는지 이해하는 것입니다.

EDA 관점에서 날짜(:시간) 데이터와 목표 변수 간의 관계를 살펴볼 때는 아래 정도를 고려하면 됩니다.

  • 추세(Trend): 시간(분기, 월, 날짜, 시간)의 흐름에 따라 상승, 하강하는 경향성
  • *주기적/순환적 특성(Cyclic Pattern): 시간대, 요일, 주, 월, 분기/계절에 따른 패턴이 매 사이클 (하루, 일년) 마다 반복해서 나타나는 경향

*이론서에는 계절적 특성을 분리해서 Seasonal Pattern으로 따로 설명하기도 합니다.

서론은 이만하고, 바로 기능을 살펴볼까요? TV 홈쇼핑 사이트의 취소율 데이터를 사용해 보겠습니다. 질문은 어떤 주기적 특성이 취소율에 영향을 주나? 입니다.

가. 데이터셋

  • 데이터셋은 제품이 판매된 날짜와 시간, 해당 상품의 취소율 등으로 아래처럼 구성되어 있습니다.
  • 위 데이터셋을 HEARTCOUNT에 올려서 상품 취소율 변수를 KPI로 지정해 주었고 다음은 자동으로 분석된 결과입니다.

나. 파생 날짜 변수

  • 하트카운트는 EDA 및 자동 분석의 결과를 풍부하고 쓸모있게 하려고 원시 변수에서 파생변수를 생성합니다.
  • 날짜 변수의 경우, 아래 그림 처럼 분기별/월별/주별/요일별/요일유형(주중, 주말), 시간대별 주기 변수를 자동으로 생성해서 시각화 및 필터링에 사용할 수 있습니다.
[필터링 메뉴에서 자동으로 생성된 날짜 파생 변수를 확인할 수 있다]
[자동 생성된 시간별 주기 파생변수로 특정 상품의 시간대별 취소율을 시각화한 내용]

다. 주기적/계절적 패턴 자동 분석된 결과

  • 아래 이미지는 수동으로 진행한 EDA 화면이 아니라 HEARTCOUNT의 Smart Discovery 엔진을 통해 자동으로 계절적 패턴을 찾은 결과입니다.
  • 여름과 겨울 시즌에 취소율이 상승하는 것을 확인할 수 있네요.

HEARTCOUNT에 대한 더 자세한 정보는 여기를 클릭해 주세요.

--

--