[서울시 먹거리 분석 — 3] 1월 중국집 이용 통화량 분석

미완성의 신
4 min readMar 26, 2019

--

이번에는 1월 중국집 이용 통화량 분석을 해보자. 지난 블로그에서 1월 치킨집 이용 통화량 분석을 시도 해보았으며, 매우 흡사하게 진행을 할 것이다.
구체적인 인사이트는

  • 치킨집, 중국집, 피자집 데이터를 모두 합쳤을 때,
  • 18년 2월~ 19년 1월까지의 데이터 까지 모두 합쳤을 때,

무언가가 나올 것 같다.

목차, 기획 블로그
- [서울시 먹거리 분석] — 통화량을 통한 분석 기획

Data

데이터는 이곳에서 다운 받는다. 19년 1월 서울시 중국음식 판매업종 이용 통화량

지난 치킨집 이용 통화량 분석을 했을때, 다운로드 수가 5에서 52까지 증가 했는데, 이번부터 기록을 해두고 스터디가 끝날 즈음에는 얼마나 늘었는지 확인 해보고자 한다.

1. Data 준비

먼저 분석에 알맞게 Data를 준비 하자. Data 준비는 지난 블로그에 했던것과 흡사 하며, 추가로 컬럼명을 영어로 변경 하도록 했다.

Call_cfood_01 <- read.csv("CALL_CFOOD_01MONTH.csv")# 컬럼 명 영어로 변경 
colnames(Call_cfood_01) <- c("date", "wday", "gender", "age", "city", "county", "town", "type", "call")
# 날짜 데이터 형 변환
Call_cfood_01$date <- as.character(Call_cfood_01$date)
Call_cfood_01$date <- as.POSIXct(Call_cfood_01$date, format = "%Y%m%d")
# 요일 데이터 순서 조정
Call_cfood_01$wday <- factor(Call_cfood_01$wday,
levels = c("월", "화", "수","목","금","토","일"))

2. NA 값 확인

NA 값을 확인 해본다.

> # Na값 확인
> sum(is.na(Call_cfood_01))
[1] 0

3. 지난번 처럼 연령, 요일 별 Data를 그룹화 해보자.

연령, 요일별 Data를 그룹화 해보자. 치킨의 경우에 금,토,일에 통화 건수가 높게 나타났는데 이번에는 어떻게 나올지 확인 해보자.

# 연령, 요일 별 Data 그룹화
data_by_years_days <- Call_cfood_01 %>%
group_by(age,wday) %>%
summarize(call = sum(call)) %>% as.data.frame()

그리고 이제 통화 건수를 순서대로 정렬하여, 확인 해보자.

> data_by_years_days %>% arrange(call)
age wday call
1 10대 일 1846
2 10대 월 2022
3 10대 토 2105
4 10대 금 2211
5 10대 화 2264
6 10대 목 2610
7 10대 수 2625
......
37 40대 금 14731
38 40대 화 16669
39 40대 일 16929
40 40대 수 16941
41 40대 토 17557
42 40대 목 17831
  • 참 이상하네? 물론 연령대는 대충 10대 << 40대로 나왔는데, 가장 많은 날이 금,토가 아니게 나왔다.
  • 그냥 금,토에 치킨 통화량이 많을걸까?
  • 그리고 최고 통화량도 치킨에 비해 (치킨 최고 약 22000건) 매우 부족하다.
  • 중국집 보다는 치킨 주문 건수가 더 많은가 보다.

4. 그럼에도 아직은 부족하다.

기존에 1월 치킨 판매량에서 분석 했던방법으로 했으니 부족한 무언가가 있을 것이다. 예를들면 시작부터 방향이 잘 못 되었다거나. 이때는 어느 도시에서 더 많이 통화가 더 많이 이루어졌는지 알아보는게 좋을까? 회사에서 보통 중국집 전화를 많이 할까? 영화 보면 그렇던데. 혹은, 치킨과 달리 중국집은 식사라는 개념이 더 있어서 그런것은 아닐까?

5. 모든 것은 1월의 치킨, 중국집, 피자 데이터를 합치고 다시 시작을 해보자.

이 분석의 최종 목표는 1년치의 치킨, 중국집, 피자집의 데이터를 모두 합치고 전반적인 인사이트를 찾아 보는 것이다. 일단, 여기에 너무 목매지 말고 빠르게 피자 데이터도 한번 스윽 보고 나서 다시 시작을 해보도록 하자.

어느정도 예상은 했었다. 피자 데이터는 어떨까? 다음 블로그에서 빠르게 확인을 해보도록 하자.

--

--

미완성의 신

우리 인간은 미완성의 신들이다. 뛰어난 데이터 과학자를 꿈꾸는. 책을 좋아하는. 그런 사람입니다.