[서울시 먹거리 분석-6] 시각화 해석

미완성의 신
4 min readApr 20, 2019

--

이번에는 지난 블로그에서 시각화 한 내용을 통해 특이사항을 찾고 왜 이런 원인이 생겼는지 파악해보는 내용을 다룰 예정이다. 지난 블로그는 아래와 같다.
- [서울시 먹거리 분석-5]1월 요식업계 통화량 시각화

목차, 기획 블로그
- [서울시 먹거리 분석] — 통화량을 통한 분석 기획

1. 날짜별 치킨, 중국집, 피자 시각화 파악해보기

먼저 날짜 별로 치킨, 중국집, 피자의 통화량 시각화한 결과를 보도록 하자.

  1. 일주일 별로 점점 올라갔다가 내려가는 경향을 보인다.
    -> 이는 주말에 보통 많은 주문을 하는 것으로 보인다.
  2. 데이터의 양은 치킨, 중국집이 피자집보다 많다.
  3. 평일에는 중국집이, 주말에는 치킨집이 더 많다.
    -> 아무래도 중국집은 평일 회사에서, 치킨집은 주말에 치맥과 함께여서 그럴까?
  4. 주말에 주로 올라가는 치킨집의 특성에 비해 평일에 크게 증가한 통화량이 눈에 보인다.
    -> 1월달에 아시안컵으로 축구를 했는데 이게 원인이 아닐까?
  5. 아무리 주말에 치킨집 통화량이 많아도 특정 하루는 너무도 많은 통화량을 갖고 있다.
    -> 이 역시 특정 이벤트(축구)로 생각해보고 있다.
  6. 치킨집, 중국집은 금토에 가장 많고 일요일날 감소 하는 경향을 보이는데에 반해 피자집은 월 ~ 일요일까지 꾸준히 증가 하는 경향을 보인다.

2. 지역별 치킨, 중국집, 피자 시각화 파악해보기

이번에는 지역별로 파악을 해보려 한다. 지역별로 업종별로 통화량에 차이가 이어서 이번에는 구분을 짓고 정렬을 시켜서 보자.

2 – 1.치킨 으로 정렬

치킨과 피자의 지역별 통화량은 매우 닮아 있다. 치킨과 피자를 같이 생각하고 그래프를 보도록 해보자.

  1. 도봉구 에서 강서구로 점차 통화량이 증가 하는 것을 볼 수 있다.
  2. 신기한건 확실히 중국집과 자주 통화량의 지역별 분포가 다른 점이다.
  3. 일단 치킨의 주요 통화량 지역을 상위 5개로 보려고 하면 강서구, 강남구, 동작구, 서초구, 송파구 이런 순서대로 되어 있다.
    -> 이 데이터를 서울시지도에 녹여 보면 인접한지 알아 볼 수 있을것 같다.

2 - 2.중국집으로 정렬

이번에는 중국집으로 정렬을 하여 그래프를 보도록 하자.

  1. 구별로 봤을떄 최고점은 강남구가 치킨집 강남구 보다 통화량이 많다.
    -> 회사가 강남에 몰려있나? 이유가 무엇일까..
  2. 중국집과 치킨집의 지역별 통화량이 눈에 띄게 다른데 이유가 무엇일까?
  3. 중국집의 주요 통화량 지역을 상위 5개로 보려고 하면 강남구, 중구, 강서구, 서초구, 서대문구 이런 순서대로 되어 있다.
    -> 이 데이터를 서울시지도에 녹여 보면 인접한지 알아 볼 수 있을것 같다.

Summary and 중간점검

이번에는 그래프를 통해 어떤 해석이 나올 수 있는지 찾아 보았다. 이제 앞으로 어떤 블로그를 쓰면 될 까? 이 해석을 토대로 좀 더 깊이 있게 알아보고 이를 어떻게 사용할지 에 대한 블로그를 써보려 한다. 대충 주제는 다음과 같다.

원인파악 블로그 중점 사항

  1. 요일별 그래프에서 특정 날짜에 증가를 했는데 얼마나 증가 했고 이 원인이 무엇인가?
  2. 지역별로 통화량이 치킨과, 중국집이 현저히 다른데 이 원인은 무엇인가?
    - 사람들이 거주 하는것이 원인일까?
    - 번화가인 지역이 따로 있는가?

이러한 정보를 어떻게 사용할까?

  1. 내가 치킨집, 중국집 사장이라면? 재고 관리를 어떻게 할까? 특정 날짜에 갑자기 통화량이 쏠리면 이를 감당할 재고, 인력이 충분할까? 이 모든것을 지난 2018년의 모든 데이터를 통해, 그리고 앞으로 있을 축구? 일정을 미리 집어 넣으면 커버가 가능 할까?
  2. 내가 치킨집, 중국집, 피자집에 납품을 하는 밀가루 업체 사장이라면? 어디를 어떻게 중점적으로 찾아봐야 할까?
  3. 날짜별 지역의 그래프를 한번 보면 알 수 있을까? 이는 움직이는 그래를 사용 해야 하는데 찾아본 것이 있으니 사용해 볼 가치가 있을 것 같다.

2018년의 데이터를 통해 앞으로 있을 2019년을 예측해보자.

2018년의 데이터를 중심으로 2019년에 있을 데이터를 예측해 볼 것이다. 이때에는 앞으로 있을 특별한 이벤트를 그대로 데이터에 녹여서 특정 이벤트도 모두 커버 할 수 있도록 만들 예정이다.

분석 결과를 자동화 하여 반응형 RMarkdown을 만들자.

고객관리 자동화 프로그램? 처럼… 업계 사장의 입장에서 스스로 주문량을 뽑아내고, 스스로 인력을 감당 할 수 있도록? 그리고 밀가루? 업계의 입장에서 어느 지역을 어떻게 배송을 해주어야 하는지.. 일별로 데이터를 받아서 이를 실행 해볼 예정이다.

--

--

미완성의 신

우리 인간은 미완성의 신들이다. 뛰어난 데이터 과학자를 꿈꾸는. 책을 좋아하는. 그런 사람입니다.