snowflake를 활용한 간단한 공간 분석

juyun hwang
Snowflake Korea
Published in
3 min readJul 26, 2022

서울시가 제공하는 공공 데이터(bus 승하차 정보)를 활용하여 이를 시각화 하고, geospatial 쿼리를 통한 간단한 공간 분석을 해보자.

  1. 데이터 준비하기

서울시 열린 데이터를 통해 버스 정류장 데이터(2022.06) 수집

https://data.seoul.go.kr/dataList/OA-12912/S/1/datasetView.do

2. 데이터 적재

해당 파일을 S3에 올린 후에 copy 명령을 통해 해당 데이터를 snowflake에 적재

위와 같은 방식으로 각 버스 정류소의 위치가 포함된 테이블도 적재

3. 2차원 좌표계 데이터 포맷으로의 전환

공간 분석을 위해서는 위치를 표현하는 전용 데이터 포맷(geography)로의 변환이 필요함. 여기서는 x좌표와 y좌표를 이용하여 2차원 점데이터(point)로 변환

4. 공간 함수의 활용

geography는 각 공간 간의 거리, 포함여부, 중앙점 산출 등 다양한 기능을 제공함

여기서는 예시로 가장 탑승객이 많은 정거장 5개와 각 정거장 간의 거리를 구해보자.

5. Tableau를 이용한 시각화 분석

위와 같은 공간 함수를 이용한 방식 이외에도 tableau와 같은 BI툴과의 연계를 통해 직관적인 형태로 이를 분석할 수 있습니다.

--

--