- 취지
안드로이드 유료 게임중에서 현재 가격인하중인 게임만 한눈에 볼 수 있는 자료를 만들기 위해서
2. 영상
3. 만든 방법
- Beautifulsoup로는 top200리스트 중에서 50개만 크롤링 되었기 때문에 selenium을 사용해서 크롤링.
- Selenium을 사용해서 제목, 제작사, 가격정보, 설치페이지 링크, 이미지 파일 주소를 크롤링(Top200개).
- 내가 보고 싶은 정보는 할인중인 게임 리스트이었기 때문에, 할인중인 게임과 할인이 없는 게임의 차이점을 찾아야 했음.
- 우선 제목, 제작사, 판매가격, 가격정보(판매 가격과 할인 전 가격의 상위 class), 링크 url, 이미지 파일src-data 를 1부터 200까지 리스팅.
- 가격정보(상위 class)에서 할인중인 게임과 할인이 없는 게임의 차이점을 변수로 설정해 할인중인 게임만을 걸러낸 후, 할인 전 가격을 리스트에 추가.
- 그 정보를 엑셀 파일로 저장.
4. 후기
- 원래 목표는 리스팅한 자료를 웹페이지에 포스팅하는 거였지만, 여러 사정으로 인해 엑셀파일로 저장한것이 아쉬움…
- 파이썬을 이용한 웹페이지 크롤링 방법을 알게 되었고, 웹페이지의 요소를 나눠서 보는 방법도 알게 되었음.
- 크롤링 하기로 한 사이트(구글 플레이 스토어) 자체가 HTML구조가 복잡해서 처음에 사이트를 분석하는게 가장 어려웠고, class가 한번에 두개 세개씩 겹쳐있다는 사실을 나중에 알아서 시간을 허비한 것 같아서 아쉬웠
- 처음에 튜터님이 좀 어려울 수도 있다고 했을 때 그 말을 들었어야 한다는 후회
