20191102

WSolio
WSolio
Nov 2 · 2 min read
  1. 취지

안드로이드 유료 게임중에서 현재 가격인하중인 게임만 한눈에 볼 수 있는 자료를 만들기 위해서

2. 영상

3. 만든 방법

  • Beautifulsoup로는 top200리스트 중에서 50개만 크롤링 되었기 때문에 selenium을 사용해서 크롤링.
  • Selenium을 사용해서 제목, 제작사, 가격정보, 설치페이지 링크, 이미지 파일 주소를 크롤링(Top200개).
  • 내가 보고 싶은 정보는 할인중인 게임 리스트이었기 때문에, 할인중인 게임과 할인이 없는 게임의 차이점을 찾아야 했음.
  • 우선 제목, 제작사, 판매가격, 가격정보(판매 가격과 할인 전 가격의 상위 class), 링크 url, 이미지 파일src-data 를 1부터 200까지 리스팅.
  • 가격정보(상위 class)에서 할인중인 게임과 할인이 없는 게임의 차이점을 변수로 설정해 할인중인 게임만을 걸러낸 후, 할인 전 가격을 리스트에 추가.
  • 그 정보를 엑셀 파일로 저장.

4. 후기

  • 원래 목표는 리스팅한 자료를 웹페이지에 포스팅하는 거였지만, 여러 사정으로 인해 엑셀파일로 저장한것이 아쉬움…
  • 파이썬을 이용한 웹페이지 크롤링 방법을 알게 되었고, 웹페이지의 요소를 나눠서 보는 방법도 알게 되었음.
  • 크롤링 하기로 한 사이트(구글 플레이 스토어) 자체가 HTML구조가 복잡해서 처음에 사이트를 분석하는게 가장 어려웠고, class가 한번에 두개 세개씩 겹쳐있다는 사실을 나중에 알아서 시간을 허비한 것 같아서 아쉬웠
  • 처음에 튜터님이 좀 어려울 수도 있다고 했을 때 그 말을 들었어야 한다는 후회

    WSolio

    Written by

    WSolio

    Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
    Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
    Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade