Kaggle 시작하기

Sean Seongu Kang
Feb 25, 2017 · 2 min read

결론적으로 오늘하루는 환경설정만 하다가 끝났다.

PyCharm이 IDE라 관련 패키지들 import해서 코딩하면 끝이라고 생각하고 시작했다.

시행착오 과정

  • seaborn packages가 설치가 안됬다(이유: numpy.distutils.system_info.NotFoundError: no lapack/blas resources found)
  • 구글링 윈도우 환경에선 결과 c와 포트란 컴파일러를 설치해야 하는데 c와 포트란 컴파일러 설치를 위해선 pre-built 프로그램들이 또 있었다. 그 프로그램들 설치하려면 Intel회원가입도 해야되고 하여튼 복잡했다
  • 그렇게 몇시간 삽질하다가 한국 캐글뽀개기 커뮤니티 발견해서 거기에 도움글 올려서 Python을 포함하고 있는 Miniconda라는 pakage매니저의 존재 알게됬다.
  • Minoconda만 깔면 되는지 알았더니 Miniconda 버전에 따라 Python버전이 달라서 여기서도 1시간 삽질했다.
  • 거의 12시간만에 seaborn package깔았는데 PyCharm에서 시각화를 위해선 또 추가 설치가 필요했다. 이 추가 소프트웨어조차 30일밖에 무료가 아니라 쓰기 애매했다.
  • 그 와중에 웹 상에서 파이썬 쉘 쓸수있는 편집기인 Jupyter package찾게 되었다.

아래 그림은 891개의 train 데이터를 pandas(엑셀 manipulation을 위한 package)를 이용해 확인한 결과이다.

Web에서 확인한 데이터 차트

교훈: 커뮤니티를 적극 활용하자.

skkang

Go for it with positive passion

Sean Seongu Kang

Written by

skkang

skkang

Go for it with positive passion

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade