Kaggle 시작하기
Feb 25, 2017 · 2 min read
결론적으로 오늘하루는 환경설정만 하다가 끝났다.
PyCharm이 IDE라 관련 패키지들 import해서 코딩하면 끝이라고 생각하고 시작했다.
시행착오 과정
- seaborn packages가 설치가 안됬다(이유: numpy.distutils.system_info.NotFoundError: no lapack/blas resources found)
- 구글링 윈도우 환경에선 결과 c와 포트란 컴파일러를 설치해야 하는데 c와 포트란 컴파일러 설치를 위해선 pre-built 프로그램들이 또 있었다. 그 프로그램들 설치하려면 Intel회원가입도 해야되고 하여튼 복잡했다
- 그렇게 몇시간 삽질하다가 한국 캐글뽀개기 커뮤니티 발견해서 거기에 도움글 올려서 Python을 포함하고 있는 Miniconda라는 pakage매니저의 존재 알게됬다.
- Minoconda만 깔면 되는지 알았더니 Miniconda 버전에 따라 Python버전이 달라서 여기서도 1시간 삽질했다.
- 거의 12시간만에 seaborn package깔았는데 PyCharm에서 시각화를 위해선 또 추가 설치가 필요했다. 이 추가 소프트웨어조차 30일밖에 무료가 아니라 쓰기 애매했다.
- 그 와중에 웹 상에서 파이썬 쉘 쓸수있는 편집기인 Jupyter package찾게 되었다.
아래 그림은 891개의 train 데이터를 pandas(엑셀 manipulation을 위한 package)를 이용해 확인한 결과이다.

교훈: 커뮤니티를 적극 활용하자.
