Anaconda 설치법

파이썬 라이브러리를 활용한 데이터 분석 독자를 위한


작년 10월 한빛미디어에서 출간된 파이썬 라이브러리를 활용한 데이터 분석 (원서: Python for Data Analysis)Enthought에서 배포하는 Scientific Python 배포판인 EPD(Enthought Python Distribution)의 무료버전을 기준으로 설명하고 있다.

문제는, 책이 출간된 이후에 Enthought에서 EPD Free 버전을 중단하고 Canopy Express라는 새로운 제품을 내놨는데, 아무래도 이름이 바뀌다보니 첫 장에서부터 당황하는 독자분들이 계시는 모양이다. 그렇게 오래된 책이 아님에도 불구하고 이런 사건이 발생해서 역자인 나도 적잖이 당황스럽다. 단 한 분이라도 1장에서부터 당황하는 독자분이 계시다면 그 분께 작은 도움이라도 될 수 있을까하여 글을 쓰게 됐다.

원서에서 EPD Free 버전을 추천한 이유는 다양한 Scientific Python 패키지들을 손쉽게 설치할 수 있기 때문이다. 현재 EPD Free의 자리를 Canopy가 차지하고 있지만, 책 내용대로 따라할 수 없게 된 이상 굳이 Enthought 제품을 고집할 이유가 없으므로 Anaconda를 설치해보자.

Anaconda는 EPD Free와 같은 Scientific Python 통합패키지로, 무료로 사용할 수 있으며, 리눅스/맥/윈도우를 모두 지원한다. 패키지 관리와 가상환경 설정을 위한 conda 명령어를 내장하고 있으며 그리고 무엇보다, 책의 저자인 Wes McKinney의 회사, datapad.io에서도 Anaconda를 쓰고 있었다…

Anaconda를 배포하는 Continuum Analytics 사의 홈페이지에서 각자의 환경에 맞는 설치 바이너리를 다운받자. 만약에 링크가 동작하지 않는다면, 메인 페이지에서 PRODUCTS > Anaconda 를 찾아가면 다운로드 링크가 나타날 것이다.

다운로드 링크를 클릭해서 메일 주소를 입력하면 운영체제와 Python 버전을 선택할 수 있는 페이지가 뜬다. Python 2.7 버전과 3.4버전 두 가지를 선택할 수 있는데, 책의 예제가 Python 2.7 버전을 기준으로 작성되어 있으므로, Python 2/3의 차이점을 잘 알고 있고, Python 3.4 버전을 사용해야 하는 특별한 이유가 없다면 2.7버전을 사용하기를 권장한다.


윈도우즈 환경

다운받은 인스톨러를 실행해서 설치를 시작하자.

설치 중간에, Anaconda를 PATH 환경변수에 등록할 것인지, 그리고 Anaconda를 기본 Python 2.7 환경으로 등록할 것인지 묻는데, 특별한 이유가 없다면 모두 선택된 기본 설정 그대로 두고 설치를 계속 진행하자.

기본설정으로 설치를 마무리했으면, 프로그램 > Anaconda > IPython (Py 2.7) 또는 IPython (Py 2.7) QT Console을 실행하고 %pylab 매직 명령어로 pylab 모드를 활성화시킨다. 그리고 책에 나온 예제대로 그래프가 잘 그려지는지 확인해보자.

IPython (Py 2.7)
IPython (Py 2.7) QT Console
실행결과

위 그림처럼 입력했을때 다음 그래프가 나타난다면 설치가 잘 마무리된 것이다.


리눅스/맥 환경

각자 환경에 맞는 인스톨러를 다운로드 받은 후, 다운로드 링크에 있는 설명대로 터미널에서 설치를 진행한다. 설명에도 적혀있지만, 설치 스크립트를 실행할때는 반드시 bash를 사용해야 한다.

설치가 마무리 되면 터미널을 열고 ipython을 실행한다. 이 때, —pylab 옵션을 줘서 처음부터 pylab 모드로 실행하거나, 아니면 ipython 셸에서 %pylab 매직 명령어를 통해 pylab 모드를 활성화하고 설치가 잘 되었는지 테스트해보자. python 2.7 버전 Anaconda를 설치했다면, ipython2 대신 그냥 ipython을 실행해도 된다.

실행결과(Mac OS)
Show your support

Clapping shows how much you appreciated Younggun Kim’s story.