비전공자를 위한 데이터 과학 준비과정 : 코딩편 (3) — pip, conda로 확장 기능 설치하기
- 본 포스트는 데이터 저널리즘 TA과정에서 학생들의 이해를 돕기 위해 작성된 내용입니다. 자세한 설명은 제한되어 있으므로 더 많은 정보 혹은 고급 강의를 듣기 원하신다면 Cousera, EdX, KMOOC의 강의를 참고하실 것을 추천드립니다.
- 본 포스트는 학생들의 이해를 돕기 위해 전문적인 내용을 축소, 비유를 통해 쉽게 전달하는데 목적을 두고 있습니다. 여기서 제시되는 일부 내용은 “의도적으로” 생략되거나 변형된 내용을 담고 있습니다.
- 본 시리즈는 Computational Statistics을 반영하는 데이터 과학 중 코딩 관련 지식에 집중되어 있습니다. 수학/통계학과 관련해서는 다른 시리즈가 연재될 예정입니다.
저번 시간에 기본적인 Python설치에 대해 다뤘다면 이번 시간에는 앞으로 사용하게 될(혹은 필요할 수 있는) “한국어” 관련 설치 및 환경설정을 진행하도록 하겠습니다.
1. Java SDK, Visual Studio, Xcode
우선, 파이썬 외적으로 설치해야 할 추가 프로그램을 설치합니다. 이 과정은 상당히 오랜 기간이 걸리기 때문에 주의하시길 바랍니다.
우선 Windows나 Osx 상관없이 설치해야 할 Java SDK를 설치합니다.
위 페이지로 들어가 자기 컴퓨터 환경에 맞는 버전을 설치해 주시면 되겠습니다.
파이썬에서 한글 처리 기능은 실제로 Java에서 작성된 기능을 빌려쓰기 때문에 이 설치를 통해 다른 체계(Java)에서 작성된 기능을 사용할 수 있게 됩니다.
이제 Windows 유저의 경우 Microsoft Visual C++를 설치합니다. 2017년 버전은 선택할 옵션이 많기 때문에 2015년 버전을 설치하는 것을 추천드립니다.
https://support.microsoft.com/ko-kr/help/2977003/the-latest-supported-visual-c-downloads
OSX 유저의 경우는 앱스토어에서 Xcode를 설치합니다
위 설치는 운영체계 레벨에서 개발에 (가끔씩) 요구되는 기능들을 설치하는 역할을 합니다(구체적인 설명은 너무 복잡하기 때문에 생략하겠습니다)
2. Conda? Pip
제가 추가 설치를 이야기하면 “파이썬 설치가 되면 다 된 것이 아닌가요?” 혹은 “Anaconda는 다 설정해 준다고 하지 않았나요?” 라고 의문을 가질 수 있겠는데요. 이것은 우리가 쓰는 스마트폰을 생각하면 쉽게 이해할 수 있습니다.
간단히 말해 Python이 스마트폰 본체라면 확장 기능인 패키지는 스마트폰에 설치하는 앱과 같습니다. 안써도 되지만, 원하는 기능을 편리하게 쓰려면 결국 설치할 수 밖에 없습니다(사실 패키지는 모듈,라이브러리 여러 이름으로 부를 수 있습니다. 엄밀하게 말하면 차이가 크지만 여기서는 넘어갑시다).
물론, Anaconda의 경우 대부분의 패키지를 미리 설치해 놓은 종합세트지만 한국어 처리의 경우 “특정 기능”에 가깝기 때문에 더 설치해야 할 필요가 있습니다.
그렇다면, 이제 한국어 처리를 위한 “파이썬 추가 기능”을 위한 설치를 진행하겠습니다. 이전 포스팅을 참고하여 “아나콘다 환경 상태의 명령창”을 띄웁니다(설명은 생략).
다음과 같이 입력합니다.
conda install -c conda-forge jpype1

(Conda를 쓰지 않는다면 pip install JPype1를 써서 설치할 수 있지만, 보통 에러가 나기 때문에 위 방법을 추천합니다, 에러가 난다면 밑의 항목을 참고해서 설치하시길 바랍니다)
설치가 완료된 것을 확인하면 다음과 같이 입력합니다.
pip install konlpy

conda 명령어는 anaconda에서 지원하는 설치 명령어, pip 명령어는 파이썬에서 지원하는 설치 명령어입니다. (Anaconda를 쓰는 입장에서는) conda가 좀 더 안정적인 설치를 지원하는 명령어라고 생각하시면 됩니다. Conda의 경우 Anaconda를 통해서 설치한 다른 프로그래밍 언어에서도 지원하는 “Anaconda 환경 전체의 확장 기능 설치 명령어(추가 기능이 더 붙은)”로 볼 수 있기 때문입니다.
주의 : 만약 위 설치과정에서 문제가 생긴다면 우리는 자동으로 지정해 주는 파일이 아니라 직접 설치 파일을 다운받아 jpype를 설치할 필요가 있습니다. 해당 과정은 조금 복잡합니다. 아래와 같이 따라해 봅시다(주로 windows에서 문제가 발생한다고 합니다)
A. 아래 경로에서 설치 파일을 다운받습니다(cp는 파이썬 버전, 32와 64는 윈도우 환경 bit를 말합니다). 내가 터미널을 사용할때 쓰는 폴더에 넣어줍니다
(Anaconda가 설치된 C:\Anaconda3 같은 폴더에 넣어주면 편합니다)
B. 환경창을 띄운후 해당 파일이 있는 폴더로 이동합니다
cd 한칸 띄운 후
해당폴더를 명령 창으로 드래그해서 프롬프트(입력받는 지점)에 올려 놓습니다.
cd 경로
와 같은 식으로 경로가 자동완성 됩니다. 엔터를 눌러서 이동합니다.
C. 왼쪽 경로명을 보고 해당 설치파일 경로로 이동했다는 것이 확인되면 아래와같이 입력합니다.
pip install 파일명
예를 들어 내가 받은 파일명이 “JPype1‑0.6.3‑cp36‑cp36m‑win_amd64.whl” 이라면 다음과 같이 입력합니다.
pip install JPype1‑0.6.3‑cp36‑cp36m‑win_amd64.whl
설치가 진행된 것을 확인하고 다시 konlpy를 설치합니다.
3. 한국어 분석으로 파이썬 실행하기
이제, 한국어 분석 기능이 제대로 작동하는지 보기 위해 다음과 같이 입력해 봅시다.
(명령창 띄운 상태에서 python 입력해서 파이썬 실행, 파이썬 실행 상태에서)

(앞의 >>>는 입력하지 않습니다, 이건 파이썬 실행상태를 안내해 주는 창입니다).
드물게 JAVA_HOME의 문제로 위 코드가 실행이 안되는 현상이 있습니다. 우리가 이전에 설치했던 Java 개발도구의 경로를 찾지 못해서 발생하는 문제인데요. 이 경우에는 조금 번거롭지만 수동으로 해당 경로를 지정해 줘야 합니다.
해당 방법을 잘 설명해 놓은 문서가 있어 링크를 띄워 놓겠습니다(Windows 버전입니다)
OS X의 경우 경로를 지정한 프로파일(bash_profile)을 편집해야 하는데요, 이 부분은 편집기를 다뤄야 하기 때문에 따로 포스팅을 하겠습니다(한국어 처리의 경우 파이썬 수업 중반부에 다루기 때문에 여유가 있고, OS X에서 터미널을 다루는 기술은 Windows보다 설명할 내용이 좀 많습니다).
간단한 설치 작업을 통해(?)드디어 파이썬 설치가 완료되었습니다. 다음 시간에는 파이썬 코딩을 손쉽게 해주는 Python의 필수 도구 중 하나인 Jupyter Notebook를 사용해 보겠습니다.
