[資料分析&機器學習] 第1.1講:Python懶人包 Anaconda 介紹&安裝

Anaconda介紹

Anaconda中文是森蚺,一種非常肥大的蟒蛇。簡單來說你可以把Anaconda當作是Python的懶人包,除了Python本身(python2, 3) 還包含了Python常用的資料分析、機器學習、視覺化的套件

(圖為Anaconda內含的重要套件,完整套件可點此參考)

當中比較重要的:

Numpy: Python做多維陣列(矩陣)運算時的必備套件,比起Python內建的list,Numpy的array有極快的運算速度優勢

Pandas:有了Pandas可以讓Python很容易做到幾乎所有Excel的功能了,像是樞紐分析表、小記、欄位加總、篩選

Matplotlib:基本的視覺化工具,可以畫長條圖、折線圖等等…

Seaborn:另一個知名的視覺化工具,個人認為畫起來比matplotlib好看

SciKit-Learn: Python 關於機器學習的model基本上都在這個套件,像是SVM, Random Forest…

Notebook(Jupyter notebook): 一個輕量級web-base 寫Python的工具,在資料分析這個領域很熱門,雖然功能沒有比Pycharm, Spyder這些專業的IDE強大,但只要code小於500行我覺得用Jupyter寫非常方便,Jupyter也開始慢慢支援一些Multi cursor的功能了,可以讓你一次改許多的變數名稱。

總之

優點:

  1. 省時:一鍵安裝完90%一般人這一輩子會用到的Python套件,剩下的再用pip install個別去安裝即可

缺點:

  1. 占空間:包含了一堆用不到的Python的套件(可安裝另一種miniconda)

另外,安裝完Anaconda之後你會獲得一個叫Conda的指令可以用,可以讓你用conda管理不同Python的版本以及套件,但我自己幾乎沒用到,都是直接用Pip install安裝。如果想了解關於conda install 詳情可參考:http://www.jianshu.com/p/2f3be7781451

Anaconda安裝

Anaconda 下載連結:https://www.anaconda.com/download/

選擇你的作業系統

初學者建議從Python3.6開始,然後點選download。(在資料分析、機器學習的領域Python2,3 我是覺得沒有差很多,主要是Print跟unicode,還有Map Reduce)

接著安裝完打開Command line輸入Python

如果看到下方有出現Anaconda字樣就代表安裝完成囉!!