[從資料分析到資料產品]:DAY 2 遠端Python 開發環境設定- Jupyter Notebook
在上個章節,我們建立遠端VM並設定環境,接下來這個章節將介紹如何在VM中完成Python開發環境的設定,讓之後我們的服務可以在VM上運行。
本章節內容涉及一些些的Linux操作,現在回頭來看其實相當簡單粗淺,但我自己過去其實沒有使用Linux的經驗,一開始在摸索時花了一些時間,也踩了一些很基礎的坑,但習慣後發現根本沒當初想像中的那麼複雜,以下的步驟照著做應該是一定可以成功安裝與設定。本章節將有下列三部分:
- 安裝Anaconda
- 安裝Jupyter Notebook
- 設定VM防火牆
第一步:安裝Anaconda
首先我們要下載Anaconda的安裝包,版本清單可以在這邊找到,選最新或者自己習慣的版本就好。
$ curl -O https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh
接著檢查剛剛下載的檔案是否正確:
$ sha256sum Anaconda3-2020.02-Linux-x86_64.sh
接著就可以進行安裝了:
$ bash Anaconda3-2020.02-Linux-x86_64.sh
安裝完後如果不想重啟VM,輸入已下程式碼刷新配置文件:
$ source ~/.bashrc
這樣基本上就安裝好Anaconda了,我們可以看一下有現在有哪些package可以用:
$ conda list
也可以安裝自己想要的模組,這邊我們來安裝之後會用到的lightGBM:
$ conda install lightGMB
這樣Anaconda的python開發環境就完成了~
第二步:安裝Jupyter Notebook
接著我們要來設定Jupyter Notebook遠端開發環境,讓我們未來可以透過本機的瀏覽器在VM上編寫python語言,而Jupyter Notebook也可以充當VM圖像化檔案管理員,拿來管理VM上的檔案,對於不太習慣純文字OS介面的人也相當方便。
首先來把Jupyter更新到最新版本:
$ conda update jupyter
接著我們要創造一個Jupyter Notebook的config檔:
$ jupyter notebook --generate-config
然後我們先打開這個config檔:
$ sudo nano ~/.jupyter/jupyter_notebook_config.py
打開後會看到這樣的畫面:
接著我們要把下列文字貼到第一行底下,然後按Ctrl+X退出並存檔。
c = get_config()
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.port = 5000
接下來我們要設定密碼,輸入以下指令後,在輸入兩次想要設定的密碼:
$ jupyter notebook password
最後啟動Jupyter,我們可以在VM上開啟Juypter Notebook服務了!
$ jupyter notebook
如果想要關掉Jupyter,直接打Ctrl+C就可以了。
第三步:設定VM防火牆
最後我們要來設定防火牆,到GCP的「VPC網路」->「防火牆規則」->「建立防火牆規則」中進行設定:
接下來依序輸入已下必填欄位:
- 名稱
- 目標欄位選取「網路中的所有執行個體」
- 來源IP範圍輸入「0.0.0.0/0」
- 通訊協定和通訊埠勾選「通訊協定和通訊埠」->「TCP」,輸入5000
- 儲存
完成了! 接著我們就可以用本機的瀏覽器,輸入”你的VM對外ip”+”:5000",g輸入剛剛設定的密碼後,就可以在GCP VM中遠端寫python了!
下一章:DAY 3 資料產品實做-Content Based Recommendation Flask API-相似NBA球員推薦