[從資料分析到資料產品]:DAY 2 遠端Python 開發環境設定- Jupyter Notebook

Hector Haung
5 min readApr 16, 2020

--

在上個章節,我們建立遠端VM並設定環境,接下來這個章節將介紹如何在VM中完成Python開發環境的設定,讓之後我們的服務可以在VM上運行。

本章節內容涉及一些些的Linux操作,現在回頭來看其實相當簡單粗淺,但我自己過去其實沒有使用Linux的經驗,一開始在摸索時花了一些時間,也踩了一些很基礎的坑,但習慣後發現根本沒當初想像中的那麼複雜,以下的步驟照著做應該是一定可以成功安裝與設定。本章節將有下列三部分:

  1. 安裝Anaconda
  2. 安裝Jupyter Notebook
  3. 設定VM防火牆

第一步:安裝Anaconda

首先我們要下載Anaconda的安裝包,版本清單可以在這邊找到,選最新或者自己習慣的版本就好。

$ curl -O https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh

接著檢查剛剛下載的檔案是否正確:

$ sha256sum Anaconda3-2020.02-Linux-x86_64.sh

接著就可以進行安裝了:

$ bash Anaconda3-2020.02-Linux-x86_64.sh

安裝完後如果不想重啟VM,輸入已下程式碼刷新配置文件:

$ source ~/.bashrc

這樣基本上就安裝好Anaconda了,我們可以看一下有現在有哪些package可以用:

$ conda list

也可以安裝自己想要的模組,這邊我們來安裝之後會用到的lightGBM:

$ conda install lightGMB

這樣Anaconda的python開發環境就完成了~

第二步:安裝Jupyter Notebook

接著我們要來設定Jupyter Notebook遠端開發環境,讓我們未來可以透過本機的瀏覽器在VM上編寫python語言,而Jupyter Notebook也可以充當VM圖像化檔案管理員,拿來管理VM上的檔案,對於不太習慣純文字OS介面的人也相當方便。

首先來把Jupyter更新到最新版本:

$ conda update jupyter

接著我們要創造一個Jupyter Notebook的config檔:

$ jupyter notebook --generate-config

然後我們先打開這個config檔:

$ sudo nano ~/.jupyter/jupyter_notebook_config.py

打開後會看到這樣的畫面:

接著我們要把下列文字貼到第一行底下,然後按Ctrl+X退出並存檔。

c = get_config()
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.port = 5000

接下來我們要設定密碼,輸入以下指令後,在輸入兩次想要設定的密碼:

$ jupyter notebook password

最後啟動Jupyter,我們可以在VM上開啟Juypter Notebook服務了!

$ jupyter notebook

如果想要關掉Jupyter,直接打Ctrl+C就可以了。

第三步:設定VM防火牆

最後我們要來設定防火牆,到GCP的「VPC網路」->「防火牆規則」->「建立防火牆規則」中進行設定:

接下來依序輸入已下必填欄位:

  1. 名稱
  2. 目標欄位選取「網路中的所有執行個體」
  3. 來源IP範圍輸入「0.0.0.0/0」
  4. 通訊協定和通訊埠勾選「通訊協定和通訊埠」->「TCP」,輸入5000
  5. 儲存

完成了! 接著我們就可以用本機的瀏覽器,輸入”你的VM對外ip”+”:5000",g輸入剛剛設定的密碼後,就可以在GCP VM中遠端寫python了!

下一章:DAY 3 資料產品實做-Content Based Recommendation Flask API-相似NBA球員推薦

--

--