Women in Data Science (WiDS)系列工作坊《第一次用TensorFlow就上手》:給初學者的 TensorFlow

譚竹雯 Stephanie Tan
Taiwanese in Data Science
4 min readApr 18, 2018

作者 / 譚竹雯

第二場Women in Data Science (WiDS)系列工作坊《第一次用TensorFlow就上手》,講者Stella及Alicia介紹 TensorFlow 的使用方式與案例分享,並帶領學員實作簡單的TensorFlow案例。

TensorFlow的緣起

TensorFlow 是由 Google開發的機器學習開源軟體庫,可以支援深度學習的多種演算法。目前使用者可將 TensorFlow 部署在多種平台中,包含藉由API部署在行動裝置,或是一個或多個CPU、GPU的伺服器上,並與多種程式語言(如: Python、C++、Java)相容。

Google 開放 TensorFlow 的一大原因在於機器學習的過程中需要大量數據,開源之後,開源社群會協助 Google 搜集多樣化的資料,可以更有效且迅速地訓練電腦學會判斷眼前資訊代表的意義。

藉由機器學習獲得解答

由Google Cloud AI Adventures 製作的影片 “The 7 Steps of Machine Learning” (https://youtu.be/nKW8Ndu7Mjw) ,將機器學習的過程分為七大部分。包含搜集資料Gathering Data、準備資料 (Data Preparation) 、選擇模型 (Choosing a Model) 、模型訓練 (Training) 、模型評估 (Evalution) 、參數調整 (Hyperparameter Tuning) 、預測 (Prediction)。

試想以下情境:眼前有大量的葡萄酒與啤酒,光靠肉眼辨別是哪一種酒類顯得曠日費時。於是,研究人員想運用電腦來判斷杯中物是哪一種酒類。接著,研究人員將選擇模型來訓練電腦,藉此盡可能正確地回答杯中物屬於葡萄酒或啤酒。

為了訓練模型,研究人員首先會搜集數據,數據必須涵蓋能夠區分葡萄酒或啤酒的特徵 (Features), 例如:杯中物的酒精濃度及色澤等。而搜集資料的質與量將直接地決定了研究模型的預測效果。

反覆的訓練過程,使得電腦接收到多組資訊,逐步建立模型。訓練階段完成後,研究人員運用不在模型中的資料,投入該模型中,檢測模型的精準度。根據影片中講者的經驗,訓練資料與評估資料的比重大約佔80% / 20% 或 70% / 30% 較為理想,也取決於整體資料數量的大小。

當完成七個階段之後,研究人員便能將給定酒精濃度與色澤的資料,投入到該機器學習模型裡,判斷眼前的酒精飲料是葡萄酒或是紅酒了。

機器學習倚賴大量數據培養模型的精準度。電腦經由大量資料的分析,學習建立自己的模型,協助人類處理龐雜的決策問題。TensorFlow 是機器學習的一塊敲門磚,對於 TensorFlow 的初學者而言,可以透過下列學習資源,增進 TensorFlow 的知識。

TensorFlow相關學習資源整理

➔ Tutorials and code
tensorflow.org

➔ Intro to Deep Learning with TensorFlow
Udacity class goo.gl/iHssII

➔ Stanford’s CS231n
cs231n.github.io

➔ Udacity’s Machine Learning Nanodegree
goo.gl/ODpXj4

➔ Totally new to ML?
Recipes goo.gl/KewA03

--

--

譚竹雯 Stephanie Tan
Taiwanese in Data Science

藉由文字的持續書寫,記錄所看所思,並期許能夠推動一點社會的改變,過無悔的人生。