Women in Data Science (WiDS)系列工作坊《第一次用TensorFlow就上手》：給初學者的 TensorFlow

譚竹雯 Stephanie Tan

Published in

Taiwanese in Data Science

4 min readApr 18, 2018

作者 / 譚竹雯

第二場Women in Data Science (WiDS)系列工作坊《第一次用TensorFlow就上手》，講者Stella及Alicia介紹 TensorFlow 的使用方式與案例分享，並帶領學員實作簡單的TensorFlow案例。

TensorFlow的緣起

TensorFlow 是由 Google開發的機器學習開源軟體庫，可以支援深度學習的多種演算法。目前使用者可將 TensorFlow 部署在多種平台中，包含藉由API部署在行動裝置，或是一個或多個CPU、GPU的伺服器上，並與多種程式語言（如： Python、C++、Java）相容。

Google 開放 TensorFlow 的一大原因在於機器學習的過程中需要大量數據，開源之後，開源社群會協助 Google 搜集多樣化的資料，可以更有效且迅速地訓練電腦學會判斷眼前資訊代表的意義。

藉由機器學習獲得解答

由Google Cloud AI Adventures 製作的影片 “The 7 Steps of Machine Learning” (https://youtu.be/nKW8Ndu7Mjw) ，將機器學習的過程分為七大部分。包含搜集資料Gathering Data、準備資料 (Data Preparation) 、選擇模型 (Choosing a Model) 、模型訓練 (Training) 、模型評估 (Evalution) 、參數調整 (Hyperparameter Tuning) 、預測 (Prediction)。

試想以下情境：眼前有大量的葡萄酒與啤酒，光靠肉眼辨別是哪一種酒類顯得曠日費時。於是，研究人員想運用電腦來判斷杯中物是哪一種酒類。接著，研究人員將選擇模型來訓練電腦，藉此盡可能正確地回答杯中物屬於葡萄酒或啤酒。

為了訓練模型，研究人員首先會搜集數據，數據必須涵蓋能夠區分葡萄酒或啤酒的特徵 (Features)，例如：杯中物的酒精濃度及色澤等。而搜集資料的質與量將直接地決定了研究模型的預測效果。

反覆的訓練過程，使得電腦接收到多組資訊，逐步建立模型。訓練階段完成後，研究人員運用不在模型中的資料，投入該模型中，檢測模型的精準度。根據影片中講者的經驗，訓練資料與評估資料的比重大約佔80% / 20% 或 70% / 30% 較為理想，也取決於整體資料數量的大小。

當完成七個階段之後，研究人員便能將給定酒精濃度與色澤的資料，投入到該機器學習模型裡，判斷眼前的酒精飲料是葡萄酒或是紅酒了。

機器學習倚賴大量數據培養模型的精準度。電腦經由大量資料的分析，學習建立自己的模型，協助人類處理龐雜的決策問題。TensorFlow 是機器學習的一塊敲門磚，對於 TensorFlow 的初學者而言，可以透過下列學習資源，增進 TensorFlow 的知識。

TensorFlow相關學習資源整理

➔ Tutorials and code
tensorflow.org

➔ Intro to Deep Learning with TensorFlow
Udacity class goo.gl/iHssII

➔ Stanford’s CS231n
cs231n.github.io

➔ Udacity’s Machine Learning Nanodegree
goo.gl/ODpXj4

➔ Totally new to ML?
Recipes goo.gl/KewA03

Women in Data Science (WiDS)系列工作坊《第一次用TensorFlow就上手》：給初學者的 TensorFlow

Written by 譚竹雯 Stephanie Tan