機器學習Azure Microsoft Machine Learning — 新手操作簡單範例

前情提要
這週要跟大家分享一整套資料科學的線上課程Microsoft Data Science。我目前剛上完Principle of Machine Learning,很開心最後能以82分通過認證!

Azure Machine Learning Studio(以下簡稱Azure MLS)
個人認為是一個很有趣的機器學習平台,重點是免費哦!
他有點類似Microsoft Visual C#(回憶大一下…)、App Inventor,用物件拖拉方式,來呈現整個程式設計流程,非常適合新手來使用,就像程式能力不好的我也能慢慢摸索出一些心得。
今天我們就示範一個簡單範例,使用Azure MLS內建的資料集 Flight Delays Data,透過一連串的機器學習流程,利用Test-Flight.csv的ArrDelays來進行預測。
Step 1 匯入要訓練的資料集
下圖是整個資料集的欄位說明,等等我們會簡單把資料做一些處理。

Step 資料處理
這邊指舉一個簡單例子,我們先拉Edit Meta進來experiment介面來,透過屬性填入想要處理的資料欄位,這邊我選擇DepDel15、ArrDel15來表示為Boolean,看到右圖的資料欄位視覺化,顯示出True、False。

Step 3 訓練模型

在這個階段,我把資料集的70%拿去透過Linear Regresseion去Train Model,剩下的30%拿去給下一步測試模型來使用。

在Train Model的屬性要記得填上你主要要訓練的欄位,之後才能預測此欄位。在Linear Regreesion的屬性我暫時沒有動它,各位有興趣可以調看看,或者是換不同演算法,來比較一下哪個精準度比較高。
Step 4 測試模型

這邊的Scored Labels就是它透果30%預估出來的值,從肉眼上看,有些差蠻多,有些很相近。做到這裡,大致上你的模型已經完成,只剩下最後評估模型了!
Step 5 評估模型

以上就是我很簡單的Azure MLS透過範例簡易的教學,也算是我個人的筆記心得,下面會附上我實際操作路程的影片網址。關於要如何把外面的資料及拿來與此模型結合,進行預測,都在下列Youtube頻道有詳細教學。
