Roye Qiu
3 min readSep 29, 2018

[淺談機器學習] #1 Machine Learning 基本概念

[前言]
大家好大家好,最近機器學習真是炒得火熱,各種AI,大數據,資料科學,機器學習的課程,產品以及公司,都冒了出來,我相信有很多剛踏入這塊地學生以及朋友們,也還是懵懵懂懂,因次就想要用一些比較生活化的方式來介紹一下,讓大家可以有腦海中有圖片可以想像。

下一篇: [淺談機器學習]#2 聊聊Tensorflow

Machine Learning的基本概念 (強調)基本而已喔 0.<* 要定義的話可以上wiki上面看。

我有一些資料x,然後有一些希望得到的結果y,學習出一個function f給他資料x,他會告訴我結果y。

舉例來說:

[股市預測]

收集某家公司3年內的所有商業新聞,用一個神奇的方法,預測在當下股價會漲還是跌。

X = 3年內的所有商業新聞 。
Y=三年內股價是漲還是跌。
f() = 神奇的方法 。

那電腦學習完之後,只要給這個神奇的方法,現在的商業新聞 ,他就會告訴我股價會漲還是跌。 也就是f(x) = y。

[商品推薦]

有很多人的商品清單,從清單中整理出來買了商品A的人也有買的其他產品。

X = 買了商品A 。
Y = 也買了的商品B。
f()= 神奇的方法 。

那電腦學習完之後,某個人要是買了某個商品x,根據f(x)得到買了x的人也很大機率會買的y,我是不是也可以推薦商品y給他呢? 我是不是可以讓我的生意更好賣更多東西呢?

以上就是一些Machine Learning 的例子以及基本概念。是不是其實沒有那麼玄乎呢

神奇的方法

對於沒有接觸過的朋友,看上面說神奇的方法,大概就跟第一次看到下面這張圖一樣覺得十分神奇,跟好奇怎麼做到的。

其實所謂的神奇的方法,基本上都是數學,像是機率、統計等。 所以也可以說Machine Learning 基本上都是在用程式算數學。

數學是個神奇的東西,所以我們還是再來舉個例子。我有一個地區7天的相對濕度以及天氣狀況的資料。

有了這些資料後,我想看看相對濕度大於80%的時候下雨的機率是多少?
這裡有很多不同的實作方式,不管是用Logistic Regression、機率統計還是Liner Regression,其實都有辦法做到。

我舉一個其中做法:

  1. 將連續型資料的相對濕度轉成離散型的。也將文字的資料轉成數值。

回到問題來"我想看看相對濕度大於80%的時候下雨的機率是多少?",
這樣一來,就可以把問題的式子寫成:
p(y=1|x=1) = p(y=1,x=1) /p(x=1)

2. 去做條件機率計算
p(y=1,x=1) /p(x=1)= 0.57/0.71 = 0.802
那我們是不是就得到對於那個地區來說,假如濕度大於等於80,那麼降雨機率就有80.2%。

ML的世界博大精深,這只是一個很簡單的例子,數學方法也很簡單,但是ML的概念大致上就是這樣。 對於剛接觸這一塊的同學跟朋友,可以之後慢慢參考我其他的教學跟分享,學習到不同的演算法。

假如哪裡講不清楚或寫不好,歡迎留言詢問或指教。
假如覺得講得不錯,也請給我點鼓勵吧 0w0)b

Roye Qiu

一個喜歡科技、技術的自然語言工程師,喜歡參與workshop活動與參加比賽,曾獲得總統盃黑客松優勝與司法院團隊一起與總統蔡英文介紹自然語言對於司法改革的重要性~