AI 學習筆記 #1: 機器學習 vs. 深度學習

YC Liu
YC Liu's Notes
Published in
Jul 19, 2020

大學畢業後開始在一家 AI 新創擔任商業相關職位,也許是因為這樣,最近經常被一些朋友問到:『機器學習跟深度學習的差別是什麼?』。今天我想試著用比較科普的方式來回答這個問題。

首先,我們先用一句話簡單定義什麼是 AI — 「讓電腦模擬人類做的事情」,接下來再慢慢介紹什麼是機器學習,什麼又是深度學習。

下圖是一張取自 Nvidia 部落格的圖,主要提供我們 2 個重要的訊息:

Figure 1: 人工智慧演進 (Source: Nvidia)
  1. 機器學習 (Machine Learning) 是 AI 的一個子集合,是實現 AI 的其中一種方法;深度學習 (Deep Learning) 則是機器學習的一個子集合,所以是機器學習的其中一種方法。
  2. AI 的概念早在 1950 年代就被提出;機器學習的相關演算法也早在 1980 年代就有,並不是一個非常新穎的概念;深度學習則是在 2010 年代才正式興起。

為何深度學習會漸漸成為主流方法?

I. 資料量的增加: 深度學習需要有大量資料才能達到較佳的效果,網路與通訊技術的進步使得資料的蒐集與取得比過去更有效率。資料量若是不夠,深度學習的效果就不會太好。

II. GPU (圖形處理器) 技術的逐漸成熟: 過去的深度學習演算法是透過中央處理器 (CPU) 進行運算。由於深度學習計算量大,且 CPU 的架構並不那麼適合深度學習,所以進行模型訓練所耗費的時間非常長。相較於 CPU,GPU 處理圖形所用到的運算架構則非常適合深度學習。也正是如此,深度學習的模型訓練速度才有爆發性的增長,並逐漸成為人工智慧領域的主流。

前文中有提到,AI 是讓電腦程式模擬人類的決策/判斷,那麼機器學習就是讓電腦看過並「學習」大量數據,然後對問題進行推理與判斷的流程。

接著,我們可以再深入探討傳統機器學習與深度學習在算法架構上的差異。假設我們需要分類圖片中的動物到底是貓還是狗,傳統機器學習和深度學習分別會如何進行?

Figure 2. 機器學習 vs 深度學習 (Source: Quora; Icon: Flaticon)
  • 機器學習: 資料輸入 特徵擷取 訓練模型 輸出(判斷)

進行學習前,需要先有資料。輸入資料後,機器學習需要進行「特徵擷取 (feature extraction)」,在此例的貓狗分類問題中,先假設我們認為可以分出兩者差異的是花色 (X)、耳朵形狀 (Y)、臉型 (Z)。值得注意的是,上述這 3 個特徵是「人想出來的」。

進行特徵擷取之後,將資料再輸入訓練模型中 (由於此例是貓狗分類問題,模型是一個分類器),最後便可以得到我們想要的答案 (A) — 圖片中的動物是貓還是狗。

若以數學式來表達,可以寫成: A = aX + bY + cZ

  • 深度學習: 資料輸入 特徵擷取 + 訓練模型 輸出(判斷)

與傳統機器學習相同,深度學習也需要先有資料。

不過,深度學習不需要再人為進行特徵擷取。只要把資料倒入訓練模型 (常常會聽到的「神經網路」) 中,訓練模型會自己進行特徵擷取,接著進行判斷,得到答案 (A)。

值得注意的是,由於特徵擷取是由電腦進行處理,最後的答案可能會是: A = dX + eV² + fW + gUV。

除了 X 是我們已知的花色之外,可能出現 V (例如: 眼睛顏色) 這類我們沒想到的特徵,或是 W、U 等我們無法理解的特徵。

當資料量越大,深度學習可以擷取的特徵可能性就越多,最後判斷的結果也會更加精準。下圖顯示當資料量超過一定的級數,深度學習的效果會遠遠超過傳統機器學習算法的效果。

因此,如果我們的數據量足夠,並且想獲得較好的結果,在不考慮開發時間的情況下,通常會選擇深度學習演算法。

Figure 3. 為何使用深度學習? (Source: Andrew Ng)

小結:深度學習是機器學習的一種。當資料量夠多,深度學習可以達成比傳統機器學習方法更好的效果。

這是目前撰寫的第一篇科技相關文章,目的是希望用比較淺顯的文字介紹機器學習與深度學習,並說明兩者之間的不同。

未來也計畫會發表更多金融/科技相關的文章,請讀者持續關注我的 Medium,也感謝閱讀到這邊的你/妳。

--

--

YC Liu
YC Liu's Notes

Tech & Finance Writer || M&A @ Pre-IPO Healthcare Company || Strategy & Business Development @ Series A AI Startup || EE & Econ @ NTU