我們知道「深度學習」(Deep Learning)是以「類神經網路」(Neural Network)為基礎,所延伸發展的技術。
在上一篇AI 如何變聰明?(三) — — 模擬人類大腦的「類神經網路」了解到什麼是「類神經網路」,在範例中是用五層的類神經網路進行說明。而當類神經網路變得更多層、更加繁複,由大量隱藏層堆疊出來就是我們所說的「深度學習」。
在深度學習出現之前
在深度學習尚未出現之前,我們要使用機器學習分辨玫瑰花和向日葵的時候,必須先教導 AI 用「花瓣顏色」、「花瓣大小」、「葉子的形狀」進行分辨等等,如同在AI 如何變聰明?(一) — — 淺談「機器學習」與「深度學習」所舉的例子:
深度學習的優點
透過深度學習,AI 就可以依靠灌輸大量的資料或圖像,自己發現資料或圖像中所包含的特徵。甚至在 AI 辨識出來的特徵中,還會有人類無法發現到的特徵!所以藉由深度學習,AI 能夠做出比人類更高精準度的預測。
深度學習的弱點
當深度學習訓練到一定程度,可能精確度會一直無法提升。有可能是類神經網路中隱藏層太多,或是人工神經元數量過多等因素,導致模型太過於複雜,不利於權重值的調整。
舉例來說,要讓 AI 辨別狗的圖像,首先要準備大量狗的圖片讓 AI 學習。可能會有兩支立耳的狗,也有兩支垂耳的狗,而輸入一張「一支立耳、一支垂耳的狗」給 AI 時,就有可能會無法辨識出牠是一隻狗。
這是因為 AI 在學習的過程中,太過重視狗的耳朵特徵(是兩支立耳的狗或是兩支垂耳的狗),而當出現具有歧異的特徵(一支立耳、一支垂耳的狗),AI 就無法正確地辨識出來,這樣的情況,我們稱之為「過度擬合」(overfitting)。
如何避免過度擬合(overfitting)?
為了避免過度擬合,有一個方法叫做「dropout」。在 AI 學習的時候,假設先隨機挑出 50% (比例可自行調整)的人工神經元不作使用,反覆藉由這個過程,可以使它不會過度依賴某些特定的特徵,進而抽取出最合適的特徵。
以上就是深度學習的運作原理,是不是覺得 AI 很聰明呢?透過深度學習,讓我們的生活有了更多無限的可能,例如無人駕駛就是透過深度學習發展出來的。期望未來 AI 會為我們帶來更厲害的技術,豐富我們的生活。
AI 講講話|人工智慧 AI 系列文目錄
- 淺談 人工智慧(AI, Artificial Intelligence)
- AI 的歷史演進
- 取得訓練資料 — — 打造模型的第一步
- 特徵抽取 — — 你是哪裡人?
- AI 技術在企業上的數位轉型
- AI 的應用:機器翻譯
- AI 是如何變聰明的? — — 「機器學習」與「深度學習」
- AI 如何變聰明?(二) — — 什麼是「機器學習」
- AI 如何變聰明?(三) — — 模擬人類大腦的「類神經網路」
- AI 如何變聰明?(四) — — 什麼是「深度學習」← 目前位置
- 開啟 AI 2.0 新時代
- 大型語言模型(LLM)的發展
- 大型語言模型(LLM)對自然語言處理(NLP)的影響
- ChatGPT 為什麼那麼紅?一次了解歷代 GPT 模型