[資料分析&機器學習] 第5.4講: 機器學習進階實用技巧-正規化

Published in

JamesLearningNote

4 min readDec 24, 2017

在實務上我們在Train model時常常會遇到Overfitting的問題，也就是Model在Training的Data正確率很高，但是拿到Testing Data的時候錯誤率卻很高。背後的主因是我們真正需要的Model比我們Train出來的Model還要簡單，也就是Train出來的Model太複雜了！如上圖所示假設我們需要的Model是一條回歸的直線，但是Train出來的Model為了讓在Traing Data中錯誤率最小化，因此Model變得奇形怪狀，這樣的Model拿去新的資料中錯誤率就會很高

這時候通常有幾種解決方法：

收集更多的Training Data
減少資料的維度(特徵)
使用更簡單的Model
對現有的Model加上使用L1 or L2正規化(懲罰penalty)

前面有提到說我們Train出來的Model其實就是在空間中的一個多項式，像是： W0*X0 + W1*X1 +…..Wn*Xn 複雜一點的Model可能是： W0*X0 + W1*X1²+W2*X2³ + … + Wn*Xn¹⁰ ，如果我們要降低這些多項式Model的複雜程度，最常見的方式就是限制W的範圍，讓W越小越好，甚至變成0。

而限制W的方式主要有兩種