【Python機器學習】111：羅吉斯回歸分類器介紹及應用

Logistic Regression Classifier

Published in

展開數據人生

6 min readOct 4, 2020

接下來要介紹的第三個分類器叫羅吉斯回歸分類器(Logistic Regression Classifier)。我們先來回憶一下，要如何把回歸模型中連續型的數值輸出對應到機率，再從機率對應到我們想要的分類呢？中間要經過兩個階段的轉換，第一個階段要經過激勵函數(Acitivation function)轉換成機率，第二階段則透過階段函數(Step function)將機率轉換成離散的分類標籤。

如何從連續型的輸出 𝑋𝑤 到離散型的輸出 𝑦̂？

其中 𝜎 俗稱為激勵函數（Activation function），𝐻 稱為階躍函數（Step function）

激勵函數將連續型輸出轉換為機率
階躍函數將機率輸出轉換為離散值

本章要介紹的羅吉斯回歸模型是一種使用 sigmoid 激勵函數的模型，sigmoid函數公式如下，input會放在分母exponential的指數位置。

激勵函數將連續型輸出轉換為機率，羅吉斯回歸使用 sigmoid 函數：

如果試著把sigmoid函數的外觀畫出來，長的如下圖，可以發現不管我的Xw的值為何，sigmoid函數都會將其縮小放大，把值控制在0～1之間。

注意：exponential 可以用np.exp呼叫

接下來就是階躍函數的運算，透過sigmoid函數算出來的值，我們會拿來和門檻機率做比較，如果值大於門檻則預測結果為1，否則為0（門檻值通常是自己定義，通常二元分類的門檻為0.5）。

將機率轉換為 𝑦̂ ∈ {0 , 1}：

拆解羅吉斯回歸分類器的步驟：

1、尋找 ℎ(𝑋)=𝑋𝑤 的 𝑤

在回歸問題中找w蠻容易的，因為解w的解法很多元，可以用正規方程式(normal equation)，也可以用梯度遞減(gradient descent)。雖然看起來羅吉斯回歸模型只有3個步驟，但其實第一個步驟是很難的，羅吉斯回歸模型的w並不好找(其實分類器的w都不好找)

2、將 ℎ(𝑋)的輸出 𝑧 作為 Sigmoid 函數的輸入，得到 𝜎(𝑧)
3、將 𝜎(𝑧) 作為 𝐻 的輸入，得到 𝑦̂

為什麼說分類問題的w不好找呢？還記得在迴歸問題中我們尋找 ℎ(𝑋)=𝑋𝑤 的 𝑤 是根據一個目標：讓成本函數 MSE 最小化。

但是在分類問題中，我們尋找 ℎ(𝑋)=𝑋𝑤 的 𝑤 則是依據：讓誤分類數最小化:

MSE函數的目標是 𝑦̂ 與 y之間的數值差異越小越好，由於其函數的外觀有平方，是一個拋物線向上的函數，因此可以找到唯一的最低點。但誤分類數最小是一個離散的問題，面對這樣一個問題，我們的成本函數就不再是MSE了，它的樣子長得比較特別一點。為了讓誤分類數最小化，得在尋找 𝑤 的過程中設計成本函數 𝐽：