簡單線性回歸(Simple Linear Regression)的公式推導(Formula Derivation)

邱秉誠

Published in

Carrot Cheng的數據分析

Mar 14, 2021

前言

簡單線性回歸是在描述一個我們感興趣的變量(應變量)是如何受到另一個變量(自變量)的影響。

簡單線性回歸常用於以下兩個目的：

描述兩個變量之間的線性關係
透過一個變量來預測另一個變量。

簡單線性回歸時常以如下的形式表達

這裡的Y就是應變量，通常是我們感興趣的變量，或者就是我們想預測的值，X則是自變量。

比如，一個人想減肥，他想知道減少一公斤脂肪，需要燃燒多少大卡的熱量，根據健康網站上顯示減少一公斤脂肪需要燃燒7700大卡，此時X是自變量，表示為欲減少的脂肪公斤數，Y是應變量表示為需要燃燒多少大卡，因此關係可以表示為Y = 7700X。故意舉這個例子是為了說明，線性回歸不能解釋因果，以這個例子的時間先後順序顯然是

燃燒卡路里=>減少脂肪

但是今天我關注的對象是需要燃燒多少卡路里，因此將其放在Y，X反而變成減少多少公斤的脂肪，由此可知，線性回歸無法解釋因果，只能說明兩者之間的線性關係。

延續燃燒脂肪的例子，倘若今天沒有健康網站明確告知，燃燒熱量大卡及減少脂肪數值的關係，但我們手邊有資料，通常這群資料會是一組(Xi,Yi)變數，並且以散佈圖形式呈現，有了資料我們就可以透過公式找出最合適的模型，來描述這兩個變量之間的關係，並且加以預測。