「誤差」與「偏誤」的差別

行銷資料科學
Marketingdatascience
3 min readDec 11, 2019

每個行銷人在從事行銷研究時,無不想方設法盡最大能力追求事實或者查出消費者真實的想法,但偏偏經常事與願違。這個時候,除了可能是消費者不願吐露實情,另外一種可能就是在研究時出現了「誤差(Error)」與「偏誤(Bias,這裡的偏誤係指抽樣偏誤Sampling bias)」,而這些都應該是在執行行銷研究時,必須極力避免的事。

在進行行銷研究時,常常會有誤差(Error)與偏誤(Bias)出現的情況,這兩個名詞感覺很像,但到底哪裡不一樣?

首先,所謂的誤差(Error),指的是「近似值」與「真實值」的差異,在研究程序的每一階段,都有可能出現誤差。「誤差(Error)」的來源非常多,可能在從建立假設之初就已產生,例如內容效度的問題,而在建立衡量工具時,也會出現信度、效度不足或是效度污染的現象。

其次,像是抽樣設計中各種抽樣的誤差、訪談者與受訪者的誤差。再者,如受訪者可能會答錯題目,或者受訪者都答對了,但資料處理人員在進行資料編碼時,出現遺漏值,尤其在鍵入資料時,卻Key錯欄位,導致整個研究結果嚴重「走鐘」。最後,更有可能因為統計方法的使用錯誤,或是分析結果判讀錯誤,甚至是產生推論的錯誤,這些都是誤差的來源。如圖1所示。

事實上,由於各種誤差隨時都有可能發生,克服的方式則是加強施作的訓練、建立作業的標準程序,以及加派人手來進行交叉查核。

圖1 誤差的來源

至於(抽樣)偏誤(Bias)則專指,在問卷調查的統計分析中,樣本平均值與母體平均值之差異。例如:抽樣調查某校學生平均成績為80分,結果母體的真實平均分數只有75分。如圖2所示。

圖2 (抽樣)偏誤

之所以會產生這樣的情形,常常是因為抽樣過程中不夠嚴謹或是樣本數量太少,導致樣本代表性不足。要解決抽樣不夠嚴謹問題,必須嚴格遵守抽樣程序,最好能確保採用隨機抽樣,讓每個樣本都有同樣被抽到的機會。不過,反過來看,要求樣本越大,資料的收集就越麻煩,所花費的時間與成本也就越大。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

繪圖者:曾琦心、王舒憶

歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

您可能有興趣:

AI行銷學系列講座:

實體課程:

線上課程:

精選好書:

--

--

行銷資料科學
Marketingdatascience

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR