小時了了,大未必佳─迴歸均值的有趣現象

行銷資料科學
Marketingdatascience
5 min readJul 15, 2020

先問一個問題,您會不會好奇,在您離開校園一、二十年之後,當年那些功課很好的同學,他們現在在哪裡?他們的社會成就有比您優秀嗎?而經過多方探索,往往您可能會發現,當年那些功課不得了的同學,長大後有些也實在不怎麼樣,出社會就是表現平平,就是所謂的「小時了了,大未必佳」。其實,看完今天的內容,您就會了解這種情況就是統計學上所稱的「迴歸均值」的特殊現象。

1886年,英國遺傳學家弗朗西斯·高爾頓爵士(Sir Francis Galton)在《人類學學院學報(Journal of the Anthropological Institute)》期刊上,發表了一項有趣的研究成果,名為〈遺傳身材回歸平凡(Regression towards mediocrity in hereditary stature)〉。

高爾頓的研究結論是這樣子來的,父母親與他們的子女之間的身高,往往具有相關性,個子高大的父母,通常會生下高個子的小孩,因為身高通常會遺傳。以中國的球星姚明為例,他在官方的紀錄上,身高是226公分,從普通人眼中來看,的確就是個不折不扣的「巨人」。而他的太太葉莉,同樣是個籃球運動員,身高190公分,跟一般中國女性相比,也高人一等,而姚明的女兒姚沁蕾,據說九歲時,就已接近170公分。(原文網址:https://kknews.cc/sports/34emer8.html)。

當然,父母的高大基因,往往容易生出高個子的子女,但是,往往物極必反。一旦身材高大的父母,生出的小孩沒那麼高大;身材矮小的父母,生出的孩子又沒那麼矮小。高爾頓稱這種現象就叫做「迴歸到平均值(regression toward the mean),簡稱迴歸均值」。

當年,高爾頓搜集了205對父母與928名成年子女的身高資料,並將分析結果,整理如表1所示(單位為吋,一吋為2.54公分)。

表1迴歸均值表

資料來源:Francis Galton, Regression towards mediocrity in hereditary stature, Journal of the Anthropological Institute, 15, pp 246–263 ,1886.

最左邊的欄位是父母平均身高的級距(64.5–72.5);最右邊的欄位是兒女身高的中位數(65.8–72.2)。最上面中間的欄位是成年兒女的身高級距(62.2–73.2);最下面的列是父母身高的中位數(66.3–70.0)。

接著我們來看一下表格中間的部分。以父母身高為69.5吋的級距為例,共有41對父母(右邊算起第二欄),兒女中位數為68.9吋(右邊算起第一欄),其中兒女183位(右邊算起第三欄),69.2吋的有33位(右邊算起第九欄)。

從表1中還可以發現,無論是父母或是兒女,身高皆呈常態分配。同時,資料從左下角到右上角呈對角線的分布狀況,代表父母與成年兒女的身高呈現正相關。

而且,對最左欄的父母平均身高的級距,與最右欄的兒女中位數進行比較,可以發現「迴歸均值(regression toward the mean)」的現象。當父母平均身高級距大於68.5吋時,兒女身高的中位數都小於父母的平均身高;當父母平均身高級距小於68.5吋時,兒女身高的中位數都大於父母的平均身高。

最後,高爾頓在文章中,用圖1來呈現迴歸均值的概念。我們可以發現,父母親身高級距的斜率較大,兒女身高級距的斜率較平緩,呼應上一段文字的內容。

圖1迴歸均值圖 資料來源:Francis Galton, Regression towards mediocrity in hereditary stature, Journal of the Anthropological Institute, 15, pp 246–263 ,1886.

而這樣的趨勢,後來被廣泛應用來解釋投資股票和像是「小時了了,大未必佳」等許多社會現象。

作者 : 蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

歡迎加入我們的Telegram獲取即時訊息!https://t.me/marketingdatascience
歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

--

--

行銷資料科學
Marketingdatascience

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR