直方圖(Histogram)與長條圖(Bar chart)之意涵

行銷資料科學
Marketingdatascience
4 min readJun 29, 2020

之前我們分享了直方圖(Histogram)與長條圖(Bar chart)之歷史。接下來簡述直方圖與長條圖的意涵。

1895年,英國數學家卡爾·皮爾森(Karl Pearson)在他的文章〈Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material〉中,用直方圖(Histogram)來呈現許多資料。舉例來說,皮爾森針對1885年至1886年間英格蘭和威爾士房屋價值估價表(如圖1所示),畫出背後的直方圖與分布曲線圖(如圖2所示)。

圖1 1885年至1886年間,英格蘭和威爾士房屋價值估價表

資料來源:Karl Pearson, 1895, Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material

圖2 房屋價值估價表之直方圖與分布曲線圖

資料來源:Karl Pearson, 1895, Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material

從上面的故事中,我們可以發現,直方圖(Histogram)是一組連續數字(Numerical)資料的次數分配圖。例如:在過去一個月裡,不同年齡層(18以下、18–24歲、25–34歲、35–44歲、45–55歲、55–64歲、65以上)瀏覽企業官網的次數。其中,橫軸為各組距(如不同年齡組距),縱軸為各組的次數(如瀏覽官網次數),次數透過矩形高度來呈現,而組距之間的矩形彼此相連(如圖3左邊所示)。直方圖的組距之間有順序性,描述的是連續性的資料(如年齡)。直方圖可以看出中位數、眾數的大約位置,以及資料在各區間是否存在缺口或是出現異常值。

圖3直方圖(Histogram)與長條圖(Bar chart)

至於長條圖(Bar chart)一樣是次數的呈現,但其橫軸為類別(Categorical)項目。例如:在過去一個月裡,不同地區位置(台北、新北、桃園、台中、台南、高雄、其他)的人,瀏覽企業官網的次數。其中,橫軸為各組距(如不同地區),縱軸為各組的次數(如瀏覽官網次數),次數透過矩形高度來呈現,而組距之間的矩形彼此「不」相連(如圖3右邊所示)。此外,長條圖的組距之間,並未有一定的排列順序,可根據所需進行調整(如地區由北到南排列,或是由南到北排列,或是依人口數排列)。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

繪圖者:陳柔菲

歡迎加入我們的telegram獲取即時訊息!https://t.me/marketingdatascience

--

--

行銷資料科學
Marketingdatascience

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR