直方圖(Histogram)與長條圖(Bar chart)之意涵
之前我們分享了直方圖(Histogram)與長條圖(Bar chart)之歷史。接下來簡述直方圖與長條圖的意涵。
1895年,英國數學家卡爾·皮爾森(Karl Pearson)在他的文章〈Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material〉中,用直方圖(Histogram)來呈現許多資料。舉例來說,皮爾森針對1885年至1886年間英格蘭和威爾士房屋價值估價表(如圖1所示),畫出背後的直方圖與分布曲線圖(如圖2所示)。
資料來源:Karl Pearson, 1895, Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material
資料來源:Karl Pearson, 1895, Contributions to the Mathematical Theory of Evolution II: Skew Variation in Homogeneous Material
從上面的故事中,我們可以發現,直方圖(Histogram)是一組連續數字(Numerical)資料的次數分配圖。例如:在過去一個月裡,不同年齡層(18以下、18–24歲、25–34歲、35–44歲、45–55歲、55–64歲、65以上)瀏覽企業官網的次數。其中,橫軸為各組距(如不同年齡組距),縱軸為各組的次數(如瀏覽官網次數),次數透過矩形高度來呈現,而組距之間的矩形彼此相連(如圖3左邊所示)。直方圖的組距之間有順序性,描述的是連續性的資料(如年齡)。直方圖可以看出中位數、眾數的大約位置,以及資料在各區間是否存在缺口或是出現異常值。
至於長條圖(Bar chart)一樣是次數的呈現,但其橫軸為類別(Categorical)項目。例如:在過去一個月裡,不同地區位置(台北、新北、桃園、台中、台南、高雄、其他)的人,瀏覽企業官網的次數。其中,橫軸為各組距(如不同地區),縱軸為各組的次數(如瀏覽官網次數),次數透過矩形高度來呈現,而組距之間的矩形彼此「不」相連(如圖3右邊所示)。此外,長條圖的組距之間,並未有一定的排列順序,可根據所需進行調整(如地區由北到南排列,或是由南到北排列,或是依人口數排列)。
作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)
繪圖者:陳柔菲