敘述性統計的呈現方式 — 其他圖形
統計圖表的類型很多,以大家最常使用橫排、直排的交叉表(Cross Table)來說,雖然已可大幅簡化收到的資料集,但如果在製作時沒有稍加設計和修飾,直行的變數和橫列的觀察值,在現今表格泛濫的報告中,其實很難吸引使用者的注意。
要顯示變數與變數之間關係的,可以使用「散佈圖」,因為透過縱橫座標的相關位置,搭配各個觀察值散佈的點,可以看出變數間呈現「正相關」、「負相關」或者根本「無關」。此外,像是以前在電玩遊戲中,常用在呈現英雄人物不同特質的「雷達圖」就很適合用來展示多個不同「變數」之間的數量或比值。
至於如果你要展示資料的分佈,可以使用「次數分配表與直方圖」、「莖葉圖」或者統計軟體minitab的最擅長的「箱形圖」;至於要呈現「次數分佈」的資料,可以使「次數分配折線圖」、「次數曲線圖」。
再以最近頗流行的「文字雲」來說(如圖1所示),因為它的顏色七彩繽紛,加上又可清楚看到中、英文文字,就獲得不少好評,但它其實沒有什麼高深學問,它就是「次數分配表」的概念,因為在資料中出現越多次的單字或單詞,會越放在文字雲的中間、字體越大。
這裡有個有趣的實驗,如果你會使用R或Python,你可以把自己身邊「友達以上、戀人未滿」的男友或女友寄給你的電子郵件,統統輸入進電腦跑一遍,你就會發現在他/她在信件中,用的哪些單字或單詞最多,或許他/她正在對你表達好感,只是你還沒有發現,「文字雲」可能有助於讓你發現端倪喔。
另外,在表達時間序列上,則以折線圖居多,並搭配上時間或日期為主。資料科學家湯瑪士‧戴文波特(Thomas H. Davenport)指出,視覺化分析越來越受重視,主要是資料科學家必先搶得使用者或企業管理者的「眼光」,受到他們的青睞,才有可能進一步使資料受到重視,進一步化為輔助管理者的決策。
作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)
歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r