敘述性統計的呈現方式 — 其他圖形

行銷資料科學
Nov 6 · 3 min read

統計圖表的類型很多,以大家最常使用橫排、直排的交叉表(Cross Table)來說,雖然已可大幅簡化收到的資料集,但如果在製作時沒有稍加設計和修飾,直行的變數和橫列的觀察值,在現今表格泛濫的報告中,其實很難吸引使用者的注意。

要顯示變數與變數之間關係的,可以使用「散佈圖」,因為透過縱橫座標的相關位置,搭配各個觀察值散佈的點,可以看出變數間呈現「正相關」、「負相關」或者根本「無關」。此外,像是以前在電玩遊戲中,常用在呈現英雄人物不同特質的「雷達圖」就很適合用來展示多個不同「變數」之間的數量或比值。

至於如果你要展示資料的分佈,可以使用「次數分配表與直方圖」、「莖葉圖」或者統計軟體minitab的最擅長的「箱形圖」;至於要呈現「次數分佈」的資料,可以使「次數分配折線圖」、「次數曲線圖」。

再以最近頗流行的「文字雲」來說(如圖1所示),因為它的顏色七彩繽紛,加上又可清楚看到中、英文文字,就獲得不少好評,但它其實沒有什麼高深學問,它就是「次數分配表」的概念,因為在資料中出現越多次的單字或單詞,會越放在文字雲的中間、字體越大。

圖1 文字雲範例

這裡有個有趣的實驗,如果你會使用R或Python,你可以把自己身邊「友達以上、戀人未滿」的男友或女友寄給你的電子郵件,統統輸入進電腦跑一遍,你就會發現在他/她在信件中,用的哪些單字或單詞最多,或許他/她正在對你表達好感,只是你還沒有發現,「文字雲」可能有助於讓你發現端倪喔。

另外,在表達時間序列上,則以折線圖居多,並搭配上時間或日期為主。資料科學家湯瑪士‧戴文波特(Thomas H. Davenport)指出,視覺化分析越來越受重視,主要是資料科學家必先搶得使用者或企業管理者的「眼光」,受到他們的青睞,才有可能進一步使資料受到重視,進一步化為輔助管理者的決策。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

您可能有興趣:

Marketingdatascience

行銷資料科學 — 數據驅動精準行銷。基礎概念、趨勢、方法和實戰。

行銷資料科學

Written by

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR

Marketingdatascience

行銷資料科學 — 數據驅動精準行銷。基礎概念、趨勢、方法和實戰。

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade