繪製《乘風2023》數據圖表的反思(5) — 納入時間的比較

Dennis Tseng
DD Story Hub
Published in
Jul 11, 2023

這篇文談到了想要視覺化呈現資料時,如何納入時間元素,比較不同時間點的數值大小。

註:部落格版本在此

本文共分好幾篇,都在講述繪製《乘風2023》數據圖表時遇上的困難與反思。請見第1篇第2篇第3篇第4篇

視覺化資料時,時常遇到比較與排序,這也是圖表的優勢,將長條橫放就能快速看出數值大小。不過,如果要納入時間維度時,該怎麼挑選合適的圖表?本文就是探討把時間納入比較考量時,要怎麼找出好的資料視覺化。

《乘風2023》第四次公演的Amber戰隊,表演曲目為《青鳥》,從左到右,前排為Amber和劉惜君,中間為小美,後排為吉娜、謝欣、陳意涵。截自芒果TV。

延伸閱讀:看《乘風破浪》的夏天:打開浪姐的八百萬種方法

*註:如果你只想看跟《乘風2023》有關的圖表,可以直接去看 IG 上的這篇文章,或是搜尋在 IG 上搜尋 “ddplot”,加上關鍵字 hashtag 也可以。

資料介紹

我在問卷中,請填答者選擇最想見到可以復活的姐姐們。

  • 三公結束、四公比賽前「暫離」的姐姐,如果可以的話,最希望看誰復活?。
問卷實際長相。截圖。

這題是複選題,其實要畫成圖表很容易,只要跟其他題目一樣,利用長條圖就能呈現填答者,渴望復活姐姐的強度大小

以其他題目有問的「喜愛度」來說,就是用長條大小呈現票數。

利用長條圖呈現姐姐個人喜愛度。Instagram @ddplot。

整理好的資料很簡單,只有兩個欄位,一個是姐姐名字,另一個則是得票數。

姐姐與得票數。截圖。

如同上面所說,長條圖就可以輕鬆搞定,但總覺得這樣不夠有趣。

因此,我開始思考,還有什麼資訊對讀者來說,可能是重要的?

第一個問題:對讀者來說什麼重要?

為什麼暫別舞台的時點很重要?因為隨著進度推進,讀者也會累積出情感;但與此同時,本來對特定姐姐的熱愛還是會在投票時起作用。

因此,這份復活排名,其實同時反映節目前對姐姐的喜愛(所以想看她更多舞台),以及看節目後累積出的情感(希望能夠復活繼續活躍)。

汪小敏在《乘風2023》初舞台表演粵語版《嘉賓》。截自芒果TV官方YouTube

設想讀者心境的時候,做出一個假設:越晚被淘汰的姐姐,是否得票會越高?

即使統計結果反映假設無法成立,也沒有關係。這反映出上面所說,還有其他偏好在起作用。

思考到此,我認為在圖表上加上「時間」維度,應該可以讓讀者得到更多,也能使圖表意義更加繁盛。

加上「時間」欄位後的新資料。截圖。

下一步,就是想辦法在圖表中呈現時間。

第二個問題:如何呈現時間?

平常討論到呈現時間,最直覺想到的都會是折線圖(line chart),例如底下這張呈現台灣傳直銷產業營業額的折線圖。

利用折線圖呈現台灣傳直銷產業營業額變化的折線圖。Instagram @ddplot。

不過,上方折線圖是要呈現單一變數(營業額)歷年變化,但這次要比較姐姐之間的票數,情形有點不同。

把姐姐當成變數來看,每一位姐姐都是一種類別(category),且每人都會對應到一個時點,並不是單一變數的歷年變化,因此需要另闢蹊徑。

若同樣把離開舞台的時機點當成類別,每個類別下都會有好幾個姐姐,變成以分組(group)來看待這份資料,似乎一切就有了轉機,因為這種情境,恰巧就是點圖(dot plot)出場的好時機

什麼是點圖?

點圖(dot plot)跟散點圖(scatter plot)哪裡不一樣?

散點圖呈現的是變數之間的關係,因此會把想了解的變數分別映射到x軸與y軸。

例如底下這張圖,就在看P-League季後賽球員三分球出手數與命中率之間的關係。

利用散點圖呈現球員出手數與命中率的關係。Instagram @ddplot。

至於點圖,則是把組別(離散,discrete)或者數值(連續,continuous)映射到x軸上,接著查看每個組別或者數值分別累積多少量。

點圖實例

以Google搜尋點圖為例,我們可以看到x軸有些是連續的,其實呈現起來類似直方圖(histogram),有些是離散的,主要是用來呈現分組用。

點圖範例,Googele搜尋截圖。

政治主題的圖表,也有相關應用,例如下圖就是用點圖,將「藍綠翻轉次數」分為0–3次,並且以點點具體呈現縣市名稱。

以點圖呈現不同翻轉次數的縣市。Instagram @ddplot。

若是以此圖為例,我們可以仿效它,將淘汰時機映射到x軸,藉此呈現不同姐姐的淘汰時間,再以每位姐姐為資料點,映射到y軸。

第三個問題:怎麼比較數值大小?

當然,這次圖表的重點還是在於數值大小,也就是每位姐姐得到的希望復活票數。

想要比較數值,有兩種直觀的方式能夠處理。

第一種是將y軸的相對位置,作為獲票數多寡,舉例來說,在一公中淘汰的姐姐當中,陳冰得到最多票數、王佳宇最少,則我們可以把陳冰放在4位選手中的最上方、王佳宇放在最下方。

不過,這樣遇到的問題是,每次淘汰人數不同,越往後淘汰人數越少,理解圖表時難以比較不同淘汰時間點的姐姐之間,高低位置和大小並不直接相符。

因此,我採取了第二種方法,直接將姐姐獲得的票數映射到每個點的大小,獲票數越多,點點就越大。成果如下。

以點圖呈現姐姐獲得的復活票數。Instagram @ddplot。

到此為止,我們一方便呈現了退賽時機,一方面也呈現了姐姐獲得的票數。

小結:青鳥和閉嘴跳舞

其實,用長條圖就能呈現結果,但因為想額外加入時間維度,因此花時間探討不同呈現方式的可能性。

其實,是不是要多做這一步、多嘗試新呈現,很看繪圖者的餘裕,因為發想新圖表是需要時間與心力的。不只如此,讀者能夠讀懂新圖表嗎?每換一種表現方式,都必須將這個提問銘記在心。

因為,將資料化為圖表的意義,最關鍵的就在於有沒有滿足讀者,這才是核心。

整體來說,這次視覺化遇到的問題也是很有趣的挑戰。接下來如果有其他視覺化上的煩惱,會持續更新。請繼續收看《乘風2023》!

附註:《青鳥》《閉嘴跳舞》是我四公中最喜歡的舞台。

--

--

Dennis Tseng
DD Story Hub

現在不是新聞所學生也不算資料分析師了,變成記者。對商業分析、統計、資料視覺化、資料新聞都很有興趣,喜歡寫 R!