從 COVID-19 學資料視覺化圖表設計
身在超前部署防疫有成的台灣,除了疾管家在 LINE 上偶爾通知又多了幾則零星病例外,生活起居幾乎都恢復正常。其實很難想像此時此刻,海外同事所在的日本、香港正面臨第二波疫情。不少南、北美及中東國家每日確診數沒有減緩的趨勢。尤其美國每天新增的確診人數佔全球近 1/4,累積病例與死亡人數世界第一。COVID-19 疫情很真實的持續在「全球大流行」。
透明數據幫助了解疫情發展
想關心疫情全球大流行的發展現況,最快的方式就是關注權威性國際新聞媒體與網路公開資料。而這些管道的共同點就是都提供了清晰的圖表,幫助閱者快速吸收複雜資訊,進而做出正確解讀與判斷。這些圖表就是「資料視覺化 Data Visualization」,意指將複雜數據資料用易於吸收的圖形化方式呈現,幫助閱者有效理解與分析資料。
早在疫情剛爆發的一月,美國約翰霍普金斯大學就率先公開了全球疫情追蹤 dashboard。負責發布 dashboard 的 Center for Systems Science and Engineering 中心主任 Lauren Gardner 在 CNN 的訪問中有說到她認為「大眾能夠從透明的數據中理解疫情爆發情況是非常重要的。隨著時間推移,這些數據對於研究社群而言也會變得越來越有價值。」在疫情還沒擴散到歐美的當時,這樣一個數據儀表板的出現,大大的數字配上鮮紅的圓圈顯示在世界地圖上,的確非常有警世意味。
而隨著 COVID-19 在國際間擴散,各國政府與疫管機關也陸續發布官方疫情追蹤儀表板,除了向國人公布海內外疫情現況外,也加入建立正確防疫心態與行為的宣導。先不論數據透明度與真實性,從各國的例子可以看出每個國家對於資訊圖表的呈現方式與設計品質大不相同。因應在地需求,也有確診地圖(香港)、趨勢預告圖(美國)等不同應用方式。
資料視覺化在疫情期間的使命
前面有提到資料視覺化旨在有效且正確地將複雜數據轉化成簡單易懂的圖表傳達資訊,讓閱者容易理解,做出正確判讀。資料視覺化在疫情剛爆發期間因此有著更神聖的使命,除了讓一般民眾了解疫情的嚴重性,也能幫助官方即時因應數據變化做出正確的防疫判斷。
台灣就是搶先成立中央流行疫情指揮中心,串連出入境與健保等系統資料,建立完善數據機制,用圖譜化數據分析探索確診者關聯性才能即時反應,得以有效控制疫情拓展的良好範例之一。
對於一般普羅大眾而言,在不安定的時刻要讓人清楚了解 COVID-19 與正視疫情的影響,如何設計良好且能傳達正確資訊的資料視覺化圖表在疫情爆發期間就變得格外重要。身在設計產業多少已從網路、書籍中學到很多資料視覺化圖表設計的基本觀念跟方法,但是在疫情期間看到大量各種圖表,不經讓人多加思考還有什麼該注意的地方?
Datawrapper 團隊提出了一份富有責任感的 COVID-19 資料視覺化準則非常值得參考:
1. 為表尊重,我們不使用紅色表示確診案例(同時使用黑色來顯示死亡數據)
2. 顯示絕對數字的同時,我們也提供相對值幫助比較
3. 因為多數人會痊癒,我們盡量避免使用總累積案例數
4. 為了反映區域內較真實的疫情比例,我們使用符號比例圖,不使用等值區域圖
他們認為每個資料視覺化圖表都是帶有故事性的事實陳述。這些圖表不應該帶來恐慌,而是以冷靜謹慎的角度來把事實展現在人們眼前。
以下也幫大家整理了更多專家或設計師發現到的問題與建議。
如何設計與解讀圖表
BBC 三月發表了一篇針對中國疫情的報導中提供了這張圖表。這張圖表出了什麼問題?
有基本觀念的人很容易就會發現,圖表因為空間的關係切在 15% 是個問題。這會造成資料解讀上,數據被放大的效果。但除了數據的呈現外,圖表標題「死亡率 Death rate」這個用詞也很有問題。
從科學角度而言,僅憑單一地區死亡人數資料,並不能直接代表某一個疾病的死亡率。它僅僅只能當作回報確診人數跟死亡人數的比例估算而已。在沒有全盤研究跟縝密計算前,什麼什麼率的計算跟製圖還是交給專業的流行病學家來吧!
從情感面的角度,在疫情爆發人心惶惶的時刻,用聳動的標題雖然能吸引注意力,但不應該再用沒有幫助或不正確的資訊擴大民眾的焦慮。專家建議能忠實呈現數據又不具有過多情感影響力的呈現方式是這個樣子:
回頭再來看看全球首發 JHU dashboard 圖表有什麼問題?
整片的血紅確實很警世,但每個紅字背後代表的是每個確診病患,而且確診不代表被判了死刑,事實上多數的人能夠痊癒。為此在設計圖表的時候都應當要對每個資料點所代表真實的人有基本的尊重。
其次是用地圖呈現數據的詮釋方式上,雖然符號比例圖 Symbol Map 在這個使用情境更適合等值區域圖 Choropleth Map,但在代表疫情初期,各地數據量級差距過大,當圈圈大到足以把整個國家都蓋住時,反而沒辦法正確表示實際確診人數之於當地國民數量的比例,容易讓人過度放大疫情在某一地區的真實影響程度。
同一個數據的表達方式百百種,如果把累積確診/死亡數字直接做成圖表有什麼問題呢?
圖表除了正確表達數據外,應該也要帶來能夠轉化為行動的洞見 (actionable insight)。
這些洞見可能幫助我們回答病毒散播的速度是否更快了?或是其實有減緩的趨勢?什麼時候會達到頂峰?甚至是醫療資源緊繃預期什麼時候可以緩解?單純比較各國累積確診/死亡人數其實沒有任何價值。很簡單的把累積數字改成 3 日或 7 日平均,乃至於按人口比例計算,都可能是更有資訊含量的呈現方式。
甚至有專家提出趨勢圖的建議,用現有數據去預估各地接下來的疫情發展,讓官方能夠針對趨勢調整防疫政策與醫療資源部署。他表示這樣的圖表才真正具有能夠轉化為行動的洞見:
而比較各國數據能夠發人省思最具代表性的例子莫過於 Financial Times 的資料記者 John Burn-Murdoch 所發表的彈道圖表了。基於病毒擴散的特性,他選擇使用對數尺度、對齊各國第 100 例時間點所呈現的圖表,首次讓歐美更精準客觀的比較出各國疫情蔓延的狀況。(有興趣可以看他的專訪)
不過這樣一個被廣為流傳、轉製,看似完美的圖表,由不懂製圖原理的人來看,不多花點心思解讀,還是有可能誤解什麼。Vox 的影片清楚列出四個潛在盲點:
1. 各國確診人數代表的是防疫效率與檢測資源;
2. 對數尺度容易讓人小看日漸累積極高的總數;
3. 沒有針對國家人口調整比例,大國的曲線平坦,容易讓人忽視部分城市的嚴重疫情;
4. 圖表起始時間點不同,其實不同國家防疫反應時間不同
雖然看得出來影片其實想諷刺美國官方防疫心態與表現,但也提醒我們與疫情相關的資料視覺化圖表,不管是設計與解讀都要更加謹慎。想了解疫情的全貌,不能只依賴單一片面的資料呈現。
看完了這些範例後,其實可以更深刻的體會到除了遵守最基本的資料視覺化準則外,設計疫情相關的圖表具有更深層的意義。
即便是選擇了有公信力的媒體或資料來源,任何人在觀看與解讀疫情相關的圖表時,專家提醒數據的完整性可能因不同國家政策與受測資源程度不一有延遲或差異,直接比較不同防疫措施的國家容易導出錯誤結論。而任何製圖者更有責任做出更周全的設計決策,降低閱者不管是資訊或情感面錯誤判讀的可能。
最後不免俗要呼籲,雖然 COVID-19 疫情全球持續延燒。令人欣慰的是就算確診,很大的機會能夠康復。大家不需要過份緊張或絕望,應該好好配合在地機關的防疫措施,保持安全社交距離,養成個人良好衛生習慣,保護自己與身邊的人,協力減緩疫情擴散。
延伸閱讀:
- Ten Considerations Before You Create Another Chart About COVID-19
- Visualizing Hope for a Successful, Data-Driven, COVID-19 Reopening
- 資料視覺化Data Visualization:圖表設計
- Coronavirus Map: Tracking the Global Outbreak by the New York Times
- Coronavirus tracked: the latest figures as countries start to reopen by Financial Times