用 Tableau 將新型冠狀病毒(COVID-19)進行資料視覺化
週末手癢,來對 2020/4/9 公開取得之 新型冠狀肺炎(COVID-19)開放資料,進行了一些 Tableau 的視覺化分析嘗試,本篇文章分成五個段落,分別是:
- 資料取得(Data Acquisition)
- 全球 TOP20 感染人數大國觀察
- 台灣的感染人數|全球排行變化
- 全球確診人數變化
- 全球感染人數預測(Data Prediction)
一、資料取得(Data Acquisition)
感謝許多單位都有進行資料彙整,目前資料是從此網站取得的:
從他的 Data and Resources 的地方,有三個主要來源:
- time_series_covid19_confirmed_global.csv(全球確診人數統計)
- time_series_covid19_deaths_global.csv(全球死亡人數統計)
- time_series_covid19_recovered_global.csv(全球康復人數統計)
以下是該資料下載區域的截圖:
下載後,基本上本機電腦,就有這三包資料了,接下來,看是要用哪套軟體來玩都是可以的,我蠻愛使用 Tableau 做視覺化的,所以本篇的圖表都是用 Tableau 產生而成。
二、全球 TOP20 感染人數大國觀察
如果將 4/9 的數據,用地圖的方式來呈現 TOP20 感染大國的話,視覺化結果如下圖。(ps. 可以特別留意紅色區塊的國家,代表是感染人數超過 30,000 的國家)
也同步提供各國確診數字排名如下:
1. US:461,437
2. Spain:153,222
3. Italy:143,626
4. France:118,781
5. Germany:118,181
6. China:82,883
7. Iran:66,220
8. United Kingdom:65,872
9. Turkey:42,282
10. Belgium:24,983
11. Switzerland:24,051
12. Netherlands:21,903
13. Canada:20,654
14. Brazil:18,092
15. Portugal:13,956
16. Austria:13,244
17. Korea, South:10,423
18. Russia:10,131
19. Israel:9,968
20. Sweden:9,141
—
雖然說目前美國的人數是第一,但歐洲區的義大利、西班牙、德國、英國也都破10萬人確診了,視覺化之後,可容易觀察到鄰近的國家人數也都是世界排行前面20,現在真的是非常不適合去歐洲啊 …
—
不過蠻神奇的地方是,感覺目前的『高確診人數國』&『已開發國家』兩者的重疊度異常的高,這之中是不是有什麼神奇之處…會不會是許多國家其實感染率爆高,但因為或許缺少檢驗機制,所以無法在數據上反應出來呢? 蠻值得後續觀察看看 🤔
三、台灣的感染人數|全球排行變化
台灣其實在一開始傳出疫情的時候,就有人指出台灣可能將會是全球第二嚴重的國家(來源),但具體而言,台灣的變化是如何呢?此部分直接用表格的形式,透過每隔一些日期的變化,來觀察排行變化,就可以看得很清楚。
- 台灣在 1/22 的時候,感染人數是全球第 4 名
- 台灣在 1/31 的時候,感染人數是全球第 6 名
- 台灣在 2/9 的時候,感染人數是全球第 8名
- 台灣在 2/29 的時候,感染人數是全球第 15 名
- 台灣在 3/20 的時候,感染人數掉到全球第 60 名
- 台灣在 4/9 的時候,感染人數再次掉到全球第 92 名
從最開始的數據來觀察,確實一開始是相對危險的區域,但隨時時間過去,台灣可能是因為SARS期間的慘痛經驗,這次很快的做出了許多的反應措施,而到後來,變成全球相對非常不嚴重的區域,雖然截止目前為止(2020/4/11)每日還是有新的確診人次產生,但大多數是境外移入的人,目前尚未產生國內大規模的群聚感染事件,在全球已經算是非常安全的國家。
四、全球確診人數變化
也嘗試用 Tableau 觀察一下武漢肺炎 COVID-19 的『全球每日確診人數的變化』,很直覺大概知道從三月底開始,每天確診人數都不斷攀升,而且速度越來越快,但近期的狀況又是如何呢?
以下大該挑了一些時間點,作為全球確診人數變化的參考日期:
- 2020/1/23 日:新增感染個案數 99 人
- 2020/2/2 日:新增感染個案數 4,749人
- 2020/2/13 日:新增感染個案數 15,147人
- 2020/3/13 日:新增感染個案數 16,853人
- 2020/3/21 日:新增感染個案數 32,299
- 2020/3/26 日:新增感染個案數 61,938人
- 2020/3/31 日:新增感染個案數 75,098人
- 2020/4/4 日:新增感染個案數 101,491人
- 2020/4/10 日:新增感染個案數 96,369人
也就是說,大抵上全球感染速度雖然越來越快,但這幾天有比較好一點點,至少比較不是持續線性增長了,目前在 4/4 時看起來是最高峰,後來有比較控制住,但比較麻煩的是昨日 4/10 又達到了歷史第二高的個案成長數,不知未來的演進會如何
五、全球感染人數預測(Data Prediction)
4/9 時,全球統計的確診人次為 159 萬人,但由於近一個月的數字成長力道都蠻強勁的,所以如果透過 Tableau 的預測模組來進行預測的話,到 5/9 的時候全球確診人次將會來到 405 萬人,不過延續前段的分析,似乎近幾天成長的力道開始有一點減緩的可能性,各國也更加重視各種防疫的措施,希望後續的感染力度可以逐步下降,讓這波疫情能夠儘早過去。
關於 Tableau
這則文章裡的圖,都是透過 Tableau 軟體所製作的,Tableau 能夠與傳統軟體(例如:Excel)結合使用,並強化大數據視覺化之能力,幫助我們分析,也成為全球許多企業指定視覺化工具。
ps. 我目前有在 Hahow 開設 Tableau 課程,課程內容案例,將針對銷售資料、財務資料、公開資料、物聯網資料等等進行視覺化教學,也會引入本篇介紹的COVID-19新型冠狀病毒資料案例,歡迎大家可以參考看看。
➡️ Hahow 課程連結:https://hahow.in/cr/data-tableau