用 Tableau 將新型冠狀病毒(COVID-19)進行資料視覺化

Jack Peng(彭其捷)
7 min readApr 11, 2020

--

週末手癢,來對 2020/4/9 公開取得之 新型冠狀肺炎(COVID-19)開放資料,進行了一些 Tableau 的視覺化分析嘗試,本篇文章分成五個段落,分別是:

  1. 資料取得(Data Acquisition)
  2. 全球 TOP20 感染人數大國觀察
  3. 台灣的感染人數|全球排行變化
  4. 全球確診人數變化
  5. 全球感染人數預測(Data Prediction)

一、資料取得(Data Acquisition)

感謝許多單位都有進行資料彙整,目前資料是從此網站取得的:

HDX HUMANITARIAN DATA EXCHANGE

從他的 Data and Resources 的地方,有三個主要來源:

  • time_series_covid19_confirmed_global.csv(全球確診人數統計)
  • time_series_covid19_deaths_global.csv(全球死亡人數統計)
  • time_series_covid19_recovered_global.csv(全球康復人數統計)

以下是該資料下載區域的截圖:

上圖:HDX 網站資料下載的地方

下載後,基本上本機電腦,就有這三包資料了,接下來,看是要用哪套軟體來玩都是可以的,我蠻愛使用 Tableau 做視覺化的,所以本篇的圖表都是用 Tableau 產生而成。

圖:完成資料下載,確保本機有這三包資料即可

二、全球 TOP20 感染人數大國觀察

如果將 4/9 的數據,用地圖的方式來呈現 TOP20 感染大國的話,視覺化結果如下圖。(ps. 可以特別留意紅色區塊的國家,代表是感染人數超過 30,000 的國家)

圖:全球 4/9 感染人數 TOP20 之國家

也同步提供各國確診數字排名如下:
1. US:461,437
2. Spain:153,222
3. Italy:143,626
4. France:118,781
5. Germany:118,181
6. China:82,883
7. Iran:66,220
8. United Kingdom:65,872
9. Turkey:42,282
10. Belgium:24,983
11. Switzerland:24,051
12. Netherlands:21,903
13. Canada:20,654
14. Brazil:18,092
15. Portugal:13,956
16. Austria:13,244
17. Korea, South:10,423
18. Russia:10,131
19. Israel:9,968
20. Sweden:9,141

雖然說目前美國的人數是第一,但歐洲區的義大利、西班牙、德國、英國也都破10萬人確診了,視覺化之後,可容易觀察到鄰近的國家人數也都是世界排行前面20,現在真的是非常不適合去歐洲啊 …

不過蠻神奇的地方是,感覺目前的『高確診人數國』&『已開發國家』兩者的重疊度異常的高,這之中是不是有什麼神奇之處…會不會是許多國家其實感染率爆高,但因為或許缺少檢驗機制,所以無法在數據上反應出來呢? 蠻值得後續觀察看看 🤔

三、台灣的感染人數|全球排行變化

台灣其實在一開始傳出疫情的時候,就有人指出台灣可能將會是全球第二嚴重的國家(來源),但具體而言,台灣的變化是如何呢?此部分直接用表格的形式,透過每隔一些日期的變化,來觀察排行變化,就可以看得很清楚。

圖:觀察台灣感染人數變化的全球排名
  • 台灣在 1/22 的時候,感染人數是全球第 4 名
  • 台灣在 1/31 的時候,感染人數是全球第 6 名
  • 台灣在 2/9 的時候,感染人數是全球第 8名
  • 台灣在 2/29 的時候,感染人數是全球第 15 名
  • 台灣在 3/20 的時候,感染人數掉到全球第 60 名
  • 台灣在 4/9 的時候,感染人數再次掉到全球第 92 名

從最開始的數據來觀察,確實一開始是相對危險的區域,但隨時時間過去,台灣可能是因為SARS期間的慘痛經驗,這次很快的做出了許多的反應措施,而到後來,變成全球相對非常不嚴重的區域,雖然截止目前為止(2020/4/11)每日還是有新的確診人次產生,但大多數是境外移入的人,目前尚未產生國內大規模的群聚感染事件,在全球已經算是非常安全的國家。

四、全球確診人數變化

也嘗試用 Tableau 觀察一下武漢肺炎 COVID-19 的『全球每日確診人數的變化』,很直覺大概知道從三月底開始,每天確診人數都不斷攀升,而且速度越來越快,但近期的狀況又是如何呢?

以下大該挑了一些時間點,作為全球確診人數變化的參考日期:

圖:全球每日新增確診人數(截止 4/10 目前為止,4/4 人數增加最多,而 4/10 則新增感染數第二多)
  • 2020/1/23 日:新增感染個案數 99 人
  • 2020/2/2 日:新增感染個案數 4,749人
  • 2020/2/13 日:新增感染個案數 15,147人
  • 2020/3/13 日:新增感染個案數 16,853人
  • 2020/3/21 日:新增感染個案數 32,299
  • 2020/3/26 日:新增感染個案數 61,938人
  • 2020/3/31 日:新增感染個案數 75,098人
  • 2020/4/4 日:新增感染個案數 101,491人
  • 2020/4/10 日:新增感染個案數 96,369人

也就是說,大抵上全球感染速度雖然越來越快,但這幾天有比較好一點點,至少比較不是持續線性增長了,目前在 4/4 時看起來是最高峰,後來有比較控制住,但比較麻煩的是昨日 4/10 又達到了歷史第二高的個案成長數,不知未來的演進會如何

五、全球感染人數預測(Data Prediction)

4/9 時,全球統計的確診人次為 159 萬人,但由於近一個月的數字成長力道都蠻強勁的,所以如果透過 Tableau 的預測模組來進行預測的話,到 5/9 的時候全球確診人次將會來到 405 萬人,不過延續前段的分析,似乎近幾天成長的力道開始有一點減緩的可能性,各國也更加重視各種防疫的措施,希望後續的感染力度可以逐步下降,讓這波疫情能夠儘早過去。

圖:針對 4/9 全球確診數的資料所做的 30 日預測數值

關於 Tableau

這則文章裡的圖,都是透過 Tableau 軟體所製作的,Tableau 能夠與傳統軟體(例如:Excel)結合使用,並強化大數據視覺化之能力,幫助我們分析,也成為全球許多企業指定視覺化工具。

ps. 我目前有在 Hahow 開設 Tableau 課程,課程內容案例,將針對銷售資料、財務資料、公開資料、物聯網資料等等進行視覺化教學,也會引入本篇介紹的COVID-19新型冠狀病毒資料案例,歡迎大家可以參考看看。

➡️ Hahow 課程連結:https://hahow.in/cr/data-tableau

圖:我在 Hahow 開設課程之主視覺

--

--

Jack Peng(彭其捷)

🌵About Me :https://www.visualization.tw/ (資料視覺化、資料科學、研究生、寫作、教學、UX 設計、自助旅遊、運動)