新型冠狀病毒肺炎病例增長分析

Darren Chiu
The Good Data
Published in
4 min readFeb 3, 2020

(以下分析是以截至2020年2月3日的公開數據為基礎)

TLDR :有部份省份確診病例增長率不斷增加,顯示傳播速度在某些省份正在加速(其中包括廣東省、江蘇省、安徽省及湖南省),必需多加注意。作為香港人,需要特別留意是的是與香港一脈相連的廣東省。但好消息是,以同樣的分析方法,結果顯示湖北省的傳播速度正在減慢,顯示疫情開始受控。

新型冠狀病毒疫情持續,我們團隊利用世衞及各大機構發佈的數據,製作了一個病例增長分析圖表。我們希望從數據中,了解更多中國疫情發展的最新情況,並實時更新,以便大家可以得到最新的分析及數字。當然,我們在此先假設我們獲得的數據正確,在文末會簡單講解一下這個假設的潛在問題。

實時更新圖表

(亦可Bookmark以下連結,歡迎轉載:http://bit.ly/2RU8s61)

分析方法

由於今次的分析主要針對確診病例增長速率,所以下文會先忽略圖表上半部份關於全球感染人數的圖表,主力針對下半部份的"Confirmed Csaes Growing Trends” 。

中間彩色的圖表,主要是列出各省份的1–4天的增長率,大家有興趣可以查閱一下相關的數字。1-Day % Change的定義為

今天新增確診數字÷截至前一天的總確診人數

而2-Days % Change的定義為

過去兩天新增確診數字÷截至兩天前的總確診人數

3-Days % Change 及 4-Days % Change原理亦同上。

本文想特別針對分析的,是最底紅色及黃色的兩張圖表。兩張圖表分別是每省份過去五天的“1-Day % Change” 及"各省份過去五天的“2-Days % Change”。

分析增長率變化,而非單純的看病例變化的原因,是因為我們想從中看出情況惡化或改善的趨勢。病例增長,是無可否認的事實,但是否在情況是否受控或改善中,則需要看病例數字增速的變化。換句話說,本文會針對分析的不是今天增加了多少宗病例,而是今天增加的病例數字,有否比之前多或少。如果每天增加的病例數字愈來愈多,我們可以大致得出傳播速度正在加快的結論,反之亦然。(當然傳播速度的計算涉及更複雜的數學模型,暫且不在此討論)

觀察

我們先看看紅色的每省份過去五天的“1-Day % Change”圖表:

我們可以看到其實大部份省份的“1-Day % Change”其實並沒有一個清𥇦的向上或向下趨勢,大部份都是一天加速傳播、一天減速傳播的情況。但有幾個省份我們是可以清楚看到下降趨勢的,其中包括河南省及四川省。兩者皆是位於重災區的湖北省旁邊,能夠如此快把疫情控制住,令人意外。

但因為其他大部份的省份的病例增長率都呈現不穩定的情況,我們就製作了各省份過去五天的“2-Days % Change”圖表:

在統計學上,我們改為看“2-Days % Change”,好處在於可以將圖表「平滑化(Smoothing)」, 從而看到更明顯的趨勢。在這個圖表中,趨勢就明顯得多了。我們可以清楚見到好一大部份的省份都保持著平穩或向下的傳播速度趨勢,其中包括了江西省、上海市等。特別值得一提的是重災區湖北省也呈現出平穩的增長率,顯示疫情的發源地疫情開始受控。

但令人憂慮的是另外幾個顯示確診案例增長加速的省份,其中包括廣東省、江蘇省、安徽省及湖南省。這幾個省份都顯示同樣的規律,增速先降後升,顯示出死灰復燃的跡象。我們從圖表中暫時未能推論出先跌後升規律的原因,如果大家有想法,歡迎跟我們分享。但可以確定的是這幾個省份的情況有機會在惡化,希望情況能盡快受控。

小結

我們這個簡單的圖表及分析包括了大量的假設,因此不敢大膽寫成結論。但其中的一些蛛絲螞跡卻有機會為大家提供一點提醒,讓大家在追蹤疫情最新發展時提供多一個角度去看疫情控制的工作。我們在分析及製圖中的一些統計學假設及背後的原因,將會於另一篇文章中詳加講解。

按:開源數據的格式有可能會突然改變,以致圖表的數字未必完全準確或發生技術錯誤,請以官方發佈數據為準。另外,按今天NowTV 新聞報導及港大專家教授提及,武漢的試劑短缺,確診數字很有可能被低估,因此上文的分析是絕對有可能跟實際情況脫節。

數據來源:John Hopkins University

--

--

Darren Chiu
The Good Data

Unique blend of tech, business and psychology. Product@TechJobAsia. Ex-Google Architect. Ex-Morgan Stanley, Ex-Credit Suisse SWE.