WiDS Taipei 2022 | 一個記者的觀點:如何透過數據了解這個世界? — 史書華 Silva Shih

講者介紹Silva目前是天下雜誌的主編,負責中國新聞,同時帶領一組四人的數位敘事/資料新聞團隊。有著豐富從業經驗的Silva,是一名文字記者出身,曾任職英國金融時報中文網,在台灣、紐約、香港、北京生活過,並在當地教過資料新聞。在工作之餘,Silva運用她的專業在台灣大力推廣新聞科技,是全球非營利新聞社群Hacks/Hackers Taipei共同創辦人,鼓勵科技人與新聞人跨界合作。

天下雜誌的資料新聞團隊

source: Silva Shih

目前天下雜誌的資料新聞團隊是由Silva組成的四人團隊,工作內容包括創新新聞敘事、即時數據敘事和數據驅動的新聞報導,製做過俄烏戰爭、四大公投、Covid-19…等多種與數據相關的專題報導。

source: Silva Shih

在這些報導中,Silva表示數據扮演了兩個角色:

  1. 幫我們開天眼
  2. 釐清關鍵問題

以下Silva將用兩個專題報導為例,告訴我們數據如何應用在新聞報導。

如何用數據找答案?以製作「共機」專題為例

Silva有趣的說道,會製作「共機」這個題目,源自於一碗台南米糕。到台南工作,常常可以聽到飛機飛過的噪音,於是她心中冒出了一個念頭,想回答ㄧ個被高度關注的議題:共機為什麼一直飛過來?台海要開戰了嗎?

過去的新聞報導方式通常是藉由採訪大量官員或學者,平衡各家觀點。例如:「國防部官員表示,因為某些原因所以共機飛過來;某某大學教授同樣支持這樣觀點的。」

Silvaㄧ改以往的做法,讓我們透過數據找答案吧

首先,要用什麼數據呢?蒐集戰鬥機的聲音,但是這個成本太高了,不符合實計效益。Silva團隊從國防部網站提供的pdf檔案下手。

source: Silva Shih

國防部關於共機的pdf檔案大多是文字檔,需要經過處理才能轉為結構化的資料,Silva團隊也將這些整理好的資料公開在github上。

source: Silva Shih

Silva團隊初步統計初每日飛來台灣的共機架次,從下圖可以看出共機擾台的架次有增加的趨勢。然而,這個發現能說明什麼事情嗎?

source: Silva Shih

Silva團隊進一步分析擾台共機的種類,大致可分為:反潛機型、電子做戰機型、轟炸機型、戰鬥機型和早期預警機型,其中以反潛機型和電子做戰機型的架次最多。這兩種機型是沒有武裝,主要負責空中情報的偵蒐。

source: Silva Shih

另外,Silva團隊使用國防部提供的共機航行軌跡圖進行分析。由於國防部提供的資料僅是整理過的pdf檔案,Silva團隊必須將國防部提供的圖檔與真實地圖進行比對,才能將每個軌跡圖放在同一個比較標準下,進行後續的分析。

source: Silva Shih

將每個共機航行軌跡圖進行疊合後,Silva團隊發現共機大部分停留在台灣的西南空域。

source: Silva Shih

綜合以上的發現,共機擾台的主要目的很可能是為了蒐集台灣西南海域的情報。台灣的西南海域是軍事上的戰略位置,常常有各國的軍艦活動,因此了解這個區域的軍事活動對於中國而言是十分重要的。Silva認為,共機選擇在台海上空西南角頻繁活動,也對應到這塊的水下戰場經營。

另外,在刊登了這篇報導後,有讀者私訊Silva建議可以蒐集更多另類數據 (alternative data),例如:「很多軍艦會關掉自動識別系統,你們其實還可以去觀察海洋上的排泄物數據。」利用這些另類數據為分析結果做進一步的驗證。

完整報導請參考:

如何貼近讀者需求?以「台灣疫情最新動態」為例

Silvaㄧ開頭便提出大多數人的疑問:「為什麼媒體要做疫情數據儀表版?看指揮中心網站,不是就夠了?」Silva回答,提供清楚及正確的資訊是新聞媒體的責任。雖然衛福部每天都會公佈疫情的數據,但是這些數據只是文字,不方便讓人清楚了解其中的資訊。

同樣的,Silva團隊整理衛福部每天公佈的資料,並將這些整理好的資料公開在github上。此外,Silva團隊也將資料做視覺化的呈現。

source: Silva Shih
source: Silva Shih

今年四月台灣疫情爆發,每天確診人數不斷增加,Silva團隊除了即時更新數據外,他們也將這些數據與國外比較。

此外,Silva提到在數據蒐集的過程中,常常遇到指揮中心的數據標準改變,或數據需要另外要,這時Silva團隊就需要做一些調整,使得數據在呈現的時候是前後標準一致的。

source: Silva Shih

另外,Silva團隊運用內部工具抓取Google Trend的數據,觀察不同時間在前10名內和疫情相關的關鍵字的變化。因此,Silva團隊可以建議新聞製作的同事製做和關鍵字相關的報導。這就是ㄧ個典型的數據驅動新聞報導的做法,如此也會更貼近讀者的需求。

source: Silva Shih

為了讓使用者方便閱讀,關於疫情相關的新聞報導,Silva團隊建立tag將其分類,讓使用者點擊tag就會出現該類的新聞。

source: Silva Shih

完整報導請參考:https://www.cw.com.tw/graphics/covid-live-updates-2021/

Silva表示在數據驅動的新聞報導中,以下幾點是重要的:

  • Report On Data vs. Report With Data
  • 不存在完美乾淨的data
  • 不是要取代傳統的報導技藝
  • 分析完數據後,要去跑採訪、聽各領域專家意見
  • 多尋求回饋

Silva也提到幾點是未來可以努力的方向:

  • 在組織內,如何讓更多人理解和認識不同的工作方法?
  • 還有更多領域的data,等待我們去挖掘和分析,幫助我們更認識這個世界。

Q&A

Q1:
收集、整合這些數據感覺非常花時間,對媒體產業來說,花心力在這些數據上能算是一個好的「投資」嗎?

Ans:

傳統的媒體報導同樣需要花費大量時間,Silva認為新聞媒體有其責任要投資在蒐集數據上面。

Q2:

外媒在3–5年前已經有專門的團隊在做資料視覺化,想請問台灣媒體業有這方面的趨勢嗎?

Ans:

國外的媒體步調比較快,這也是Silva想創辦Hacks/Hackers Taipei的原因。

Q3:

請問這樣的數據驅動報導模式,是不是會更適合做為一個專題模式的報導,報導內容會有更長期的觀察及觀點,對於平時即時性的新聞上,可以怎麼運用數據來呈現呢?

Ans:

Silva表示不是所有的數據驅動報導都需要花幾個月的時間,像是ㄧ些重大新聞需要即時報導的類型,數據可以提供最新的資訊。

Q4:

數據蒐集需要時間,對於需即時且變化大的新聞來說,怎麼評估要不要深究數據呢?

Ans:

Silva說:「這是新聞記者的專業,新聞記者需要平時就有所準備,包括跑線和養線…等,數據也是平常要累積、要養。」

Q5:

在俄烏戰爭、大排長榮、共機及COVID疫情等案例中,視覺化的呈現都很簡潔美觀,請問是使用什麼樣的工具製作的?

Ans:

使用D3.js和Svelte.js。

Q6:

你們做的分析也許學者專家早就做過嚴謹的分析。自己重做分析跟訪問學者的研究結果有什麼差異?

Ans:

記者並非研究人員,會先蒐集資料,再找專家訪問。Silva提到,在拜訪專家時,若是有做完分析,專家也會比較願意深入的回答,而不是只是要專家背書某個論點而已。

Q7:

新聞產業主要提供即時資料給與大家參考,那針對資料中正常或不正常的資料通常都會怎麼判斷呢?

Ans:

新聞的資料都會是來自權威或機構,若是對於資料的正確性有疑問,則會再找專家學者進一步確認。

--

--