程式麻瓜如我,如何開始嘗試資料新聞(data journalism)

zoelee
READr
Published in
5 min readApr 25, 2019
現在已經成為歷史文件的政治獻金資料。我們做完「數讀政治獻金」專題之後,因應透明化的修法,後來監察院改變了查閱方式。現在可以直接複製 PDF 檔案燒成光碟,不用再印紙本了~

因為 READr 的暑期 workshop 計畫,近期收到了很多想嘗試資料新聞的同學的申請,從內容大概可以看出他對資料新聞的想像是具體還是模糊的,也蠻有趣。加上今天收到 coversation with data 的電子報,內容是給想嘗試資料新聞的記者(如何開始學 python)、或是當你想要雇用一個資料記者時,該注意什麼。快兩年的工作歷程,自己也有一些心得,決定來寫點東西。

我應該可以說是跟著這個團隊一起成長的(吧)。雖然資料新聞這個主軸一直很明確,但從到底我們要做什麼樣的新聞、什麼樣的議題應該出手、角度要怎麼切,到數據和新聞的比例,以及我們如何看待「資料」這件事,在團隊裡都有很多的討論。

身為鏡週刊的技術團隊,我們的優點就是有很多厲害的設計師跟工程師可以合作,基本上只要你想像得到(而且這個 idea 是有意義的),什麼都可以做得出來。

原本我也是秉持著一種「專業的事情交給專業的人做,我應該不必學 coding 或是資料視覺化吧」的心情。但約莫過了半年,我發現這樣不行。

我發現 coding 跟視覺化,應該跟採訪技巧和寫作技巧之於記者一樣,點了這個技能樹,你能夠訪問到的面向就愈多,能夠問的問題就愈深。只是後者採訪的對象是人,前者採訪的對象是資料。

所以我給自己設定了目標:我要有能力對資料問問題。從簡單的視覺化開始,最簡單的圖表,到稍微複雜一點的地圖,摸索不同的資料視覺化工具,到開始學習用 R 清理資料,後來連簡單的網頁爬蟲我都能夠不假同事之手。

當然,最後資料要怎麼呈現、視覺化要怎麼樣才能達到目的、網頁可以運用什麼方式跟讀者互動,這些都仰賴我同事們的專業。

不過,最大的困難就是沒人可以問。因為我的同事們也不用這些東西(我們團隊的工程師同事對 python 比較熟),如果我用 R 或是 QGIS 有問題,就只能自己抱著書,或是用各種關鍵字 google,找出答案,還好網路資源很多。

那要怎麼開始呢?

這篇專訪是這樣建議的:

挑一個不要太有野心的題目。最好是個你知道如何不用程式也能完成,而且不要有時間壓力的題目。試著去想,如何用程式語言來完成它,然後試著去做。
這樣的話,你就可以在舒適圈裡完成這項工作。你不會有截稿壓力,也可以學到新的東西,且當真的快趕不上截稿時,你有備用的方法可以完成。

其實能在工作場域裡學習是很奢侈的事。就算你操作的是沒有時效性的事,日子一天一天的過也會覺得自己很像薪水小偷(哭)。

其實一開始碰到的資料,手動硬幹都可以完成,而且我對 R 語言還不熟,也無法估算如果要學習新方式的話需要多少時間(通常剛開始甚至比手動硬幹還要久)。

我的做法是先給自己一個期限。例如,這份資料我要今天內做完,我會告訴自己,中午之前,先用 R 語言試試看,如果中午過後進度並不理想,下午就趕快換成原本的方式完成它。並把這次解決的、沒有解決的問題記錄下來。

筆記非常重要,就算成功完成但你不知道所以然(程式語言對我這個麻瓜來說很神奇,常常可以用複製貼上大法解決 XD)還是要記錄下來,某天你可能就突然看懂了。

我學習的方式也是需求導向,雖然常常會越級打怪,而且完全不知道自己是怎麼成功的⋯⋯。但比抱著一本書從頭開始念,還是容易得多,對我來說啦(我本人就是嘗試線上課程或書從頭開始然後失敗的案例)。

然後就是設定目標,例如這次沒有時間讓我解決完這題,那下次碰到同樣問題的時候一定要用 R 解決。或是覺得快破關了,那就自己用下班時間或是假日嘗試寫寫看。一旦破關了,就很像武器從木棒升級為機關槍,之後遇到同樣的問題就可以使用新的工具,一年多的學習累積下來,非常有成就感。

這篇文章裡也提到,當新聞機構第一次聘用資料記者的時候,會遇到什麼挑戰、又應該如何因應。

以我的經驗來看,文化和缺乏相關知識是最大的挑戰。你聘用的人即使知道你在做的事、他要如何為你的團隊加值,但是如果團隊裡面沒有任何人在做類似的事,你就得從頭開始。可以規劃資料相關的活動來讓大家進入狀況,更重要的是協作,隨時隨地、每個人都要跟彼此合作。

當我剛開始在荷蘭公共廣播公司工作的時候,大家討論了很多對於聘用資料記者的期待(也就是我)。作為團隊的一份子,在跟編輯、製作人、同事們的溝通過程,創建開放的溝通管道幫助我快速融入。請記得,你的同事們可能不會完全理解你到底做了什麼,但只要知道抽象的輪廓就夠了。例如,當我們在討論一個題目,大家都得知道它是什麼,但不用每個人都要知道怎麼樣把它做出來。

以我們團隊的經驗來說,在團隊養成的過程裡,我覺得讀書會扮演了重要角色。我們當時定期(現在是不定期)會一起看國外資料新聞的作品,每個人就自己專業看到的細節都不一樣,更重要的是,這些作品能夠幫助不同專業的人暸解彼此能做到什麼事。

例如,我可能不懂工程師的專業術語,可是當我想做到某種效果時,就可以以那個作品為例,這些作品就成為初期我們彼此溝通的共同語言。也透過討論這些作品的優缺點來理解什麼是好的、符合使用者特性的視覺化跟互動,記者就不會只埋頭在自己的小世界裡許一些旁人認為不切實際的願望。

我自己覺得依照現在台灣的狀況,資料記者的工作內容依照媒體不同差得蠻多的。這種方式並沒有不好,反而可能是資料新聞還不那麼普及(我說台灣)的現在最好的解方。只是,對於未來有志於此的人,會比較不知道要從何學起、或是有一身技能無處施展。

(因為網路上的各種教學文讓我受益匪淺,但發現應用在新聞的資料探索還有一些細節是自己實作了才知道,雖然不知道大家想不想知道,還是決定留下紀錄。希望可以持續書寫,不要偷懶~)

--

--

zoelee
READr
Editor for

READr 記者兼數位專題製作人。曾任週刊記者,沒有特定新聞路線的雜食系,2017 年進到一個工程師超過半數的團隊以後開始慢慢長理科腦,希望能為還願意看新聞的人提供好新聞。