陳倩瑜:資料科學是跨領域研究的溝通媒介

譚竹雯 Stephanie Tan
Taiwanese in Data Science
3 min readJun 3, 2018

採訪編輯 / 譚竹雯

目前擔任國立台灣大學生物產業機電工程學系 (Bio-Industrial Mechatronics Engineering) 教授的陳倩瑜,求學期間取得台灣大學資訊工程學博士、史丹佛大學電機工程學碩士、台灣大學電機工程學學士學位。

原本學電機的陳倩瑜回憶,畢業後他先在硬體IC設計廠服務。他觀察硬體一定要在硬體廠工作,無法自行產品化,且看到未來社會對軟體工程師有大量需求,想著如果能多學軟體知識,未來的工作將有更大的彈性與自由度。於是,後來就讀台大資工博士班,結合軟體與資料分析,陳倩瑜踏上資料科學的道路。

資料科學角色的差異:工具開發與科學家

「我認為我比較像是資料工程師 (data engineer)。我們把工具準備好,某些情況下,甚至會連帶分析好資料,得出結果。但要問什麼問題,是由科學家來決定的,」陳倩瑜說。

曾有一段時間,他認為自己的角色好像資料科學家,但後來發現資料分析工程師與資料科學家是截然不同的角色。

以昆蟲受農藥影響為例,有些昆蟲攝入農藥會死,但另一些不會。於是,科學家有研究的動機,想了解不同昆蟲DNA的差異。而在回答問題的過程中,資料工程師會設計工具,來分析昆蟲DNA的資料,

相比科學家,陳倩瑜更喜歡工具開發者的角色。藉由專長,讓資料分析的過程更順暢,做得又快又準。他說,藉由開發分析工具,讓研究結果準確度提升,進而使得科學家的問題得到解答,兩者間是互相幫助的過程。

研究困難未必能克服,資料科學成為跨領域研究的溝通媒介

陳倩瑜目前手中有罕見疾病相關的研究專案。研究樣本來自罕見疾病的病人全基因體資料,目標是協助罕見疾病患者了解病因與病情,以及透過研究發現,提供藥物開發方向,讓病人接受更好的治療。

在執行專案時,首先要找到引發罕見疾病的原因,例如:是否因DNA缺損而造成?儘管有許多病友被診斷出同樣疾病,但DNA缺損的地方或方式是不同的,增加研究的難度。

陳倩瑜笑著分享,在研究過程經常會遇到許多困難。尤其研究提出的問題並非很容易回答,每項專案的執行時間都十分耗時。

「若成就感建立在研究成果出現才算,那就太難了。」對陳倩瑜來說,成就感是更多時候來自於研究人員間直接的回饋。

以罕見疾病研究專案為例,陳倩瑜的研究團隊需與醫師、病人、資料分析人員、資料搜集人員等合作。在多方參與下,陳倩瑜發現資料科學的人在當中相對中立, 「資料科學幫助研究過程加速,原本也不求研究最後結果,所以就沒有最後結果屬於誰的問題。」

「我鼓勵做資料科學的人要扮演媒合角色,因為我們立場相對中立,提供的是分析專業,跨領域研究可以讓大家得到更多利益,而不是誰原先有的東西會被拿走。」陳倩瑜說。

給自己一個機會去感受眼前的路,找出自己想要的

資料科學經常牽涉跨領域團隊合作,具備善於溝通的特質,是協助勝任資料科學工作的特質之一。

面對龐大的資料量,資料分析人員需要具備細心的特質,「如果只是跑分析方法,而沒有詳細觀察資料,結果出錯時都不知道。」陳倩瑜提醒。

不單是針對資料科學,各領域都有合適及需要的特質。「不要害怕,給自己一個機會去感受眼前的路是不是你想要的」,跨出第一步才能去感受,陳倩瑜說。

--

--

譚竹雯 Stephanie Tan
Taiwanese in Data Science

藉由文字的持續書寫,記錄所看所思,並期許能夠推動一點社會的改變,過無悔的人生。