當精算遇上資料科學-遇見最古老的資料科學家

Chava Chou
Taiwanese in Data Science
7 min readDec 29, 2018
Henry 在畢業後成為了一名精算師,結合現代演算法和傳統精算技巧,協助做出新決策。 (photo credit: Henry)

訪談、撰文/ Sherry、Sioujia

編輯/ Chava

你知道甚麼是「精算師」嗎? 精算師的工作和資料科學又有甚麼關聯性呢? WiDS Taipei 本次邀請到的訪談對象 Henry,目前在工作中同時身兼精算師及資料科學家兩種角色。我們很榮幸請到 Henry 來和大家分享精算師這個神祕職業的工作內容,並談談資料科學在精算領域中所發揮的作用。

個人背景:財金+電機+統計,多元背景奠定職涯基礎

大學時 Henry 同時雙主修電機系+財金系,並在擔任系上「機率與統計」課程的助教時,產生對統計的熱情。在大五因為雙主修延畢時,Henry 開始申請國外的統計碩士,因為他認為統計是成為一個好的資料科學家必備的能力。

「我覺得如果要成為一個資料科學家,程式的部分是一定要的。但要怎麼成為一個好的資料科學家,那統計就會更重要。統計可能沒有那麼立即見效,可是在長久來講,是一個很有利的東西。因為到時候看各種演算法、做各種分析,背後的依據都是統計的模型。你就算這些數學沒有直接用到,對那些分析跟檢定靈敏度就是比較高 。」

對數學+溝通的熱愛成為踏上精算師生涯的契機

廣泛涉獵理工與商學的知識後,Henry 對精算領域逐漸產生興趣:「我覺得精算好像很適合我是因為我很喜歡數學。精算有趣的點除了數學我很喜歡之外,它相較於傳統工程師,更需要有商業分析能力,也比較需要溝通。因為畢竟是在金融業,所以有帶一點金融業的特質就是強調溝通,這是我喜歡的」。對談中,我們也充分感受到 Henry 邏輯犀利,同時也喜歡和人分享的特質。

最後促使 Henry 踏入精算領域的關鍵因素,是出於一顆想對社會有所回饋的心。研讀碩士的同時 Henry 也展開求職之路,涉獵面相包含精算、財務工程、避險基金、資料科學家等各行各業偏量化領域的職位。面試這麼多,為什麼最後會選擇精算呢? 他表示:「除了專業領域的東西我喜歡外,我覺得這是真的可以為社會貢獻的行業。有些領域雖然也需要數理很強的人才,但我覺得那些好像比較像幫有錢人錢滾錢,這不是我想要做的。我想要做對社會更有意義的事情,所以才選擇了精算。」

精算師是量化風險專家,也是最古老的資料科學家

實際踏入精算領域後,Henry 認為這是一個需要面對大量資料並且講求精準的行業。他首先和我們科普了一下精算師的工作內容

「精算師的人數很少,不像大眾較了解的會計師、律師等職業。用一句話來形容精算師,就是在量化風險。以保險公司來講,一個保單要賣出去的時候,需要考慮保戶的死亡率、市場利率等面向,我們想辦法去預估,然後用數學公式做一個最合理的假設,讓公司有合理的利潤的同時,也讓保戶付了合理的保費,就能享受一定的保障。這就是精算師基本的工作內容」

除了對於數學能力的高度要求外,Henry 也和我們提到另一個使精算師人數很少的原因,是因為精算師是個考試導向的一個職業。「一個精算師從業人員平均可能需要 6 到 10 年才能取得正精算師執照。它像醫師的考試一樣,分成二個階段。我們會先考到副精算師,再考到正精算師。考試內容從最簡單的財務、壽險、統計推論等,近年來增加和商業分析的相關內容。副精算師考試把一些基本知識全部測驗完,到正精算師時可能會特別選一個專精的領域,像是投資或是產險等。」台灣現在取得美國精算學會認證的正精算師(FSA),只有 100 多人,可說是鳳毛麟角般的存在。要在繁雜的工作中,連續好幾年騰出時間讀書跟考試奮戰,是想成為精算師一大的挑戰。

精算領域的歷史可追溯到 200 多年前,而 Henry 認為精算師是最傳統的資料科學家,「因為我們就是用一大堆數據,然後做分析、做統計推論得出來的結果。那麼跟現在的資料科學家的差別在哪裡呢? 不同之處是我們用的是最傳統的統計方法、講求嚴謹;而資料科學學家用的方法可能更新穎,並且要非常迅速的做出一個推論,這可能就是比較大的差別。」

Henry 平常除了工作之外, 也是一位業餘的調酒師。 (photo credit: Henry)

當現代演算法碰上傳統精算領域:機器學習作為新的決策參考依據

大數據興起後,對精算這個傳統但同時屬於量化的領域不免也產生許多影響,其中一個是數據處理層面。

「以前精算師處理的數據量沒有那麼大,可能一台個人型電腦就可以處理完。那現在因為保單種類繁多,加上會計法規 IFRS17 上路後運算量劇增,這時會採用平行式運算、或是串聯多個伺服器等更先進的方法去運算,這是蠻大的差異。」

Henry 也和我們分享了他除了精算師的另一個職責:壽險部門的資料科學家。「我們的定位比較像是公司的顧問,其他部門像是理賠部、客群經營部等,有資料分析相關的問題就會來請問我們。」Henry 提到,藉由機器學習,可以幫助發現傳統統計中可能被忽略的面向。他和我們分享了一個案例:「之前幫理賠部做過一個蠻有趣的保戶風險相關預測。我們拿到保戶的性別、年齡、體重、病史等資料後,可以大致預測這個保戶的風險等級。傳統統計方法可能只能從幾個變數來做一個簡單的迴歸分析,現在機器學習出來後我們可以用更多、更複雜的特徵來判斷這個保戶的風險,這是我覺得一個蠻有趣的點,可以做到以前做不到的事情。」

我們詢問 Henry,是否擔心機器學習的發展,會取代精算師的工作? 他認為機器學習提供精算師在決策時一些新的參考面相,比如說在衡量時保費,第一會從機器學習的模型當作一個參考、第二就是傳統的統計推論方式、第三個就是人工依照經驗評估,用這三個方法來交叉驗證。

但這個新的參考面向,並不會取代精算師的工作。「主要原因是機器學習側重的重點並非因果關係。 比如說我們看到一個金融事件,一定會想知道是哪一個變數造成它發生,還有變數之間的因果關係。這是傳統統計推論在做的事,也是傳統的金融、精算常用的方法。但現在機器學習是用更先進的演算法,他只要看這個變數是怎麼互相影響,知道有這個關係就好,中間的過程是怎麼運作可能就不太在乎。」

然而這種因果關係的推論,恰好是在金融業中不可或缺的。「機器學習在金融上這樣做會有一個難點,舉例來說:如果我告訴一個保戶:『某某先生你的保費算出來是這個金額,為什麼是這樣呢? 是因為我們透過機器學習跑出來結果就是這個金額』,那保戶一定會不接受。監管單位看到說保費訂定完全就是用模型跑出來的,也不會接受。機器學習適合用在商業分析這種比較追求效率導向,需要看相關性,但不太需要那麼注重因果關係的場合,但是在精算這種必須給出一個很明確的因果性,傳統統計還可能還是一個更好的方法。」

機器學習能幫助人們快速找出方向,但中間的脈絡,還是必須仰賴精算師,憑藉專業及經驗,才能準確勾勒出因果。

給想從事相關領域的人的一些建議

聽完 Henry 對精算及資料科學的見解後,不難發現他認真又喜歡學習的個性。因此我們請他以過來人的觀點,給之後有志踏入精算或資料科學領域的學弟妹們一點建議。「資料科學領域進展的非常快,現在火紅的演算法一年後可能就不再被使用了,又有新的演算法冒出來。另外一個原因,也是因為他是一個新領域,很多方法和工具都還很零碎,要能做出東西你必須要大量又快速的自學,整合這些知識。自學能力是我覺得要成為一個資料科學家不可或缺的。」

那麼如果想成為精算師呢? 「精算是個相對比較久遠的行業,但這一行需要的是毅力。因為雖然不是每個人都一定要考到正精算師,但如果你想要一直在這條路走下去,認證是不可或缺的。你必須有五六年都在跟考試以及各種數學奮戰的毅力。我覺得毅力跟專注是走精算領域比較需要的人格特質。」無論在任何領域,想要取得一片天地,學習新知的熱情、加上持續的堅持,是通往一切的道路。

--

--