[課程評價]108–2 石百達 金融科技-文字探勘與機器學習

一門能夠同時增進實務經驗與程式能力的課,大推!

林聖硯 Sheng-yen Lin
Martin’s Blog
6 min readSep 2, 2020

--

加簽方式

這門課由財金系石百達教授、資工系張智星教授、政大風管系彭金隆教授與東吳巨資系蔡芸琤教授(同時也是財金系助理教授)共授,故加簽順位(應該)是財金所及電資學院學生優先(我初選就選上所以不是很清楚)。第一周教授有稍微調查過修課學生的分布狀況,大約兩成為電資學院的學生、五成為管院碩班的學生,剩下則散落在各學系。
另外,這門課其實在政大、台科大與東吳都有開設,是多校的聯合課程,故期末專題成果發表會時也會看到來自不同學校的學生上台聯合發表。

課程內容

本課程由兩位教授共授,故課程也分為前後兩半學期,預計的syllabus如下:

張智星教授
人工智慧與機器學習簡介
機器學習1 — 分類法與分群法
機器學習2 — 模型的效能評估
機器學習3 — 特徵的選取與萃取

石百達教授
風險觀念與R
金融市場與VIX
選擇權隱含資訊
文字探勘於財金之應用

因為疫情的緣故,張教授有時直播他之前錄好的影片或直接用投影片開始上課,而石教授則是放上錄好的影片讓學生觀看。整體來說,前半學期對整個專案進行較為有幫助(這門課很大的重點是在期末專案發表)而且教授上課也非常有條理,內容涵蓋了機器學習的原理(gradient descent)、特徵工程、評估方法、分類器、DNN甚至提到一些NLP的議題(斷詞、文件分類);而後半學期石教授的部分編排較無連貫性也對專案沒有什麼太大的幫助,還講到許多technical的東西,如Spanning Formula、Static Hedge(他與張森林教授共同發表的論文,我在另一門課也重新聽了一遍)等。對沒有財務背景知識(尤其是期貨與選擇權)的非財金系所學生來說不太友善,且石教授也並沒有將這些東西講的深入淺出,常常聽完還是難以理解,我認為這部分的課程還能再重新安排並設計的與專案更有相關性。

涼度

非常吃專案題目、個人及組員的程式程度。

開學第二週時,教授們會邀請六家公司發表各自的題目讓學生們選擇,包含中國信託、野村證券、國泰人壽、國泰產險、南山人壽、玉山證券。專題內容包山包海又橫跨金融各個不同的領域,雖然只能選擇一個專題實作,但每個專題感覺都蠻有趣的(有人臉辨識、市場情緒指標等等),有一些我甚至沒想過能夠用程式來解決。能聽到這些公司用程式來解決金融問題的想法和一些模型的雛形也是這門課讓我收穫蠻大的一點。

最後,我順利了選到了我的第一志願。我們那組與玉山證券合作,題目為「智能新聞評分系統」(與NLP有關),組員來自工管、生傳及電機系。組內那位電機博的同學其實包辦了大部分的程式,剩下的人則是幫忙處理資料前處理及EDA的部分。

時間花費上,為了跟上大家的討論,我將李弘毅老師大約八成的機器學習影片瀏覽過,也跟同學借帳號看了幾部國企系「大數據行銷」的影片,所以其實我大部分的時間都花在了解整個自然語言處理的背景知識。加上每個禮拜幾乎專案都要有進度產出,也要花時間跟上原本的課程進度,還要跟mentor和指導教授開會討論期末報告。整學期下來這門課大概佔了我一半的時間。即使是這樣,我這組專案的難度算是幾個專案內較為簡單的了。聽說人臉辨識的那組幾乎每天都跟指導老師討論,還常常動不動就coding到凌晨兩三點,花了大把的時間在這門課上。(當然最後結果非常精彩,設計出許多原創的特徵也成功解決了專案的問題)

幸好期末考的部分還算簡單好準備,只是要背誦及理解的概念很多、範圍又很大很雜,但幸好題目都出的不深,是一個有背就有分的概念。

專題題目

甜度

本課程的成績評量如下:

期末考 50%
期末專題 — 團隊成績 20%
期末專題 — 個人成績 30%

團隊成績由指導老師評量,而個人成績則由公司的Mentor負責。如果整組都有認真參與的話分數應該不會太差,加上期末專題發表會如果帶同學一起聆聽,學期成績還能加三分。整體來說算是扎實偏甜。

總結

如果你是一個想要讓業界看到你的人,很推薦你來修這門課。期末成果發表會時會找每個專題第一名的組別上台,當天有一堆鎂光燈和記者在拍攝,你可能還沒踏出職場就已經開始發光發熱。如果你是一個很閒但又想要豐富履歷的人,更推薦你來修,這門課絕對可以在履歷添上一筆。

剛開學時我其實很猶豫要不要退選這門課,我總共修了29學分,這門課的loading看起來又非常重(實際上也是如此),但我很慶幸自己有堅持到最後沒有退選。原因一來是這門課能讓程式進步神速。專案進行的過程中,我慢慢打起我幾乎是從零開始的機器學習的基礎。二來,跨領域合作的經驗。我們組員來自不同系,從一開始磨合和溝通有點困難,到最後組員們互相砥礪完成專案並順利發揮自己最擅長的地方,這中間的過程是一件令人感到很有成就感的事。更別說未來職場上絕對需要跨領域合作,先有一個相關經驗絕對能讓你在之後不論進行什麼專案都能更順利。最後則是我從這門課獲得了一個實習機會。八月時我到了玉山證券資訊處實習,帶我的主管就是指導我們專案的mentor,從他身上我學到爆炸多的東西。有機會我也會在medium上面發表一個月實習的心得。

最後的最後,我要謝謝經濟系T同學借我Datacamp帳號,讓我在一月寒假能夠複習python。這六個月來,我從一個連numpy都不知道的是什麼東西的程式新手到現在接觸到NLP這個領域、打了一個NLP相關的比賽、甚至還能在台積電面試時拿出東西來應付問題,都要感謝他,他真的是我的貴人。另外,也謝謝會計系兩位L同學借我Ceiba帳號看大數據行銷的影片。

P.S.1 這門課108學年時上下學期都有開,但不知道為什麼109–1沒有,希望109–2能夠再開。(有人這門課修了兩次)

P.S.2 如果沒有程式背景的人要修這門課應該沒有問題,期初張教授有調查過,大約有四五個人完全不會寫程式。

期末發表會盛況

--

--