《Math behind Moneyball》 修課心得

Adam Wang
7 min readJun 4, 2020

--

想說在離開上一個工作之後,利用這段休息時間來充實一下自己,剛好在《Hito 大聯盟》的聽眾社團裡有人推薦 Coursera 這門課程,當時正好從美國回來,因為防疫在家自主健康管理,於是決定從 3 月底開始付費上課,連續 10 週的線上課程,到今天 6 月 4 日結束。想說記錄一下,可能對有興趣想嘗試的朋友們有些幫助。

對了,付費 USD 49 有電子證書(有一個永久連結可以保持效力),課程本身是免費的。付費是為了逼自己認真修完。

距離上次完成線上課程已經是 6 年以前,當時是修 edX 的賽伯計量學 101 (Sabermetrics 101: Introduction to Baseball Analytics),也是一門需要棒球知識和 SQL 基本語法的課程。記得那時候是在咖啡廳 3 天拼完 6 週的課程,還好大學有修過統計和工作上有用到一些 SQL,所以才能快速拼完課程。

(random thoughts:疫情前線上課程產業好像快掛了,直到大家被關在家又開始熱了起來)

《Math behind Moneyball》這門課是休士頓大學商學院開的,由 Wayne Winston 教授上課,課程難度被平台歸類在「適合初學者」(但我覺得並不適合)。課程是在 2015 年錄製的,這幾年沒有再更新過。

完全線上課程,隨時都可以開課。

全英文授課,但有英文字幕和逐字稿可以看,所以英文閱讀能力 ok,就不會有太大的問題。

課程建議完成時數是 47 小時,但我可能花了至少 80 小時。

這門課適合對於棒球、美式足球以及籃球有基本知識的人,裡面有一些術語和比賽規則需要事先了解,才有辦法解題(例如:棒球比賽二壘有人,打一支全壘打可以得兩分)。

課程內容

包含基礎的統計學,像是平均數、標準差、線性迴歸、常態分佈、機率、假設檢定等等,我在大學有修過統計學,雖然忘得差不多了,不過上課一聽還是可以進入狀況。但如果對於完全沒有修過統計學的人可能會有點吃力。

還有許多之前統計學沒學過的(或是學過就忘記的),像是 Kelly Growth、Poisson 分佈、蒙地卡羅模擬等等技巧,來解決職業運動的實務問題。

像是「假設一個打席只有二壘安打、全壘打、三振三種結果,發生機率分別為 20%、10%、70%,平均一局會得多少分?」,直覺可能會用期望值來算,但也可以用模擬(simulation)來解題。

或是簡單的賽局理論,像是美式足球跑陣或傳球的期望得分值。你知道進攻方的前進碼數期望值是多少嗎?

也有教著名的賽柏計量學畢氏定理原理、職業運動賭播是如何開盤讓分、棒球 WAR 值、棒球防守數據 UZR 和籃球 +/- 值等等,這些一般大學統計學不會教的應用層面。

授課方式

Winston 教授主要以 Excel 做為解題工具,我還因此買了一年 Mac 用的 Excel 才能配合課程考試。課堂中會使用很多 Excel 函數以及內建功能,像是用 Solver 和 Goal Seeker 來解題。這是我在上課之前沒有預期到的收穫,透過完成課堂考試練習 Excel 中一些進階的技巧。

我自己有程式背景,對於一些處理字串比對和邏輯條件判斷的情況,會反射性地想要用程式碼解決,但課程用的工具是 Excel,說實話讓我不太適應,解題時通常卡在如何使用工具,而不是解題的邏輯。不過慢慢地把 Excel 一些好用的功能學起來之後,也是滿有成就感的,而不是像之前只會拿來做加減乘除四則運算而已。

而課程完全是以 Excel 做為講解工具,沒有投影片,教授也沒有露臉(但他會咳嗽和喝水,所以確認是真實人類),偶爾會有一些網頁操作(例如 Basketball-Reference.com)。

這樣的講解方式我覺得很不友善,Winston 教授腦中的邏輯無法一目瞭然,必須反覆地回放影片才能抓住重要細節。往往看完第一次影片只能看到許多 Excel 操作,不容易抓到重點。

後來我發現,可以照著教授提供上課的 Excel 教材,邊看影片邊操作,學起來比較不會漏掉步驟和細節。

小考

總共有 40 題小考,每週每題都要答完才算修完課程;再加上最後的期末考,10 題答對 6 題就可以,全部都單選。

小考和期末考每 8 小時可以答 3 次,一直到課程結束。如果是單選題,基本上你一定用猜的也可以對(不鼓勵偷吃步),其餘的就是要正確答對才能過。

一直到課程第 9 週,我才發現原來每週的死線(due date)其實僅供參考用,並不是真的硬死線,只有課程本身最後有一個硬死線,在之前完成都可以。但我還是很乖地按照課程「預期」的進度,每週都把小考寫完,避免了在硬死線趕課的重蹈覆轍。

至於參考作業和延伸閱讀,想說在有限時間盡快完成課程,我就跳過,直接 mark as completed。

缺點

我另外修完過 Coursera 的三門課程:《Human-Computer Interaction》、《The Global Business of Sports》和《Sports and Society》,每堂課都有作業或是小考,其中《Human-Computer Interaction》還是需要同儕互評的,非常有趣,可以看到來自不同國家、不同文化的同學思考方式。這三門課程的討論區都能看到老師與同學互動,討論問題,能從討論區學到一些東西。

而《Math behind Moneyball》的小考大多要解決的是統計的計算問題,一旦遇到資料處理有誤、答案格式不清(例如是百分比還是以小數點為格式)或是 Excel 使用卡關時,真的會答不出來。而且答錯時也沒有提示,只告訴你答錯了。

偏偏課程的討論區非常不活絡,教授完全放生,也沒有助教,為數不多的求救放了好幾年也沒有人回應,討論區宛如一座死城,更別說其他交流了。

卡關的時候真的只能不停地試誤,挫折感很大。

我在《Hito 大聯盟》討論區有找到幾位同好一起修課,不過最後只有一位同學一起修,好在有他可以在卡關的時候詢問一下,不然可能一題答不出來就放棄擺爛了(因為必須 40 題都得答對才能修畢)。

差不多就這樣了,修完 10 週的課程讓我超廢的無業人生留下點紀錄,還算是逼自己學了一些東西。雖然進入初老階段,學過的東西可能很快就還給老師,但至少知道有哪些方法可以用,再回來看影片還是可以省下無頭蒼蠅摸索的時間。

簡單來說,對於運動數據分析有興趣的,這大概是你在網路上能找到最好的課程了,只要你願意投資時間,一定會有收穫的,而且開始會對網路上半調子數據分析有不同看法。

有任何問題歡迎留言,我會回覆或是補充在文章中。

--

--

Adam Wang

I once visited all 30 Major League ballparks in one trip.