講到賽馬模型,唔可以唔提Multinomial Logistic Regression ,簡稱MLR。
點解Multinomial Logistic Regression係賽馬模型中咁出名?就係因為Bill Benter用佢係香港賽馬贏左十億。
MLR係其中一種傳統統計學常見嘅模型,佢同一般Logistic Regression(LR)唔同嘅地方在於,LR當中嘅Y係binary,即係預測結果係1或0,例如獨贏,1係代表第一名,0係跑唔到第一;又或者你玩位置,當跑頭三係1,而跑第四或之後係0,都係binary,而MLR當中嘅Y就係multiclass,即係多過兩種結果,唔再係1同0,而係可以直接預測由第一到最後一名嘅結果。
MLR模型最厲害嘅地方係佢嘅output係一個probability matrix,假如一場馬有10隻馬跑,即係有第一到第十名,咁你就會有一個10X10嘅matrix,分別係每一隻馬跑第一到第十名嘅概率。有呢個matrix之後就可以配合唔同嘅betting strategy (e.g. Kelly Criterion) 去落注,從而maximize回報。舉個簡單嘅例子,如果有一隻馬,5號仔,跑第一嘅概率係70%,而獨贏賠率係3.3倍,根據Kelly Criterion,你投注落呢隻馬嘅比例就會係(0.7 x 3.3–1)/2.3=57%,咁樣你就可以optimize你嘅expected wealth *。
*詳情可參考https://en.wikipedia.org/wiki/Kelly_criterion