做數據模型前要先了解依家有咩投注種類
做數據模型前要先了解依家有咩投注種類,從而決定用咩做模型中嘅Y variable。
例如,你想做一個預測隻馬會唔會跑到第一,咁呢度講緊嘅就係獨贏,如果你想預測隻馬會唔會跑頭三,咁就係講緊位置。因為每個投注類別會有唔同嘅彩池同埋馬會嘅抽水百分比會唔同,所以要留意清楚自己想買啲咩,同埋落注前可以計吓預期回報(簡單啲去諗,就係勝出機率X賠率 — 落注成本)可唔可以達到你理想嘅回報。
我用馬會抽水嘅百分比簡單咁去分類,馬會抽17.5%嘅有獨贏(=揀中第1名)、位置(=揀中頭3名中的任何一隻馬)、連贏(=揀中第1名及第2名)、位置Q(=揀中頭3名中的任何兩隻馬)同孖寶(=係指定嘅兩場賽事中都揀中第1名)。
第二類就係抽19.5%,只有單T(=揀中晒第1名至第3名)同啱啱重推嘅二重彩(=順序揀中第1名同第2名)。
第三類,亦係抽得最多嘅係25%,當中包括三重彩(=順序揀中第1名至第3名)、四連環(=揀中晒第1名至第4名)、四重彩(=順序揀中第1名至第4名)、孖T(=係指定嘅兩場賽事中都揀中晒第1名至第3名)、三T(=係指定嘅三場賽事中都揀中晒第1名至第3名)、三寶(=係指定嘅三場賽事中都揀中第1名)同六環彩(=指定之六場賽事中都揀中第1名/第2名)。
另外,三T/四重彩同四連環仲要另外扣除7.5%/0.5%作為多寶儲備。除咗頭先講嘅彩池制嘅投注項目外,馬會都有提供固定賠率嘅投注種類,果樣就係騎師王。
如果考慮埋過關、膽拖同埋互串,就會更複雜,要計算好多conditional probability。建議從獨贏開始做,做個簡單嘅binary classification去試下水溫。
上述內容參考香港賽馬會官網內容(https://is.hkjc.com/AOSBS/help/ch/HR_Guide.html)