最近經常同網友交流應用人工智能 (AI) 去預測賽馬結果,當中應該有不少賽馬專家,其中一樣經常討論到的問題就是馬匹走位、步速方面問題。其實這方面我們都有花過功夫去做過一些研究,見不少人都有興趣,我們又試下分享我們的見解及研究資料。

背景資料及其他相關研究

根據前人研究,在賽馬中馬匹的走位預測扮演著關鍵角色,因為它影響著馬匹的整體表現和賽事結果。精確的走位預測能夠調整策略,從而提高勝算。馬匹的走位決定了它們在比賽中的步速。

此外,馬匹的走位也會影響到競爭心態的變化。在競爭激烈的賽道上,良好的起步和定位可以讓馬匹在心理上保持優勢,增強其進攻和防守的潛力。反之,若馬匹被迫留後,可能會面臨心理壓力,影響其後續的表現,尤其是在關鍵的競爭段落。

疲勞度是另一個不可忽視的因素。馬匹的行進姿勢和走位會影響其能量消耗,進而影響耐力的保留。在某些案例研究中,當馬匹選擇放頭馬或留後衝次的策略時,走位的選擇直接導致了賽事結果的顯著變化。這也正是為什麼在運用機器學習來預測賽馬結果時,馬匹走位的因素不可或缺的原因之一。

實際困難

理論歸理論,但實際應用又如果呢?馬匹走位同其他大部份因素有一樣非常明顯不同之處,就是開賽前沒有人能確定各競賽馬匹實際走位。而且馬匹走位又受很多不確定因素影響,例如不同策騎指示、檔位、馬匹狀態反應、其他馬匹走位等等,本身都並不穩定。如果預測模型要加入這項因素進行預測,模型首先就要利用一系列數據去預測及模擬那場賽事馬匹走位,這階段預測本身就已經不容易,再用一堆不是十分準確的結果做輸入去預測最後賽事結果的成效更加成疑。

實驗結果

雖然不容易,但我們本著好奇及研究心態,都用了不少精力去做這方面研究。嘗試做個每場賽馬預計走位模型,得出之結果再入加賽馬結果預測模型分析。而暫時研究結果其實是預計之內,就是加入這些因素並不能提升模型的準確度。如果不加入預計走位因素去訓練模型,計算出模型的曲線下的面積 (AUC) 為 0.706:

加入預計走位因素去訓練模型後,計算出模型的曲線下的面積 AUC 為 0.704,即是預測能力不升反跌:

當然它們的分別並不明顯,於資料科學上實際並不能看出實際應用時會有分別。不過如果要加入預計走位因素去做預測,整個模型就會更加複雜,而訓練模型及預測需要用的時間和系統資源都會增加,所以我們暫時仍然未能確定加入此因素是一個好的方案。或者留待我們再有時間去檢討一下我們的預計走位模型再行研究。

預計走位可以作額外選馬參考

雖然前文實驗提到將預計走位因素加入訓練模型及預測結果並未對準確度有明顯幫助,但有網友都提出參考預計走位資料其實可以幫助他們選馬,或找出比較大機會爆冷場合,所以偶然都會有網友叫我們分享這方面資料。以下係我們為網友提供的預計走位圖表例子,配合顏色及大小圖案,可以更容易留意到比較大競爭力馬匹預計走位,或者可以預算會不會出現不正常步速等等,所以我們的功夫也不是完全白費的。