之前寫了一篇網誌,關於某一個賽馬日以人工智能預測賽果的表現比預期好,後來有網友提出了一個我們從未研究過的範疇。他說那一日比較容易預測,是因為潘頓因病而全日沒有上陣,詳情可以看以下網誌:
出於好奇心的關係,我們決定以科學角度去研究不同騎師與人工智能預測能力之間又有沒有關係,研究方向並不是針對某騎師的表現,而是針對我們訓練的人工智能模型表現。我們之前也試過對不同馬場和班次做類似研究,你可以參考以下文章:
評估指標 – ROC 曲線及曲線下的面積 AUC
ROC 曲線是以視覺化方式呈現模型分析力成效。 而AUC代表在ROC曲線下的面積,能表示分類器預測能力的一項常用的統計值。ROC曲線越靠近左上方越好,因此,ROC曲線下的面積越大越好,代表模型的效益越高。當AUC = 0.5時,代表模型無預測價值,分析能力與隨機猜測沒有分別。當AUC 越大時,代表模型越有預測能力。

實驗結果
我們以2023年馬季或之前資料訓練完成的模型去預測2024年馬季由9月8日至12月11日之賽事結果,得出以下ROC曲線,AUC 為 0.706:

跟著我們以不同騎師的預測結果去分別計算 AUC ,原來真的有著明顯分別,所有結果於以下資料表列出(以AUC由高至低排序):
Jockey | 騎師 | AUC |
B Thompson | 湯普新 | 0.828 |
E C W Wong | 黃智弘 | 0.828 |
L Hewitson | 希威森 | 0.764 |
M L Yeung | 楊明綸 | 0.758 |
K De Melo | 董明朗 | 0.75 |
K C Leung | 梁家俊 | 0.746 |
L Ferraris | 霍宏聲 | 0.742 |
A Hamelin | 賀銘年 | 0.721 |
A Atzeni | 艾兆禮 | 0.709 |
M Chadwick | 蔡明紹 | 0.703 |
C Y Ho | 何澤堯 | 0.703 |
K Teetan | 田泰安 | 0.658 |
M F Poon | 潘明輝 | 0.654 |
J McDonald | 麥道朗 | 0.652 |
B Avdulla | 艾道拿 | 0.652 |
C L Chau | 周俊樂 | 0.65 |
P N Wong | 黃寶妮 | 0.65 |
H Bowman | 布文 | 0.641 |
A Badel | 巴度 | 0.624 |
H Bentley | 班德禮 | 0.615 |
Z Purton | 潘頓 | 0.613 |
A Pouchin | 貝知仁 | 0.6 |
Y L Chung | 鍾易禮 | 0.567 |
以圖表顯示:

數據顯示某些騎師策騎馬匹的AUC超過 0.8,亦有一些騎師的AUC低於 0.6,表示我們訓練的人工智能模型,可以有效預測某些騎師策騎馬匹的表現,但對某些騎師策騎馬匹定的預測能力就會比較弱。而潘頓的排名也真是排在較後位置,表示我們的人工智能模型預測潘頓座騎的能力也真是較弱的,與我們網友的觀察接近。

結論
從實驗結果顯示,騎師與人工智能預測能力是真的有相關性的,對某些騎師的座騎我們真的可以比較準確預測。但我們要再重申一次,我們的實驗是以我們模型的預測能力出發,而不是針對騎師的表現,AUC低可以是模型高估或低估馬匹實力。而且這些數據亦未排除其他因素之影響,例如馬匹本身能力、出賽次數、歷史數據量等等,要了解真正原因需要進一步研究。最重要是掌握這些數據之後,我們可以再優化人工智能模型,又或者以數據調整博彩策略,如果你都有一些見解都歡迎與我們分享。