某些騎師會比較難以人工智能預測嗎？

之前寫了一篇網誌，關於某一個賽馬日以人工智能預測賽果的表現比預期好，後來有網友提出了一個我們從未研究過的範疇。他說那一日比較容易預測，是因為潘頓因病而全日沒有上陣，詳情可以看以下網誌：

沙田泥地夜馬賽都預測得咁準，關潘頓事？

出於好奇心的關係，我們決定以科學角度去研究不同騎師與人工智能預測能力之間又有沒有關係，研究方向並不是針對某騎師的表現，而是針對我們訓練的人工智能模型表現。我們之前也試過對不同馬場和班次做類似研究，你可以參考以下文章：

馬場及賽事班次會影響人工智能預測表現嗎?

評估指標 – ROC 曲線及曲線下的面積 AUC

ROC 曲線是以視覺化方式呈現模型分析力成效。而AUC代表在ROC曲線下的面積，能表示分類器預測能力的一項常用的統計值。ROC曲線越靠近左上方越好，因此，ROC曲線下的面積越大越好，代表模型的效益越高。當AUC = 0.5時，代表模型無預測價值，分析能力與隨機猜測沒有分別。當AUC 越大時，代表模型越有預測能力。

實驗結果

我們以2023年馬季或之前資料訓練完成的模型去預測2024年馬季由9月8日至12月11日之賽事結果，得出以下ROC曲線，AUC 為 0.706：

跟著我們以不同騎師的預測結果去分別計算 AUC ，原來真的有著明顯分別，所有結果於以下資料表列出(以AUC由高至低排序)：

Jockey	騎師	AUC
B Thompson	湯普新	0.828
E C W Wong	黃智弘	0.828
L Hewitson	希威森	0.764
M L Yeung	楊明綸	0.758
K De Melo	董明朗	0.75
K C Leung	梁家俊	0.746
L Ferraris	霍宏聲	0.742
A Hamelin	賀銘年	0.721
A Atzeni	艾兆禮	0.709
M Chadwick	蔡明紹	0.703
C Y Ho	何澤堯	0.703
K Teetan	田泰安	0.658
M F Poon	潘明輝	0.654
J McDonald	麥道朗	0.652
B Avdulla	艾道拿	0.652
C L Chau	周俊樂	0.65
P N Wong	黃寶妮	0.65
H Bowman	布文	0.641
A Badel	巴度	0.624
H Bentley	班德禮	0.615
Z Purton	潘頓	0.613
A Pouchin	貝知仁	0.6
Y L Chung	鍾易禮	0.567

以圖表顯示：

數據顯示某些騎師策騎馬匹的AUC超過 0.8，亦有一些騎師的AUC低於 0.6，表示我們訓練的人工智能模型，可以有效預測某些騎師策騎馬匹的表現，但對某些騎師策騎馬匹定的預測能力就會比較弱。而潘頓的排名也真是排在較後位置，表示我們的人工智能模型預測潘頓座騎的能力也真是較弱的，與我們網友的觀察接近。

結論

從實驗結果顯示，騎師與人工智能預測能力是真的有相關性的，對某些騎師的座騎我們真的可以比較準確預測。但我們要再重申一次，我們的實驗是以我們模型的預測能力出發，而不是針對騎師的表現，AUC低可以是模型高估或低估馬匹實力。而且這些數據亦未排除其他因素之影響，例如馬匹本身能力、出賽次數、歷史數據量等等，要了解真正原因需要進一步研究。最重要是掌握這些數據之後，我們可以再優化人工智能模型，又或者以數據調整博彩策略，如果你都有一些見解都歡迎與我們分享。