繼上一次研究騎師與人工智能預測能力之間的關係後,我們又有興趣研究是否真的有些騎師表現與大眾預計間落差會比較大?於是我們用大數據做了這個分析,但今次純粹是研究數據而沒有應用人工智能。

分析方法
以過去比賽結果數據,計算名次與獨羸賠率之間的相關係數 (Correlation Coefficient) 去評估大眾期望 (以獨羸賠率反映) 與賽事結果之間的相關性。相關係數是一種相關程度的測量,在統計學上的意義是兩個變量之間的關係。相關係數越大表示兩個因素之間相關性越高,以我們的分析為例,如果相關係數高表示越少爆冷或越少熱門失準情況。
分析結果
我們以所有現役騎師抽取過去10年之賽事資料去計算,得出以下結果:
Jockey | 騎師 | 名次與獨羸賠率之間的相關係數 |
K De Melo | 董明朗 | 0.445 |
H T Mo | 巫顯東 | 0.428 |
P N Wong | 黃寶妮 | 0.420 |
E C W Wong | 黃智弘 | 0.411 |
Y L Chung | 鍾易禮 | 0.396 |
H Bentley | 班德禮 | 0.396 |
C Y Ho | 何澤堯 | 0.392 |
M L Yeung | 楊明綸 | 0.386 |
C L Chau | 周俊樂 | 0.386 |
L Ferraris | 霍宏聲 | 0.375 |
M F Poon | 潘明輝 | 0.370 |
L Hewitson | 希威森 | 0.368 |
B Thompson | 湯普新 | 0.367 |
K H Chan | 陳嘉熙 | 0.367 |
B Avdulla | 艾道拿 | 0.353 |
A Hamelin | 賀銘年 | 0.350 |
A Atzeni | 艾兆禮 | 0.344 |
A Badel | 巴度 | 0.339 |
K C Leung | 梁家俊 | 0.334 |
M Chadwick | 蔡明紹 | 0.329 |
K Teetan | 田泰安 | 0.325 |
H Bowman | 布文 | 0.311 |
Z Purton | 潘頓 | 0.290 |
A Pouchin | 貝知仁 | 0.211 |
以圖表顯示:

數據顯示不同騎師策騎馬匹的名次與獨羸賠率之間相關係數真的會有分別,表示某一些騎師表現與大眾預計落差又真的會比較大。看來大家感覺到某些騎師比較難預計都可能是建基於不少實際經歷之上。
我們要重申一次,這研究純粹是分析各騎師坐騎之賠率與最終名次間關係而並非分析騎師表現,因為落差大小有很多不同因素,需要再作研究才可以找出原因。而今次這個分析結果,可以提供多一款有用數據作為設定博彩策略參考之用。