データ遊び

たまにTargetで競馬データをいじって遊ぶんですが、表示のデータわかりますか?
京都ダ1800m/阪神芝2000m/小倉ダ1700m/中京芝1200m/中山ダ1200m&1800m・芝1200m&1600m/東京芝1400m&1600m&1800m
このコースの共通点です。

答えは3連単で100万円以上の配当が3回以上出たことのあるコースです。誰でも10分ほどあれば過去の全てのレースデータからこんなのが取り出せちゃうんだから、競馬のデータというのは整備されていますよねぇ。でも、それが競馬の予想の弊害にもなっているんですよね。
こういうデータを見ると、こういうコースのレースでは大穴が出るので穴狙いならば是非このコースを狙うべきだ、という分析をする人が世の中大勢いますが、間違ってます。自称データ分析派予想の方がやる典型的な間違いです。このデータはこう読むのが正しいと思うんです。

「なーんだ、たいして(コース別の成績に)差が無いのね」

そうなんです、統計とかをちょっと(正しく)かじった人ならわかるんですが、競馬のデータってほとんど上の言葉に集約されるんですよ。勝つ馬を探すあまり、有意に無い差すら「差があるもの」と思いこんで(無理矢理こじつけて)無意味な差を大きな差と考える。データで差が出なきゃ勝ち馬がわからないんですから、ある意味しょうが無いけど、実際その考えは間違っている。データを細かく分析すればするほど、その分析の無意味さ(有意差の無さ)を理解する、それが競馬です。何かしらデータ分析で勝ち馬の答えが出たとかいう人はこの方法でことごとく論破できます。
逆に馬券で儲けるという事においてほぼ未開の地と思われるのが「馬券の買い方」です。これをまともに論じている人が本当に少ない。某お笑い競馬ライターの方もおっしゃる通り「競馬で馬券を買うことの工夫の半分は、馬券の買い方」なんですよ。予想が上手な人なのに馬券の買い方の下手な人が結構多いんですよね。様々な予想を駆使するのに馬券の買い方は馬連のみとか。逆で言えば予想が当たらない人程、当たった時のリターンを多くするためにも馬券の買い方を工夫しないといけないんです。
実は、別名でこことは全く関係なく「馬券の買い方研究」サイトをブログ形式で半年ほどやってきたのですが、そろそろ別の場所に移動してまとめてみようかな、と思う今日この頃です。徒然なるままに書いてきたものを一度きちんとまとめたいですし。ただ、結構恨まれそうですね。なんせ「当たると言って金を取ってるような予想方法の嘘を徹底的に暴露する(=当たらないと証明する)」内容ばかりなので(笑)

コメント(2)

とよ

有意差検定したら一発ですな~!ははは~!
そんなに当たるなら、あたいだってやるさきっと…。(はまったら、データ解析とかしそうだし…)

てつじん

大学時代はやってましたよ?データ解析。
大学の情報処理センターのWS使ってまでして(笑)
重回帰とか主成分とかクラスターとかブートストラップとか(^-^;;

要は平均値から先を一切知りもせず統計使ってると思いこんでいる人が多いこと。代表値一つじゃなにも語れないのにね....。データを読むセンスが無い人が多すぎ。

ではでは。