競馬サイトから結果情報をJSON形式で抜き取るJSコード(JRAサイト編)

horse-2815033_1280
LINEで送る
Share on GREE
Share on LinkedIn

競馬ってギャンブルだという印象を持っていましたが、非常にデータ重視の思考を持つ確率と統計に基づきたエンターテイメントという事が、最近人から教えていただいてわかってきました。
 

個人的にギャンブルは全く性に合っていないので、ギャンブル要素には興味ないのですが、競馬のデータに関するところは、数学的に興味を持つと面白いため、簡単にデータを取得するスクリプトを作ってみました。

競馬のデータについて

競馬のことを何も知らない僕は競馬のデータというと、馬と騎手とレース結果の順位ぐらいに考えていましたが、それらの詳細データに加えて、調教師や、レース場、天候、など非常に細かなデータが存在する事を知りました。
 

競馬新聞を見たことがある人は、その情報の多さを理解できると思います。
 

いくつかの競馬情報サイトでは、1ページでは収まらないデータがサイトを埋め尽くしていることがりかいできます。
 

一番重要なデータは?

全てのデータをマイニングして予想に繋げるという事も面白そうですが、とりあえず、僕の注目したいデータは、競馬のレース開催情報とレース結果のデータです。
 

一番基本のデータで、入り口と出口という性質の為、これらのデータを集めてみましょう。
 

・・・が、これだけでも非常にデータ数が多いし、いくつものページを遷移して情報を取得しなければいけません。

JRAサイトについて

試しにJRAサイトを見てみましょう。
 

http://www.jra.go.jp/
 

試しに2017年10月22日(日)のレース開催情報を見てみると、1日の中で東京競馬だけで、12回ほどレースが開かれている事がわかります。
※レース情報は、JRAサイトでリンクを遷移して確認してみてください。
 

情報ページまでの遷移サンプル
TOP > 今週の開催お知らせ > 出馬表 > ※競馬場
 

race_tokyo
 

競馬素人の僕としては、こうした事すら全く知りませんでした。
 

そして、更にその中の1レースを見てみると、下記のような情報が掲載されています。
 

race_tokyo_r1
 

この情報だけでもかなりお腹いっぱいですね。
 

結果情報について

そして、最も競馬で重要な情報がレース結果の情報です。買った負けたという事と同時に、投資した馬券がいくらで払い戻されるのかが一番の興味本位になります。
 

実際の結果情報ページを見てみましょう。
 

TOP > レース結果 > ※競馬場
 

race_result
 

そして、さらにその中の1レースのみの情報は以下。
 

race_result_1r
 

1日分のデータ

思いの外情報量があってビックリしましたが、今回は払い戻しに必要な情報がレース結果の上位3位までという事と、できれば1日分をまとめて取得したいので、サイト内を探してみたら以下のようなページがありました。
 

TOP > レース結果 > 払戻金 > ※競馬場
 

race_result_tokyo
 

このページであれば、レース場ごとの1日の結果情報が取得できそうです。

取得JSコード

Chromeブラウザでこのページを開いた状態でデバッグコンソールに下記ソースコードをコピペして実行します。
 

 

※ほとんどコメントを書いていないので、詳細が知りたい人はコメントかメールなどでご質問ください。
 

実行結果は下記のようになります。
 

 

JSON形式で、”{main:{} , data:{}}”という形式でレース毎に配列にしています。
 

これをさらに集計システムなどを作り込むことで、データを扱うことが可能になります。
 

また、クロールシステムなどと連携したら、毎日自動でレースデータが取得できると思います。
 

改めて競馬はデータという情報を分析する非常に数学的なエンターテイメントだと考えさせられました。
 

お金儲けができるかどうかはアナタ次第です。

Leave a Reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です