地方競馬のレース結果ぶっこ抜きJS [2019年2月版]

Pocket
LINEで送る
GREE にシェア
LinkedIn にシェア

競馬サイトはサイト更新の頻度が結構早いという事がわかりました。
 

おかげで、前回作ったクローリングプログラムがもはやゴミと化してしましました。
 

ただ、システム運用をしていると、サイト変更の度に、さらなるクローリングシステムを構築していかなければいけません。
 

とりあえず、今現在2019年2月現時点の地方競馬サイトのレース結果をクローリングするJSプログラムを掲載しておきます。
 

ちなみに、以前書いたソースコードはもはやゴミなので、こちらのページの焼き直しだと思ってください。
 

競馬サイトから結果情報をJSON形式で抜き取るJSコード(地方競馬サイト編)

システム条件

まず、今回は地方競馬サイトの「keiba.go.jp」のクローリングですが、レース結果ページがダイレクトアクセスできるので、そちらのページ遷移までは省きます。
 

ちなみに、対象ページは以下のような構成になっています。
 

http://www.keiba.go.jp/KeibaWeb/TodayRaceInfo/RefundMoneyList?k_raceDate=%年/%月/%日&k_babaCode=%馬場コード
 

ある程度の情報を入力すれば、直リンクができるのですが、仕様は下記のようになっています。
 

%年 : 対象年(西暦)
%月 : 対象月(2桁必須)
%日 : 対象日(2桁必須)
%馬場コード : 下記の馬場コード表を参考にしてください。

 

ソース

 

 

ちょこっと解説

このスクレイピングでめんどくさかった点は、払い戻し情報の取得の箇所ですが、テーブル2つの構成で、「複勝」と「ワイド」が複数行になっているため、これらのために、配列にいれて、「\n」でjoinするようにしています。
 

joinの文字列は正直なんでもいいのですが、その後につなげるシステムに見合う文字に改造してもらっても構いません。
 

少し心配なのが、同着やイレギュラーの表示が確認できていないので、その際はまた手を入れなければいけませんが、今の所わからないので、このままにしておきます。
 

実サイトクローリングのデメリットは、ページ改修に弱いという点ですが、こうしたプログラムを効率的に更新できる仕組みを作っておくことが重要なのかもしれませんね。
 

ちなみに、今回のプログラム構築作業は3時間ほどでした。

Leave a Reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です