まだ仮想通貨の取引の痛手が残っていて株取引はできていない(SBIに口座を開設しただけ…)。
それはさておき、最近興味があったが応用先のない機械学習の知識がついに役に立つ分野が見つかった。競馬だ。
無料で手に入る多数のパラメータがあり、結果がはっきりしていて、しかもリターンが金銭的に入ってくる。
以下の記事を参考に、 netkeiba.com のデータを用いてLigthGBMで学習をしている。
cocon-corporation.com cocon-corporation.com
また、以下の書籍を参考にして精度を向上している。
ゼロからはじめるデータサイエンス ―Pythonで学ぶ基本と実践
- 作者: Joel Grus,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/01/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
- 作者: Andreas C. Muller,Sarah Guido,中田秀基
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/05/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
前処理大全[データ分析のためのSQL/R/Python実践テクニック]
- 作者: 本橋智光
- 出版社/メーカー: 技術評論社
- 発売日: 2018/04/13
- メディア: 大型本
- この商品を含むブログ (1件) を見る
さらに、LightGBMによる予想をもとに馬券の買い方をさらに最適化することで、よりよい収益を得られるように工夫している。
現在、2019年の重賞を対象にした予想で、シミュレーションによる収支は179%となっており、まずまずの予想である。
計算環境は手元のMacBook Air 2014で行っていたが、さすがに時間がかかるのでAWSのt3.2xlargeインスタンスを都度立てて計算している。
予想結果は週次でnoteに公開していく予定なので、興味のある人はぜひ購入してみてほしい。
追記:
今週の結果を以下に投稿しました。
追記2:
今晩にでも、2019年1月からの過去レースの結果をnoteに投稿します。 計算ミスとかしていないだろうな俺…
追記3:
過去レースの結果をnoteに投稿しました。 大きな計算ミスはなかった模様。noteはMarkdownで書けないの辛い。