本日開催のPyCon JPの地方版, PyCon mini Hiroshima 2016にて,
「広島東洋カープの強さをPyDataと野球統計学"セイバーメトリクス"で証明したよ!」
というお話をさせていただきました!
発表スライド
www.slideshare.net
動画
内容(ざっくり)
- 初心者向けPyData & 野球統計学入門
- ピタゴラス勝率をpandasとIPythonでサクッと書く
- Scrapy, matplotlib, pandas, seaborn, jupyterでFIP(DIPS)およびRC27(RC)を算出して広島東洋カープの強さを証明する.
- 【結論】強力な中継ぎ陣&切れ目の無い打線が広島東洋カープの強さの秘密だった!
補足
【サンプル】セイバーメトリクスの「Hello World」〜2016年セ・リーグのピタゴラス勝率を算出する
PyCon mini Hiroshimaピタゴラス勝率サンプル
【サンプル】FIP/RC27の算出
※後日公開(かも)*1
Q&A
覚えている限りで
Q:セイバーメトリクスの「セイバー」は何の略?
- アメリカ野球学会(Society for American Baseball Research)の頭文字(SABRmetrics)
- ライトセイバーとかは関係ないです.
Q:野球統計学の世界において、犠牲バントの評価はどうなのか?&計算などで使われているのか?
- わざわざアウトを献上する戦術は無価値
- RCの計算式に犠牲バントは「進塁能力」「出塁機会」の指標値計算の変数として用いられている
Q:選手の身長・体重を含んだ指標はあるのか?
- メジャーな指標ではありませんが、一応ある
- 体重が重いと故障しやすい、小さい投手はピークを早く迎える&衰え速い、などそんなのを分析するのに使う
- 選手のフィジカルや身体能力は「投げる」「打つ」「走る」をベースに分析するのが基本
Q:何故日本シリーズは日ハムに破れたのか
- シーズンデータと異なり、データが少ないのでセイバーメトリクスでの証明は難しい.
- 仮説&主観ベースの意見だが、結局は采配の差(調子いい選手をいいタイミングで使えたか否か)が大きかったと思う.
- センサーデータ(Pitch f/xやStatsCastなど)のデータがあれば分析可能かもしれない
今回も正装しました
なお、無事生きて帰れました.*2
@shinyorke さんの発表です。今日も正装です! #pyconhiro pic.twitter.com/JrkeN6uw2b
— checkpoint (@checkpoint) November 12, 2016
Python でカープの強さを可視化する方は日本ハムファンで、なおかつ正装中はフリー素材 #PyConHiro pic.twitter.com/I82Puo1C8c
— 逃げる8回は役に立つ (@NeXTSTEP2OSX) November 12, 2016
Python 野球 の人 #pyconhiro pic.twitter.com/fyeywLo4D8
— にしもつ (@24motz) November 12, 2016
#pyconhiro 広島て正装日ハム pic.twitter.com/p5gQPwI5h7
— Fumikazu Kiyota 清田史和 (@kiyotaman) November 12, 2016
もっと詳しくセイバーメトリクスを!
手前味噌ですが、過去に書いた記事をご覧頂ければと思います!
マネーボール他、参考書籍についても掲載しています.
なお、2016年版をいずれ書く予定です.
他の発表
基調講演
感想(Twitter)
プログラミングは手段 #pyconhiro #iotlt広島
— Shinichi Nakagawa (@shinyorke) November 12, 2016
Web,組み込み,統計などなど,適用範囲が広いのがPythonの強み #pyconhiro #iotlt広島
— Shinichi Nakagawa (@shinyorke) November 12, 2016
基調講演らしい基調講演で面白かった! #pyconhiro #iotlt広島
— Shinichi Nakagawa (@shinyorke) 2016年11月12日