Lean Baseball

No Engineering, No Baseball.

野球統計学で2016年広島東洋カープの強さを証明しよう!〜PyCon mini Hiroshima 2016レポート

本日開催のPyCon JPの地方版, PyCon mini Hiroshima 2016にて,

広島東洋カープの強さをPyDataと野球統計学"セイバーメトリクス"で証明したよ!」

というお話をさせていただきました!

発表スライド

www.slideshare.net

動画

youtu.be

内容(ざっくり)

  • 初心者向けPyData & 野球統計学入門
  • ピタゴラス勝率をpandasとIPythonでサクッと書く
  • Scrapy, matplotlib, pandas, seaborn, jupyterでFIP(DIPS)およびRC27(RC)を算出して広島東洋カープの強さを証明する.
  • 【結論】強力な中継ぎ陣&切れ目の無い打線が広島東洋カープの強さの秘密だった!

補足

【サンプル】セイバーメトリクスの「Hello World」〜2016年セ・リーグピタゴラス勝率を算出する

PyCon mini Hiroshimaピタゴラス勝率サンプル

【サンプル】FIP/RC27の算出

※後日公開(かも)*1

Q&A

覚えている限りで

Q:セイバーメトリクスの「セイバー」は何の略?

  • アメリカ野球学会(Society for American Baseball Research)の頭文字(SABRmetrics)
  • ライトセイバーとかは関係ないです.

Q:野球統計学の世界において、犠牲バントの評価はどうなのか?&計算などで使われているのか?

  • わざわざアウトを献上する戦術は無価値
  • RCの計算式に犠牲バントは「進塁能力」「出塁機会」の指標値計算の変数として用いられている

Q:選手の身長・体重を含んだ指標はあるのか?

  • メジャーな指標ではありませんが、一応ある
  • 体重が重いと故障しやすい、小さい投手はピークを早く迎える&衰え速い、などそんなのを分析するのに使う
  • 選手のフィジカルや身体能力は「投げる」「打つ」「走る」をベースに分析するのが基本

Q:何故日本シリーズは日ハムに破れたのか

  • シーズンデータと異なり、データが少ないのでセイバーメトリクスでの証明は難しい.
  • 仮説&主観ベースの意見だが、結局は采配の差(調子いい選手をいいタイミングで使えたか否か)が大きかったと思う.
  • センサーデータ(Pitch f/xやStatsCastなど)のデータがあれば分析可能かもしれない

今回も正装しました

なお、無事生きて帰れました.*2

もっと詳しくセイバーメトリクスを!

手前味噌ですが、過去に書いた記事をご覧頂ければと思います!

マネーボール他、参考書籍についても掲載しています.

shinyorke.hatenablog.com

shinyorke.hatenablog.com

なお、2016年版をいずれ書く予定です.

他の発表

基調講演

speakerdeck.com

感想(Twitter)

その他の発表

  • 広島の民泊、サイクリスト支援、(Python絡んでいないけど)観光データベースetc...活用方をPythonで見出す、という発表が多かった.
  • その他だと研究教育におけるPythonの活用、IoTネタ(光線銃ゲーム)などなど.
  • データ系と研究開発、IoTと完全に別れてWebネタがほぼ無かった(強いて言うならスクレイピングか).

*1:難易度が高い&これだけで一記事書けそうなのでホントに後日になりそう

*2:むしろ笑いが多かったからみんなやさしい