HELLO CYBERNETICS

深層学習、機械学習、強化学習、信号処理、制御工学、量子計算などをテーマに扱っていきます

評価指標入門の感想

はじめに

下記の書籍を以前(結構時間が経ってしまいました)高柳さんから頂いていましたので感想を書きたいと思います。

遅くなった言い訳としては、「個人としては多くの内容が既知であったこと」が挙げられるのですが、この書籍に書かれている内容が未知であるかあやふやな人にとっては当然非常に有用になっています。そして、何よりもその伝え方(書かれ方)が今になって素晴らしいと実感できたためこのタイミングで書くこととしました。

誰向けか

大きく分けて4種類の人におすすめできます。もし日本中の指定した層が「評価指標入門を読み込んでくれる」という魔法を使えるのだとしたら下記からは「データサイエンスのプロジェクトを管理する人」を選ぶかもしれません。なんか他の層はいずれ自分で学ぶ気がしますが、「データサイエンスのプロジェクトを管理する人」は意欲に対して一番効果が高い層な気がします。これは完全に感想で、しかもなんとなくです。

顧客や自身の部下などにデータサイエンスを説明をしなければならない立場の人

既に業務でバリバリにデータサイエンティストをやっており、比較的周囲をリードできる立場の人にとっては「知識的には」ほとんどが知っていることになると思われます。 ただそのような立場の人ほど、他の部署の非データサイエンティストであるとか、今後データサイエンティストになってもらう部下であるとか、あるいは顧客であるとか、何らかのステークホルダーに対してデータサイエンスがビジネス上どう効くのかを説明しなければならないシーンが出てきます。そのような場合に、当書籍の内容(特に第一章)は非常に腑に落ちるところがあるので、この本の説明の例を、自分たちの実課題に照らし合わせて説明の例を作ると、非常に納得してもらいやすいのではないかと思います。 人によっては、「そんなの今更…当たり前だから説明しなくてよくない?」とか思うかもしれませんが、以外と周囲は理解していなかったりします。いきなり教科書に書かれているコトバを持ち出してF値を良くしたい、と言い出す人はたくさんいらっしゃると思います。それは理由を聞けば、「Accuracyだと稀な例を見逃すから…」と言ってくださったりするのですが、それはAccuracyを使わない理由であってF値を使う理由ではないのです。そして本来メトリクスは固有名詞がついているようななにかにこだわる必要も無いということを、この本を通じて非常にわかりやすく説明できると思います。

機械学習のアルゴリズムには詳しいけどビジネス貢献ってどうやってやるの?という人

「機械学習のメトリクスはあくまで小さなスコープ内での話で、ビジネスサイドはそれをうまくやって勝手に頑張ってね」が成り立っている職場なら良いですが、データサイエンティストという肩書の人がそれで許されるケースはあまりない気がします。基本的には上記にも記したとおりですが、分類問題において「F値を良くしたい」理由は「Accuracyだと稀な例を見逃すから」と言ってる人になっているのであれば、一旦本を読んだほうが良いかもしれません。

データサイエンスのプロジェクトを管理する人

発注側にしても受注側にしても、自分がデータサイエンティストとして手を動かさないにしても、この本の内容は適切に把握しておくべきです。おそらく、把握をしてなかった時に一番損をするのはこの立場の人ではないかと思います。 プロジェクトマネージャーは基本的にプロジェクトの成否に責任を持つわけですし、多くの意思決定を行わなければなりません。なので、アルゴリズムにべらぼうに詳しいとか、数学がめちゃくちゃわかるとか、そういうことが必要になることよりも、ある場所に正しく旗印を立ててその方向に(向かう方法は任せるけど)向かっていることだけは担保しなければなりません。 まさにデータサイエンス・機械学習プロジェクトの一つの旗印が評価指標になってくるので、これが変なものになっていると気づけ無いと厳しいように思います。まあ評価指標の設計自体を誰かに丸投げする方法もあるのかもしれませんが、設計したものに向かっていこうという意思決定をするときに自分で分からないの不安じゃないですかね(算数レベルの話なので、これくらいは多分抑えておいた方が良いと思います)。

機械学習やデータサイエンスをこれから始める人

単純にF値やRecall、AUCだとかそれらの指標を知らない人は、ビジネスの話と繋げつつそれ自体を勉強する書籍としても使うことができます。典型的な機械学習モデルや統計分析は、今やフリーソフトに実装されていて、動かすだけならとりあえずできるという状況になっていますので、コンピュータに丸投げはできない評価指標というものを正しく設定する方法を学ぶのは第一歩として悪くないと思います。(データサイエンティストや機械学習エンジニアになるのであれば、いつまでもフリーソフトが動いてるけど中身は一切わかりません……は頼りないのですが。※FortranやCでスクラッチできるようにしろとかは思わないけど、たまにはPRML見返すとか、実装してみるのは大事)。

感想

個人的な感想としては、数年間データサイエンスをやっている身としては「第一章」みたいな話を割りと永遠に聞きたかったのというふうに思いました。実際にどんな事例があるのかとか、数式に落としづらい場合の工夫であるとか、あるいはステークホルダーとの対話などよりビジネスシーンでどのように決まってくるのかなども体験談ベースなどでも話があると更に面白いなと思いました(そんなの書きづらいのでしょうけど)。

他の評価指標自体を解説している章の内容としては、こちらは知っている人は「うん知っている」としかならない内容なので、1章から最後まで面白く読めるのは、「ビジネスにもある程度関心のあるデータサイエンスこれから学び始める大学生」とか「すでにビジネスサイドの経験を持つ人、データサイエンスに挑戦する場合」とか上記で述べた通り「プロジェクトを管理する人」などになってくるかなと思います。

ただ技術評論社のこのシリーズはいずれも、数式ゴリゴリというよりは日本語を読むことで理解をしていくスタイルなので技術者・研究者よりもビジネスシーンでこれらの技術を扱いたい人に向いている本なのだと思います。ぜひ、ビジネスサイドでデータサイエンスに興味がある or 既に関わっているという人は読んでほしい一冊でした。ちなみにこの本のノリで、ビジネスとデータサイエンスのプロジェクトを上手に設計しましょうね、という話をプレゼンスライドにして話したらすごく好評でした。ありがとう。

クープマン作用素と非線形状態空間モデルの線形化

はじめに

  • はじめに
  • クープマン作用素と動的システム
    • 動的システムの概要
    • クープマン作用素
    • クープマン作用素による線形化
    • まとめ
  • クープマン作用素の固有関数
    • クープマン作用素の基底関数を選ぶ例
    • クープマン作用素の固有関数
    • 元の状態空間モデルと固有関数の関係
    • まとめ
  • 最後に

クープマン作用素は動的システムの研究分野で大きな関心を集めています。クープマン作用素は、非線形システムを線形システムに変換するための強力なツールとして注目されており、機械学習やモデル予測制御などの分野での応用が期待されています。本記事では、クープマン作用素を用いた非線形状態空間モデルの線形近似に焦点を当て、その理論的背景や応用例を紹介します。

概要として本記事におけるクープマン作用素と非線形状態空間モデルの定性的な説明を載せておきます。 まず、クープマン作用素は、非線形な動的システムを適切な関数空間において線形化するために用いられる数学的な概念として登場します。クープマン作用素は、無限次元の線形作用素として表現され、その作用素が適切な関数空間に作用することで、元の非線形システムを線形システムに変換します。例えば非線形な物理的なシステムおよび時間コストの高いシミュレータから得られるデータから、軽量な線形システムを導くことができれば、解析や制御において有用であろうというモチベーションになります。

状態空間モデルは動的システムを表現する方法の一つで、状態変数がダイナミクスを持ち時間発展しており、その状態変数を何らかの方法で逐次観測しているというモデルになります。時系列データからモデルを構築する際に一般性が(ARモデルなどに比べ)比較的高く、柔軟に扱えるモデルとなります。数理的な面では線形状態空間モデルに対する解析が行われている一方で、現実のダイナミクスは非線形であることが多いです。

クープマン作用素を用いることで、非線形状態空間モデルを線形状態空間モデルに近似することができます。この事により、線形システムに対して得られている解析結果や制御手法を適用することができるようになるというメリットがあります。 今回は応用の立場から見たクープマン作用素の基礎的な解説と、具体的な応用例を紹介します。

続きを読む

(データを扱う)ビジネスマン全てにおすすめの本

  • はじめに
  • データ分析:実用系
    • Kaggleで勝つデータ分析の技術
    • ウェブ最適化ではじめる機械学習
  • データ分析:因果推論
    • 入門 統計的因果推論
    • 計量経済学
  • 大人の教養
    • 世界標準の経営理論
    • 科学的に正しい筋トレ 最強の教科書
    • 落合務のパーフェクトレシピ
続きを読む