tkenichi の日記

毒舌皮肉系恥さらし日記

グラフィカルモデリング

グラフィカルモデリングとは、統計の一手法で、複数の変数の間の条件付独立の関係を変数を頂点とし、関係を辺とするグラフで表現するもの。条件付独立かどうかは、偏相関係数が0に十分近いかどうかで判断する。

勉強も兼ねて可視化プログラムを作ってみた。低機能。CSVをコピー&ペーストしてボタンを押すとJUNGでグラフを作ってくれる。

グラフィカルモデリング計算機

よく似た手法でパス解析と言うのもあるけれど、こちらはあらかじめ目的変数と説明変数を決めておいて、向きつきのグラフで変数間の効果を可視化するもの。相関があっても因果関係があるとは一般には言えないので、どれを目的変数にするか、どれを説明変数にするかを決めるのは難しい。グラフィカルモデリングでは、関連があるかどうかだけを向きのないグラフで表しているのが違うところ。

プログラムは日曜の暇つぶしで作った最初のプロトタイプ。徐々に使いやすくする予定。

グラフィカルモデリングのことを調べていて考えたこと。

  • 偏相関係数は相関係数行列の逆行列から求めることができるが、条件付独立の関係と逆行列の関係をうまく説明できないだろうか?(もちろん論理的に証明を追うことはできる。行列の代数的性質と、条件付独立と言う確率論的性質をうまく結びつける説明が欲しい。)
  • 変数のデータ列から、変数間の関係を推定することができるので、たとえば株価の時系列データから作られるグラフィカルモデルと、資本関係から得られるグラフとの間に類似性を見出すことはできないだろうか?
  • グラフ上の確率過程のサンプル値から得られるグラフィカルモデルと、もとのグラフの関係は?