主座標分析
類似度行列を元にして,対象の二次元配置を求める。 任意の基準による類似度行列を使用できるが,類似度行列は対称行列でなければならない(同様の目的を達成する手法として数量化 IV 類がある。数量化 IV 類では,分析に用いる類似度行列は対称行列でなくともよい。)。
- n 個の対象間の類似度を表す類似度行列を S= ( Sij )とする。Sii = 0,Sij = Sji,対象 i と対象 j が似ていないほど負の,絶対値の大きな値をとるとする。
- Sの固有値が λ1 ≧ λ2≧ … ≧ λn ≧ 0,第 k 固有値に対応する固有ベクトルを ck = ( c1k, c2k, ... , cnk )',‖ck‖2 = λk とする。
- 対象 i の座標を( ci1, ci2, ... , cin ),対象 j の座標を( cj1, cj2, ... , cjn )としたとき,対象 i と対象 j の間のユークリッド平方距離Δij2 は以下のようになる。
- もし,類似度行列 Sの固有値の m 番目以降の固有値が小さいならば,n 次元空間に対象を配置するかわりに m 次元空間に配置しても対象間の位置関係に大きな誤差はないであろう。
- 主座標分析では特にm = 2 すなわち二次元平面上に対象を布置することが行われる。この場合に,次式により,二次元までの近似の効率を判定できる。
- 主座標分析のページへのリンク