ããã¾ãã¦ããã§ã¨ããããã¾ãã
æ¬å¹´ããããããé¡ããããã¾ãã
主æååæ
ãã¦ãæ¨å¹´ã®çµãããããããç§ã¯ä»äºã§ä¸»æååæãè¡ã£ã¦ãã¾ãã
主æååæã¨ããã®ã¯ãå¤æ¬¡å
ã®ãã¼ã¿ãæ
å ±éããªãã¹ãè½ã¨ããã«ä½æ¬¡å
ã«è¦ç´ããææ³ã®ãã¨ã§ãã
主æååæã¯çµ±è¨è¨èª R ã§ç°¡åã«ã§ãã¾ãã
ä¾ã¨ã㦠iris ãã¼ã¿ã§å®è¡ãã¦ã¿ã¾ãããã
data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主æååæ pc1 <- prcomp.obj$x[,1] # 第ä¸ä¸»æåå¾ç¹ pc2 <- prcomp.obj$x[,2] # 第äºä¸»æåå¾ç¹ label <- as.factor(iris[,5]) # åé¡ã©ãã« percent <- summary(prcomp.obj)$importance[3,2] * 100 # ç´¯ç©å¯ä¸ç plot(pc1, pc2, col = label, main = paste(percent, "%"))
iris ãã¼ã¿ã¯ãSepal.Length, Sepal.Width, Petal.Length, Petal.Width ã®4ã¤ã®å¤æ°ãæã¤4次å
ãã¼ã¿ã§ãããããã2次å
ã«è¦ç´ãã2次å
å¹³é¢ä¸ã«ãããããã¦ãã¾ãã
åé¡ã©ãã«ã¨ãã¦5åç®(Species)ã使ç¨ããsetosa, versicolor, virginica ã®3種ãè²åããã¦è¡¨ç¤ºãã¦ãã¾ãã
ããããã®ç¨®ãã¯ã©ã¹ã¿ãå½¢æãã¦ããã®ãè¦ã¦ã¨ããã¨æãã¾ãã
ãã®ããã«æ¬¡å
ãå¤ãã¦ã°ã©ãã®æããªããããªãã¼ã¿ã«å¯¾ãã¦2次å
ãªã©ä½æ¬¡å
ã«è¦ç´ããå¯è¦åã§ããã®ã主æååæã®å¹è½ã§ãã
ã¾ããç´¯ç©å¯ä¸çã 95.813% ã§ãããã¨ããã次å
ãæ¸ããããã¨ã«ããæ
å ±éã®æ失ã 4.2% ç¨åº¦ã§ãããã¨ããããã¾ãã
ä»äºããã©ããã
ç§ãä»ãã£ã¦ããä»äºã§ã¯ããã®ä¸»æååæã大éã«è¡ããªããã°ãªãã¾ããã
大éã®ãã¼ã¿ã渡ããããã®ãã¼ã¿ã²ã¨ã¤ã²ã¨ã¤ã«å¯¾ãã¦ä¸»æååæãè¡ãã¾ãã
ä¸ã¤ã®ãã¼ã¿ã«ã¯ãã¾ã大éã®åé¡ã©ãã«ããããããããã«å¯¾ãã¦ã¯ã©ã¹ã¿ãå½¢æããã¦ããããä½ãå¾åãåºã¦ãããã確èªããªããã°ãªãã¾ããã
ä¸è¨ iris ãã¼ã¿ã®ããã«ãããã«ã¯ã©ã¹ã¿åãããã°ããã§ããã大åã¯ããã¯ãªãã¾ããã
ã¨ããããããããã¯ã©ã¹ã¿ãå½¢æãããªãã®ã§ããã¼ã¿ã®åå¦çæ¹æ³ãå¤ãã¦ãã¾ãä¸ãã主æååæã®ããç´ããè¡ã£ãããã¦ãã¾ãã
ããã R ããã°ã©ã ãã¡ã¾ã¡ã¾å¤ããªãããã£ã¦ããã®ã§ãããã¯ã£ãããã£ã¦ãããã©ãããã§ãã
ãã£ã¨ç°¡åã«ã§ããæ¹æ³ã¯ãªãã®ã§ããããï¼
ã¨ããããã§ãã¾ãä½ã£ã¡ããã¾ããã
簡単に主成分分析ができるページ
ç°¡åã«ã§ããã·ãªã¼ãºç¬¬äºå¼¾ã§ãã*1
使ãæ¹ã¯ããã£ã¦ç°¡å
- 主æååæããããã¼ã¿ã Excel ããã³ãã¼ãã¦ããã®ãµã¤ãã®ããã¹ãæ¬(å·¦å´)ã«è²¼ãä»ããã
- å³å´ã«å ¥åãã¼ã¿ã表形å¼ã§è¡¨ç¤ºãããã®ã§ãããã§å ¥åã確èªããOKãªããExecute PCAããã¿ã³ãã¯ãªãã¯ããã
ããã ãã§ä¸»æååæãã§ãã¡ããã¾ãã
使ç¨ä¾
試ãã«å·¦ä¸ã®ãShow Demoããã¿ã³ãæ¼ãã¦ãã ããã
iris ãã¼ã¿ãããã¹ãæ¬ã«å
¥åããã¾ãã
å³å´ã§ãã³ã¯è²ã«ãªã£ã¦ããåã¯åé¡ç¨ã®ã©ãã«ã¨ãã¦èªèãããã¨ããæå³ã§ãã
ãã®ã©ãã«ä»¥å¤ã®åãå¤æ°ã¨ãã¦èªèããã主æååæã®å¯¾è±¡ã¨ãªãã¾ãã
ãExecute PCAããã¿ã³ãæ¼ãã¨ä¸»æååæãå®è¡ãããã°ã©ãã表示ããã¾ãã
ä¸çªå·¦ã®æ£ã°ã©ã㯠Scree Graph ã¨ãã£ã¦ãå主æåãæã¤æ
å ±éã®å¤§ããã示ãã¦ãã¾ãã
主æåã¯ãæ
å ±éã®å¤ãæ¹ãã第ä¸ä¸»æå(PC1)ã第äºä¸»æå(PC2)ã第ä¸ä¸»æå(PC3)â¦ã¨ãã風ã«å¼ã°ãã¾ãã
Scree Graph ããã第ä½ä¸»æåã¾ã§ãæ
å ±éãå¤ãæã¤ãã確èªãããã¨ãã§ãã¾ãã
æ®ãã®3ã¤ã®ã°ã©ãã¯ãããããã第ä¸ä¸»æåvs第äºä¸»æåã第ä¸ä¸»æåvs第ä¸ä¸»æåã第äºä¸»æåvs第ä¸ä¸»æåããããããããã®ã§ãã
ãããã®å³ãè¦ã¦ã¯ã©ã¹ã¿ã¼ãå½¢æããã¦ãããã©ãããè¦ãã°è¯ãã¨ããããã§ãã
ã¡ãªã¿ã«ãåé¡ã©ãã«ãæ°å¤ãã¼ã¿ã®å ´åãã°ã©ããããããã°ã©ãã¼ã·ã§ã³ã§è¡¨ç¾ãããã¨ãã§ãã¾ãã
ã¡ãã£ã¨ãã£ã¦ã¿ã¾ããããiris ãã¼ã¿ã«å¯¾ãã Label Column ãã1-2ãã«å¤æ´ããSepal.Length ãã©ãã«ã«ãã¦ãæ®ãã®3å¤æ°ã«å¯¾ãã¦ä¸»æååæãè¡ãã¾ãã
ãããªæãã«ãªãã¾ãã
第ä¸ä¸»æåvs第äºä¸»æåã®ã°ã©ããè¦ãã¨ãå·¦ä¸ãä½ãã¦å³ä¸ã«ããã»ã©ä¸æãã¦ããå¾åãè¦ã¦ã¨ãã¾ãã
ã¾ããçµæã®ãã¦ã³ãã¼ãæ©è½ãä»ãã¦ãã¾ãã
ãDownload PCA Resultãã§ä¸»æååæã®çµæ(è² è·éãªã©)ãè¦ãã¾ãã
ãDownload Graph Dataã㧠Excel ç¨ã®ã°ã©ããã¼ã¿ãåå¾ã§ããã°ã©ãã®æ¿å
¥ã§åãå³ãæãã¾ãã*2
以ä¸ã 簡単に主成分分析ができるページ ã®ç°¡åãªèª¬æã§ãã
ãã²ãã²ä½¿ã£ã¦ã¿ã¦ãã ããã
ä¾ã®ãã¨ãããã¼ã¿ã Web ä¸ã«ä¸ããããªãã¨ããæ¹ã¯ããã¼ã«ã«ãµã¼ãã¸ã®é
åãå¯è½ã§ããåå¥ã«ãç¸è«ãã ããã
ãã°ãè¦ã¤ããå ´åããä¸å ±ããã ããã¨ãããããã§ãã
é£çµ¡å
ï¼
以ä¸ã§ãã
é¢é£è¨äº
*1:第ä¸å¼¾ http://d.hatena.ne.jp/hoxo_m/20111109/p1
*2:ã°ã©ãã¼ã·ã§ã³ã«ã¯å¯¾å¿ãã¦ã¾ãã