ãã¼ã¿ã«æ¬ æãããå ´åã®æ師ããå¦ç¿
ãã¯ãããããã¾ãï¼
ä»åã¯æ師ããå¦ç¿ã¢ãã«ãé¡æã«ï¼å ¥åãã¼ã¿ãæ¬ æãã¦ããå ´åã®ãã¤ãºæµã®å¯¾å¦æ³ã解説ãã¾ãï¼ãã¤ãºã¢ãã«ã¨ããã¨ï¼ããã¦ãã®å ´åã¯äºååå¸ã®è¨å®ã®ä»æ¹äºã ã ã¨ãï¼éå¦ç¿ãæå¶ã§ããã ã¨ãã«è°è«ã注ç®ãããã¡ã§ããï¼å人çã«ã¯ï¼ãã©ã¡ã¼ã¿ãæ½å¨å¤æ°ãæ¨è«ãããã¨ã¨ã¾ã£ããåãæ çµã¿ã§æ¬ æå¤ãåæã«æ¨è«ã§ãããã¨ãï¼å®ç¨ä¸é常ã«ä¾¿å©ãªãã¤ãºã®ç¹æ§ã ã¨æã£ã¦ãã¾ãï¼
Â
ãã¼ã¿ã®æ¬ æé¨åã®åæ±ã
ãã¼ã¿ã«æ¬ æé¨åãåå¨ãããã¨ã¯ããããã¾ãï¼ã»ã³ãµã¼ãã¼ã¿ã解æããéã¯ï¼ãããã¯ã¼ã¯ã®ç¶æ³ãããã¤ã¹ã®ä¸å ·åã«ãã£ã¦ãã¼ã¿ã®ä¸é¨ãæ¬ ããç¶æ ã§ä¸ãã£ã¦ãããã¨ãããã¾ãï¼ã¹ããããè¤æ°ç¨®é¡ã®ãã¼ã¿ãéããã¨ãã£ãç¶æ³ãèãã¦ã¿ãã¨ï¼ä¾ãã°å é度ã»ã³ãµã¼ã®å¤ã¯ç¶ç¶çã«åå¾ã§ããã¨ãã¦ãã¦ãï¼GPSã®ä½ç½®æ å ±ã¯ã»ã¨ãã©ä¸ãã£ã¦ããªãã¨ãã£ãå ´åããããã¨æãã¾ãï¼ã¾ãï¼ä½ãããã®ã¦ã¼ã¶ã¼ã®ã¢ã³ã±ã¼ããã¼ã¿ãå©ç¨ããäºæ¸¬ãè¡ãå ´åã¯ï¼åéããã¢ã³ã±ã¼ãã«æªè¨å ¥é ç®ãåºã¦ãã¾ãã®ã¯ããèªç¶ã§ãããï¼
ãã¤ã¼ããªå¯¾å¦æ¹æ³ã¨ãã¦ã¯æ¬¡ã®ï¼ã¤èãããã¾ãï¼ï¼ã¤ãã¨ãã¦ã¯ï¼ãããã¼ã¿ã®ä¸é¨ãæ¬ æãã¦ããå ´åã¯ï¼ãã®ãã¼ã¿ãã¨è§£æã®å¯¾ç§°ããå¤ãã¦ãã¾ããã¨ã§ãï¼ãããï¼ããã¯è²´éãªãã¼ã¿ã使ããã«æ¨ã¦ã¦ãã¾ã£ã¦ãããã¨ã«ãªãã®ã§ï¼ãã»ã©ãã¼ã¿éã潤沢ã«ãªãéãã¯é常ã«ãã£ãããªãããæ¹ã«ãªãã¾ãï¼ã¾ãï¼ç¶ç¶çã«è¦³æ¸¬ãããæç³»åãã¼ã¿ãªã©ãåãæ±ãå ´åã«ã¯ï¼ããããããã¤ã«ãã¼ã¿ãåé¤ãããã¨ããã§ãã¾ããï¼ï¼ã¤ãã®å¯¾å¦æ³ã¨ãã¦ã¯ï¼äºæ¸¬ã¢ã«ã´ãªãºã ãé©ç¨ããåã«ï¼åå¦çã¨ãã¦ç·å½¢è£éãå¹³åå¤ã®å½ã¦ã¯ããªã©ãè¡ã£ã¦æ¬ æãåãã¦ãã¾ããã¨ã§ãï¼ãããï¼ãã¡ãã®æ¹æ³ãåé¡ãããï¼åå¦çã§æ¬ æãåãã¦ãã¾ãã¨ï¼å¾æ®µã®äºæ¸¬ã¢ã«ã´ãªãºã ã¯åãåã£ããã¼ã¿ã®ä¸ã®å®éã«è¦³æ¸¬ãããé¨åã¨è£éãããé¨åã®éããåºå¥ã§ããªãããï¼èª¤ã£ãæ¨å®çµæãåºãã¦ãã¾ããã¨ã«ãªãã¾ã*1ï¼
ãã¤ãºã®æ çµã¿ã§ç¢ºççãªæ¨è«ãè¡ãã°ï¼ãã¼ã¿ã使ã£ãäºæ¸¬ã¨æ¬ æå¤ã®è£éãåæã«è¡ããã¨ãã§ãã¾ãï¼è£éå¤ã«å¯¾ããä¸ç¢ºå®æ§ãè¦ç©ãããã¨ãã§ããããï¼èª¤ã£ãè£éã«ããäºæ¸¬æ§è½ã®å£åãéå¦ç¿ãåºæ¬çã«ã¯èµ·ãã¾ããï¼
Â
ãã¤ãºãã¸ã¹ãã£ãã¯å帰
ãã¦ï¼ããã§ã¯ãã¤ãºãã¸ã¹ãã£ãã¯å帰ãä¾ã«ãããããæ師ããå¦ç¿ãã®ã¢ãã«ããããããããã¨æãã¾ã*2ï¼ãã¸ã¹ãã£ãã¯å帰ã¯ï¼å¤æ¬¡å ã®å®æ°å¤å ¥åãã¼ã¿ãï¼å¤ã«åé¡ãããããªã¢ãã«ã§ãï¼å ¥åãã¼ã¿ï¼èª¬æå¤æ°ï¼ãXï¼åºåãã¼ã¿ï¼ç®çå¤æ°ï¼ãYï¼ããã«ãã©ã¡ã¼ã¿ãwã¨ããã°ï¼Nåã®ãã¼ã¿ã«å¯¾ããåæåå¸ã¯æ¬¡ã®ããã«ã¢ãã«åããã¾ã*3
ãã ãï¼å¼ï¼ï¼ï¼ã®ããããã®åå¸ã¯æ¬¡ã®ããã«ãªã£ã¦ãã¾ãï¼
å¼ï¼ï¼ï¼ã®Ïã¯ã·ã°ã¢ã¤ãé¢æ°ã§ï¼ä¸èº«ã®å®æ°å¤ãï¼ããï¼ã¾ã§ã®éã«æ¼ãè¾¼ããå½¹å²ãæ ã£ã¦ãã¾ãï¼å¼ï¼ï¼ï¼ã§ã¯wã®äºååå¸ã«ã¬ã¦ã¹åå¸ãä»®å®ãã¦ãã¾ãï¼
ãã®ã¢ãã«ããï¼ä¸è¨ã®ãã©ã¡ã¼ã¿ã®äºå¾åå¸ã«é¢ããç¹æ§ï¼å¹³åãåæ£ãªã©ï¼ãå¾ããã¨ãï¼ãã¤ãºãã¸ã¹ãã£ãã¯å帰ã«ããããå¦ç¿ãã«ãããã¾ãï¼
å¼ï¼ï¼ï¼ã®äºå¾åå¸ã¯ãã¸ã¹ãã£ãã¯å帰ã®å ´åã§ã¯è§£æå¯è½ãªè¡¨ç¾å½¢å¼ãå¾ããã¾ããï¼ã§ãã®ã§ï¼å¤åãã¤ãºã«ãã£ã¦ä½ãããã®ã·ã³ãã«ãªåå¸ã§è¿ä¼¼ããããï¼MCMCã使ã£ã¦å¤§éã®ãµã³ãã«ãåå¾ãããã¨ã«ãã£ã¦å¹³åãåæ£ãªã©ã調ã¹ãå¿ è¦ãããã¾ãï¼
Â
å ¥åãã¼ã¿ã«æ¬ æå¤ãããå ´å
ãããããæ¬é¡ã§ãï¼ä»åã¯å ¥åãã¼ã¿Xã®ä¸é¨ãï¼ãã©ã¡ã¼ã¿wã¨åããããªããæ¹ã§æ¨è«ããå¿ è¦ãããã®ã§ï¼æ¬¡ã®ããã«Xã«å¯¾ãã¦ãäºååå¸ãç½®ãã¦ãããå¿ è¦ãããã¾ãï¼*4
ã¾ãï¼ããã§ã¯ï¼å ¥åãã¼ã¿ã»ããXã®ä»»æã®é¨åãæ¬ æãã¦ãããããªç¶æ³ãèãããã¨ã«ãã¾ãï¼ããnçªãã®ãã¼ã¿x_nã¯ï¼è¦ç´ ã®ä¸é¨ãæ¬ æãã¦ãã¦ãããã§ããï¼ã¾ããã¨å ¨é¨ç¡ããªã£ã¦ããç¶æ ã§ãOKã§ãï¼ãã¼ã¿ã»ãããXï¼{Xoï¼Xm}ã®ããã«ï¼è¦³æ¸¬é¨åXoã¨æ¬ æé¨åXmã«å解ãã¦æ¸ãã°ï¼æ±ãããäºå¾åå¸ã¯æ¬¡ã®ããã«ãªãã¾ãï¼
ãã¨ã¯æ¬ æå¤ããªãã£ãå ´åã¨åãããã«ï¼ä½ãããã®è¿ä¼¼æ¨è«ææ³ã使ã£ã¦å¼ï¼ï¼ï¼ã®äºå¾åå¸ã®ç¹æ§ã調ã¹ã¦ããã°OKã§ãï¼
Â
å®é¨
ãã¦ï¼ç°¡åãªï¼æ¬¡å ã®ãã¤ãã¼ã¿ã使ã£ã¦æ¬ æå¤è£éä»ããã¤ãºãã¸ã¹ãã£ãã¯å帰ã®åä½ã確èªãã¦ã¿ã¾ãï¼ããã§ã¯å ¥åãã¼ã¿ã®æ¬¡å æ°ãDï¼ï¼ï¼ãã¼ã¿æ°ãN=30ã¨ãã¾ãï¼ã¾ãï¼å ¥åãã¼ã¿ã¯ããããã®è¦ç´ ã50%ã®å²åã§æ¬ æãã¦ãã¾ãï¼ä»åã¯ã¹ã±ã¼ã«ã®å°ããç°¡åãªåé¡ã§ãã®ã§ï¼MCMCã®ï¼ã¤ã§ããMetropolis-Hastingsæ³ã使ç¨ãã¦å¦ç¿ãã¦ãã¾ãï¼
ï¼ã¯ã©ã¹åé¡ãè¡ãã¨ï¼æ¬¡ã®ãããªãå¹³å確çã®çé«ç·ããæããã¨ãã§ãã¾ãï¼
ï¼å·¦å³ï¼ãã¹ã¦ã®æ¬¡å ãããã£ã¦ããå ´åã®ãã¼ã¿ã®ã¿ã使ã£ãäºæ¸¬çµæã«ãªãã¾ãï¼ä»åã®å ´åã¯N=10åã®ã¿ã使ç¨ãï¼æ®ã20åã¯æ¨ã¦ã¦ãã¾ã£ãä¸ã§å¦ç¿ãã¦ãã¾ãï¼
ï¼ä¸å¤®å³ï¼ä»åã®æ¬ æå¤è£éã®æ¹æ³ãç¨ãã¦ï¼æ¬ æå¤ï¼Ãå°ï¼ãè£éæ¨å®ããªããäºæ¸¬ãè¡ã£ãçµæã§ãï¼
ï¼å³å³ï¼æ¬ æãä¸åãªãã£ãå ´åã®äºæ¸¬çµæã§ï¼ããã°ä»åã®ãæ£è§£ãã®äºæ¸¬åå¸ã«ãªãã¾ãï¼
çµæããåããããã«ï¼å·¦å³ã§ã¯æ¬ æã®ãããã¼ã¿ãæ¨ã¦ã¦ãã¾ã£ã¦ããã®ã§ï¼å³å³ã®æ£è§£ã¨ã¯ã»ã©é ãäºæ¸¬çµæã«ãªã£ã¦ãã¾ã£ã¦ãã¾ãï¼ä¸å¤®å³ã§ã¯xå°ã®ç¹ãæ¬ æå¤ãæã¤ãã¼ã¿ã®æ¨å®ä½ç½®ï¼å¹³åï¼ã表ãã¦ããï¼èãæ£ã¯ãµã³ãã«ããè¨ç®ãããæ¨å®ä½ç½®ã®åå·®ã表ãã¦ãã¾ãï¼éã»èµ¤ããããã®ã¯ã©ã¹ããªãã¨ãªãã¾ã¨ã¾ãããã«é ç½®ããã¦ããæ§åãåããã¾ããï¼ä¸å¤®å³ã¨å³å³ã¯ããªãè¿ãå½¢ç¶ã®çé«ç·ï¼äºæ¸¬ç¢ºçï¼ã«ãªã£ã¦ããï¼æ¬ æã®ãããã¼ã¿ããã¾ãå©æ´»ç¨ããæ¹ãï¼ãã¼ã¿ãå®å ¨ã«è¦³æ¸¬ãããå ´åã®äºæ¸¬ã«è¿ã¥ãã¦ããæ§åããããã¾ãï¼
Â
ã©ã³ãã ã§ã¯ãªãæ¬ æï¼è¿½è¨ï¼
ãã¼ã¿ã®æã¤å¤èªä½ã¨æ¬ æã®çºçã¨ãå æé¢ä¿ãæã¤ã¨èããããå ´åã¯ï¼ãã®é¢ä¿æ§ã確çã¢ãã«ã«çµã¿è¾¼ããã¨ã«ãã£ã¦å¯¾å¦ã§ãã¾ãï¼ããã«ã¯ä¾ãã°ï¼ãã»ã³ãµã¼ãã観測ãããå¤ãä¸å®ã®æ°´æºãè¶ ããã¨æ¬ æãå¤ããªãããï¼ãæ¨è¦ã·ã¹ãã ã«ããã¦ï¼ååã«æºè¶³ãã¦ããªãã¦ã¼ã¶ã¼ã»ã©è©ä¾¡ãè¡ããªãããªã©ã®ã±ã¼ã¹ãèãããã¾ãï¼ãã¤ãºã§ã¯ï¼ãã®ãããªæ¬ æãçºçããããã»ã¹ãåæã«ã¢ãã«åãããã¨ã«ãã£ã¦å¯¾å¦ããã®ãä¸è¬çã ã¨æãã¾ãï¼åèã¨ãã¦ï¼æ¨è¦ã·ã¹ãã ã§ã¯æ¬¡ã®ãããªæç®ãããã¾ãï¼
Probabilistic matrix factorization with non-random missing data
Â
ã¾ã¨ã
ãã¦ï¼ä»åã®è©±ãç°¡åã«ã¾ã¨ãã¦ã¿ã¾ãï¼
ï¼ï¼ãã¼ã¿ã¯ä½¿ããã ã使ã£ãæ¹ãè¯ãï¼
ãã¼ã¿ãæ¨ã¦ãã®ã¯ãã£ãããªãã§ãï¼ã¢ã«ã´ãªãºã ã®å®è£ ã³ã¹ããè¨ç®ã³ã¹ããªã©ã¨ãããç¸è«ããå¿ è¦ãããã¾ããï¼ãªãã¹ããªãä½è¨ãªåå¦çãªã©ããï¼ä¸æã«åä¸ã®ã¢ãã«ããæ¨è«ã§ããæ¹ãæã¾ããã§ãããï¼ãã ãï¼ãã¼ã¿ã®æ¬ æå¤è£éããã£ã¨çå£ã«ããã®ã§ããã°ï¼ä»åã®ãããªæ師ããã¢ãã«ã使ããã«ï¼çæã¢ãã«ã«ãã£ã¦ãã£ããXãã¢ãã«åããæ¹ãè¯ãããããã¾ããï¼ã¾ãï¼åé¡ã«ãã£ã¦ã¯æ¬ æãçºçããã¡ã«ããºã ãåæã«ã¢ãã«åããæ¹ãããæ´ç·´ãããã¢ãã«ã«ãªãå¯è½æ§ãããã§ãããï¼
ï¼ï¼ãã¤ãºã®æ çµã¿ã§ã¯ï¼æ¬ æå¤ããã©ã¡ã¼ã¿ã¨åæ§ã«ç¢ºçæ¨è«ãè¡ãï¼
ãæ¨å®ãããå¤ã¯ãã¹ã¦ç¢ºçå¤æ°ã¨ãã¦æ±ããã®ããã¤ãºã®åºæ¬ã§ãï¼ãããã£ã¦ï¼æ師ããå¦ç¿ãæ®éã«ä½¿ãã¨ãã¯åå¨ãæèããå¿ è¦ã¯ããã¾ããã§ãããï¼å ¥åã®æ¬ æå¤ãæ¨è«ãããå ´åã¯ä»åã®ããã«äºååå¸ãæ示çã«å°å ¥ãããã¨ã«ãªãã¾ãï¼ã¾ãï¼æ¬ æå¤ã確çæ¨è«ã§ããããã«ãã¦ããã°ï¼åå¦çãä¾å¤å¦çãããããå®è£ ããæéããªããªãã¾ãï¼ä»åã®ã¢ã«ã´ãªãºã ã§ããã°ï¼æ¥µç«¯ãªå ´åå ¥åXããã¹ã¦æ¬ æã ã£ãã¨ãã¦ãããã¾ãäºæ¸¬ã§ãã¾ããã§ãããã¨ããäºæ¸¬çµæãè¿ã£ã¦ããã ãã§ï¼ãã°ã«ãªããã¨ã¯ããã¾ãã*5ï¼
ï¼ï¼æ¬ æå¤ã®è£éãè¡ã£ã¦ãéå¦ç¿ã¯ããªãï¼
ãã¤ãºã«ã¯ãããããéå¦ç¿ãã¨ããæ¦å¿µãããªãã®ã§ï¼ããã¯ããªããã³ã»ã³ã¹ãªè¨ãæ¹ã§ã¯ããã¾ãï¼ä»®ã«ï¼ãã¤ãºã®ä»£ããã«æå°¤æ¨å®ãç¨ãã¦æ¬ æå¤ãæ¨å®ããå ´åï¼å°¤åº¦ãåä¸ãããããã«ééãªããé½åã®è¯ããXmãæ±ãã¦ãã¾ãã¾ãï¼ããã¯æ¨å®ã¨ãããããããã¼ã¿ã®æé ãã«è¿ãããï¼å½ç¶ãªããæ°è¦ãã¼ã¿ã«å¯¾ããæ±åæ§è½ã¯æå¾ ã§ãã¾ããï¼
Â
ä»åã®å®é¨ãè¡ã£ãã½ã¼ã¹ã³ã¼ãï¼Juliaå®è£ ï¼ã¯ä¸è¨ã«ããã¾ãï¼ï¼logistic_regression_intrp.jlï¼
MLBlog/src at master · sammy-suyama/MLBlog · GitHub
Â
ä»åã®è¨äºãããããããï¼ã¨ããæ¹ã«ã¯ï¼æ¬¡ã®ãããªå ¥éæ¸ãããã¾ãï¼
*1:åã®çµé¨ä¸ææªã®ãã¼ã¿ã¯ï¼æ¬ æé¨åããã§ã«0ã§åãããã¦ããã¨ãããã®ã§ããï¼ã©ããæ¬ æãã¦ãããã®æ å ±ããªãã£ãããï¼è¦³æ¸¬å¤ã¨ãã¦æ¬å½ã«0ãªã®ãï¼æ¬ æã®ãã0ãªã®ãï¼ã¾ã£ããæ¤è¨ãã¤ãã¾ããã§ããï¼
*2:ã¡ãªã¿ã«ï¼å人çã«ã¯ãæ師ãããã ã¨ããæ師ãªããã ã¨ãã£ã¦ããåºå¥ã¯ããã¾ãæ¬è³ªçã§ã¯ãªãã¨æã£ã¦ãã¾ãï¼
*3:ã¡ãªã¿ã«ï¼å人çã«ã¯ã説æå¤æ°ãã ã¨ããç®çå¤æ°ãã ã¨ãã£ã¦ããåºå¥ã¯ããã¾ãæ¬è³ªçã§ã¯ãªãã¨æã£ã¦ãã¾ãï¼Â
*4:æ¬ æå¤ããªãå ´åã§ãXã«äºååå¸ãç½®ãã¦ãæ§ãã¾ãããï¼Xããã¹ã¦å®å ¨ã«ä¸ãããã¦ããç¶æ³ã§ã¯ï¼çµæã¨ãã¦Xã®äºååå¸ã¯wã®äºå¾åå¸ãyã®äºæ¸¬ã«ã¯ä¸åã®å½±é¿ãä¸ããªããã¨ãåããã¾ãï¼ã°ã©ãã£ã«ã«ã¢ãã«ã®è¨äºãåç §ãã ããï¼ï¼
*5:ããæ£ç¢ºã«è¨ãã¨ï¼äºååå¸ã®æ å ±ã®ã¿ã使ã£ã大éæãªäºæ¸¬ãåºåãã¦ããã¾ãï¼