ããã°ãã¼ã¿æ代ã®ãµã³ã¿ç©ã - ML Advent Calendar 2013 æçµæ¥
Machine Learning Advent Calendar 2013 ã®æçµæ¥ãæ
å½ãã¾ã @sleepy_yoshi ã§ãï¼
ãµã ãã¯ããã°è¨äºãã§ãã調ã§æ¸ãã¦ãã¾ããï¼ãªãã¨ãªãä»æ¥ã¯ã§ãã¾ã調ã§æ¸ãã¾ãï¼ãã¨ã¯ãªã¹ãã¹ã®ããªã§é©å½ãªãã¨ãæ¸ãã¦ããã®ã§ï¼ãã¿ããã¿ã¨ãã¦ã¨ããã¦ããã ããã°ã¨æãã¾ãï¼
æ´æ°ãé ããªã大å¤ç³ã訳ããã¾ããï¼ä»å¹´ããµã³ã¿ç©ãã«åå ãã¦ããçµæï¼å¤ªå¹³æ´ä¸ç©ºã«éãããµã³ã¿ã¯ãã¼ã¹ã追ãããã¦ãµã¢ã¢ã¾ã§æ¥ã¦ãã¾ãã¾ããï¼æ®å¿µãªãããµã³ã¿ãéãã¦ãã¾ã£ãã¨ããã§ãï¼ã¨ããããã§ãã®ããã°è¨äºã¯ãµã¢ã¢ããæ´æ°ãã¦ãã¾ãï¼ã¾ã ãã¡ãã¯ã¯ãªã¹ãã¹ã§ãï¼
ï¼ï¼ï¼ã¨ããããã°è¨äºãã¯ãªã¹ãã¹ã«æ¸ãã¦ããã®ã§ããï¼ãµã¢ã¢ã§ã¯éä¿¡ç°å¢ã確ä¿ã§ããï¼æ¥æ¬ã«å¸°å½ããããããªæéã«ãªã£ã¦ãã¾ãã¾ããï¼
ãã¦ãªãªããªããããã¤ãã£ãããã§ããï¼ãã¬ãã·ã£ã¼ã§ãè ¹ãçãã§ãï¼å½åã¯åå¿è ã«ãããããããVCçè«ã®ç´ æ´ããããç´¹ä»ãï¼Vapnikæãå¸æãããã£ãã®ã§ããï¼èå¤ã¨ãããã¨ãããå®ææ¦äºãèµ·ãããããªãã®ã§ããã¾ããï¼ããããèªåèªèº«ãVCçè«ãã¡ããã¨ç解ãã¦ãã¾ããï¼ã¾ãï¼äººå£ãéä¸ãã¦ããé½å¸é¨ã«ããããµã³ã¿ã¯ãã¼ã¹ã®æé©é ç½®åé¡ãä»æµè¡ãã®å£ã¢ã¸ã¥ã©ã§è§£ãã¨ãã話ãããããã¨ãæã£ãã®ã§ããï¼å£ã¢ã¸ã¥ã©ã¨ããã£ã±ãããããããªãã£ãã®ã§ããã¾ããï¼
ãã¦æçµæ¥ã®ä»æ¥ã¯ï¼ãã®ããã°ãã¼ã¿()æ代ã«ããããµã³ã¿ç©ãã¸ã®æ©æ¢°å¦ç¿é©ç¨ã«ã¤ãã¦èãã¦ã¿ããã¨æãã¾ãï¼å¤§éã®ãã¼ã¿ãå©ç¨å¯è½ã«ãªã£ã¦ãã*1ã¨ãããã¦ããæ¨ä»ã§ããï¼ãã¹ã¦ã®ãã¼ã¿ã«ã©ãã«ã¥ãããã®ã¯å°é£ã§ããï¼æ師ããå¦ç¿ãã®ã¾ã¾ã§ã¯ï¼ãã¼ã¿ã®å¢å ã®æ©æµãåãããã¨ãã§ãã¾ããï¼ãããï¼ã©ãã«ãªããã¼ã¿ããã¾ã使ããã¨ãã§ããã°ï¼ããã°ãã¼ã¿()ã®æ©æµãåãããã¨ãã§ãã¾ãï¼
æ©æ¢°å¦ç¿ã§ããã¨ããã®åæ師ããå¦ç¿ã¨ããã¢ããã¼ãã解説ãããã¨æãã¾ãï¼å ·ä½çã«ã¯åæ師ããå¦ç¿ã®ä¸ã§æ··åã¢ãã«ã¨å¼ã°ããã¢ããã¼ãã®èª¬æãè¡ãã¾ãï¼ãã ãï¼ææ³èªä½ã¯10年以ä¸åã«ç¢ºç«ããã¦ããï¼å 容ã¨ãã¦ã¯å¤ãã§ãï¼ä»åï¼æ··åã¢ãã«ã«ããåæ師ããå¦ç¿ã®è§£èª¬ãé¸æããçç±ã¯æ··åã¢ãã«ã«ããåæ師ããå¦ç¿ã¯ï¼æ師ãªãã®æ··åã¢ãã«æ¨å®ã®ç¹æ®ã±ã¼ã¹ã¨ãã¦èª¬æã§ããã®ã§ï¼ããæ··ååå¸ãEMã¥ãã¦ãã(cf. 8æ¥ç®ï¼15æ¥ç®) ä»åã®ML Advent Calendarã«ãµããããã¨èããããã§ãï¼
ãã¶ãML Advent Calendarã®èªè
ã®å¤ãã®æ¹ã¯ç¥ã£ã¦ããå
容ã ã¨æãã®ã§ï¼ãã®å ´åã«ã¯ãã£ã¨ç»é¢ãéãã¦ãã ããï¼
ã¯ããã«
è¿å¹´ï¼ãµã³ã¿ã¯ãã¼ã¹ãå¢å ã®ä¸éããã©ã£ã¦ãã¾ãï¼å 許å¶ãæ½è¡ããã¦ããä¸çä¸ã«å ¬èªãµã³ã¿ã¯å¢å ãã¦ããï¼ã¾ãã¯ãªã¹ãã¹ãè¿ã¥ãã¨ï¼è²ããè¡ã«ä¸æçã«éãããåå µãµã³ã¿ãç¡å 許ãµã³ã¿ãã¯ã³ããã¾ãï¼èããã¨ããã«ããã¨ï¼åã©ããæã¤ç¶è¦ªãä»äºä¸ã«æ¥ã«ã¹ã¼ããè±ãã§ãµã³ã¿ã®è¡£è£ ã«çæ¿ãã¦ãé´ä¸ã«ã¢ã¬ãå ¥ããªãã¨é´ä¸ã«ã¢ã¬ãå ¥ããªãã¨ãã¨æå³ä¸æã®çºè¨ããã¦ä»äºãæãåºãã¦å¸°å® ããäºæ¡ãå ±åããã¦ãã¾ãï¼ãã®ä»ãã¡ãªã¼ã¯ãªã¹ãã¼ã¹ï¼ãã¨å«ã³ãªããã«ããã«ãã©ã¤ãã¦åãè¾»æ¬ããµã³ã¿ãå ±åããã¦ãã¾ãï¼
ãã®ãããªãµã³ã¿ã¯ãã¼ã¹ã®æ¥æ¿ãªå¢å ã¯ç¤¾ä¼åé¡ã«ãªãã¤ã¤ããã¨ï¼å°é家ã¯ææãã¦ãã¾ãï¼æ¦ãä¼æ¥äººã§ãããç¶ããããµã³ã¿åãããã¨ã«ããï¼ä¼ç¤¾æ¥åãåå¼ãåæ»ãããã¨ã§æ¥æ¬ã®GDPæ¸å°ã«å½±é¿ãä¸ãã¾ãï¼ã¾ãï¼è¾»æ¬ããµã³ã¿ã¯æ´åçãªè¡çºãè¡ãããï¼æ²»å®ã®è¦³ç¹ããã人ã ã«ä¸å®ãä¸ãã¦ãã¾ãï¼
ãµã³ã¿åãã人ã ã¯äººç¼ã®ããã«èªåããµã³ã¿ã¯ãã¼ã¹ã«ãªã£ã¦ãããã¨ãèªè¦ãã¦ãã¾ããï¼èªè¦çç¶ããªãããï¼èªç¶ã«ãµã³ã¿ãæ¸ãããã¨ãé£ããã¨ããåé¡ãããã¾ãï¼
ãããï¼æ²è¦³ãããã¨ã¯ããã¾ããï¼æã ã«ã¯ãµã³ã¿ãã¹ã¿ã¼ãºããã¾ãï¼æ®æ®µæã ããã¾ããµã³ã¿ã®è¢«å®³ãåãã¦ããªãã¨æãã®ã¯ãµã³ã¿ãã¹ã¿ã¼ãºã®ããã§ãï¼ãµã³ã¿ãã¹ã¿ã¼ãºã¯ï¼ã¿ãªããã®ç®ã«è¦ããªãã¨ããã§ããµã³ã¿ç©ãããå®æ½ãï¼äººã ã®ä¸è¦ãªãµã³ã¿åãæå¶ãã¦ãã¾ãï¼æ¥æ¬ï¼ããä¸çãå®ã£ã¦ããããã§ãï¼ãµã³ã¿ãã¹ã¿ã¼ãºã«ã¤ãã¦ã¯æ¿åºã®æé«ã¬ãã«ã®æ©å¯æ å ±ã§ããï¼ç§å¯ä¿è·æ³ã«æµè§¦ããããï¼æ®å¿µãªãã詳ãã話ã¯ã§ãã¾ããï¼
æã ãä½ããããµã³ã¿ãã¹ã¿ã¼ãºã®ãå½¹ã«ç«ã¡ããã¨æãï¼ãµã³ã¿ç©ãã®ãã¡ã¿ã¹ã¯ã§ããããµã³ã¿å¤å¥ããæ©æ¢°å¦ç¿ã«ãã£ã¦é«ç²¾åº¦åãããã¨ãç®æãã¾ãï¼
ãµã³ã¿ãã¹ã¿ã¼ãºã®æã¯æ©ãããµã³ã¿ã¯ä¸è¦ããã¨ä¸è¬äººã®æ§åããã¦ãããæ¬äººã«ããã®èªè¦ããªãããã ï¼ã¯ãªã¹ãã¹ã·ã¼ãºã³ãè¿ã¥ãã¨ãµã³ã¿ãã¹ã¿ã¼ãºã¯åã©ãããã家åºã®å¼µãè¾¼ã¿ããéå§ããï¼ã´ãåºãã®æé帯ãå§ã¾ãã¨ãµã³ã¿ãã¹ã¿ã¼ãºã¯ã´ãè¢ã®ä¸ããã¬ã·ã¼ããæ¢ãï¼ãâããã¼ãã§ãµã³ã¿ã®è¡£è£ ãªã©è³¼å ¥ãã¦ããªãã確èªããããã ï¼ããã¦ããããããç®çã®ããã§ã¯ãªãï¼ãã®ãããªçç±ããå¤è³ªè ã¨ãã¦éå ±ããããã¨ãå°ãªããªãï¼ãã®ããã«ãµã³ã¿ãã¹ã¿ã¼ãºã¯ (社ä¼çãªæå³ã§) å½ããã®è¡åã«ãã£ã¦ãµã³ã¿ç©ããå®æ½ãã¦ããããã ï¼
(æ°ææ¸æ¿åãèå¤ãç©ãè ã»ç©ãããè ã)
ããã§ã¯åæ師ããå¦ç¿ã®ä¸ã§ãæ··åã¢ãã«ã®ã¢ããã¼ãã«ã¤ãã¦ç´¹ä»ãããã¨æãã¾ãï¼æ··åã¬ã¦ã¹ã¢ãã«ãã£ããã£ã³ã°ãç解ãã¦ããã°ï¼ãã®ç¹æ®ã±ã¼ã¹ã¨ãã¦ç解ã§ãã¾ãï¼
ä»åã®ML Advent Calendarã§ã8æ¥ç®ã¨15æ¥ç®ã«EMã¢ã«ã´ãªãºã ã®ç´ æ´ããã解説ãããã®ã§ï¼ããããèªã¿ã®æ¹ã¯ãã£ã¨æ··åã¬ã¦ã¹ãã£ããã£ã³ã°ã®EMã¢ã«ã´ãªãºã ã«ããæ¨å®ã¯ç解ãã¦ããã¨æãã¾ã (ããã³ãª)ï¼
ã¾ãæ··åã¬ã¦ã¹ã¢ãã«ãç解ãã¦ãã人ã¯ï¼ãã§ã«ãããã話ãå 容ãç解ãã¦ããå¯è½æ§ãé«ãã®ã§ããï¼ï¼
ã¾ãã¯ãã£ããçæ³çãªç¶æ³ãæ³å®ãï¼ã©ãã«ãããã¼ã¿ãååã«å©ç¨å¯è½ãªå ´å (ã±ã¼ã¹0) ã«ã©ãããã®ãã¨ãããã¨ã«ãã£ãã触ãã¦ããï¼ã©ãã«ãããã¼ã¿ãä¸åå©ç¨ã§ããªãç¶æ³ (ã±ã¼ã¹1) ã説æãï¼ãã®ç¹æ®ã±ã¼ã¹ã¨ãã¦ä¸é¨ã©ãã«ãããã¼ã¿ãå©ç¨å¯è½ãªç¶æ³ (ã±ã¼ã¹2) ã«ããã¦åæ師ããå¦ç¿ãå¯è½ã§ãããã¨ã説æãããã¨æãã¾ãï¼
ç®æ¡æ¸ãã«ããã¨ä»¥ä¸ã®æµãã§ãï¼
- ã±ã¼ã¹0: 大éã®ã©ãã«ãããã¼ã¿ãå©ç¨å¯è½ãªå ´å (çæ³)
- ã±ã¼ã¹1: ã©ãã«ãããã¼ã¿ãä¸åå©ç¨ã§ããªãå ´å (ææªã®ã±ã¼ã¹)
- ã±ã¼ã¹2: ã©ãã«ãããã¼ã¿ãä¸é¨å©ç¨å¯è½ãªå ´å (ç¾å®çãªç¶æ³)
æºå
ã¾ãä»åã¯èª¬æã®ãã*2ï¼ããªã極端ãªä»®å®ãããã¾ãï¼ãµã³ã¿ï¼éãµã³ã¿ã®å¤å¥ã«ã¯ä½é (x_1) ã¨å¹´å (x_2) ã¨ãã2ã¤ã®ç¹å¾´ãå¤å¥ã«æå¹ã§ããï¼ãã¤ãã®2次å ç¹å¾´ç©ºéä¸ã§ï¼ãµã³ã¿ï¼éãµã³ã¿ã¯ããããåºæã®ã¬ã¦ã¹åå¸ã«å¾ãã¨ããä»®å®ãããã¾ã((ä½éã¨å¹´åã調ã¹ãç¹å¾´æ½åºèªä½ãå¤å¥ãã®ãã®ããé£ããã®ã§ã¯ãªããã¨ãããã¨ã¯æ°ã«ãã¾ãã)ï¼
ãããã£ã¦ï¼ä»®ã«ãµã³ã¿ã¨éãµã³ã¿ã®æ£å¸å³ãæãã¨ä»¥ä¸ã®ãããªã©ã£ãã§è¦ããã¨ã®ã
ããããªå³ã«ãªãã¾ãï¼ä»åã¯ãµã³ã¿ã¯å¹³å=[-2, -2], åæ£Î£=[[3,1],[1,3]]ã®ã¬ã¦ã¹åå¸ï¼éãµã³ã¿ã¯å¹³å=[1,1]ï¼åæ£Î£=[[-2,1],[1,-2]]ã®ã¬ã¦ã¹åå¸ããã©ã³ãã ã«çæãã25åãã¤ã®ãã¼ã¿ãå©ç¨ãã¦ãã¾ãï¼å°ãåã£ããµã³ãã«çµæãå¾ããããããªä¹±æ°ã·ã¼ããé¸æãã¾ããï¼
ã±ã¼ã¹0: 大éã®ã©ãã«ãããã¼ã¿ãå©ç¨å¯è½ãªå ´å (çæ³)
åªç§ãªãµã³ã¿ãã¹ã¿ã¼ãºãã¡ã®æã«ãã£ã¦ååãªæ°ã®ãµã³ã¿ï¼éãµã³ã¿ã«å¯¾ãã¦ã©ãã«ä»ä¸ãè¡ãããç¶æ³ãæ³å®ãã¾ãï¼ãã®å ´åã«ã¯ï¼é常ã®æ師ããå¦ç¿ã®ã¢ããã¼ããå©ç¨ãã¦åé¡å¨ã®æ§ç¯ãå¯è½ã§ãï¼
ä»åã¯åã¯ã©ã¹ãçæãããåå¸ãä»®å®ãã¦ããã®ã§ï¼è¦³æ¸¬ãã¼ã¿ãä¸ããããéã«äºå¾ç¢ºçãæ大ã«ãªãã¯ã©ã¹ã«åé¡ããçæã¢ãã« (ãã¤ãºèå¥å¨ã¨ãå¼ã°ãã¾ã) ã«ããåé¡ã説æãã¾ãï¼
ãã¤ãºèå¥å¨ã§ã¯ï¼è¦³æ¸¬ãã¼ã¿Xãä¸ããããå ´åã«ï¼ã¯ã©ã¹Yã®äºå¾ç¢ºçãæ大ã¨ãªãã¯ã©ã¹ãé¸æãã¾ãï¼å¼ã§æ¸ãã¨ãããªæãã§ãï¼
ãã®äºæ¸¬ã«å¿ è¦ãªæ å ±ã¯ï¼ã¨ã§ãï¼ä»åã¯ã¬ã¦ã¹åå¸ãä»®å®ãã¦ããã®ã§ã«ã¯ãµã³ã¿ã®ã¬ã¦ã¹åå¸ï¼ã«ã¯éãµã³ã¿ã®ç¢ºçå¯åº¦é¢æ°ãå©ç¨ãã¾ãï¼ã¯ã©ã¹äºååå¸ã¯ãµã³ã¿ï¼éãµã³ã¿ã®å²åãå©ç¨ãã¾ãï¼
以ä¸ã®ç¹ã ãè¦ãã¦ããã°å¤§ä¸å¤«ã§ãï¼
çæã¢ãã«ã®äºæ¸¬ã«ã¯ååå¸ã®ãã©ã¡ã¼ã¿ã¨ã¯ã©ã¹äºååå¸ãå¿ è¦
ããã»ã©ã®æ£å¸å³ã«äºå¾ç¢ºçã®å·®ã®å¤ã«åºã¥ãã¦è²åãããã®ãä¸å³ã§ãï¼ã¡ããã©0ã®å¤ã§ããèããã¿ã©ãè²ã®é¨åãåé¢ç·ã«ãªãã¾ãï¼ãã®å³ã§ã¯ã«å¯¾å¿ãã2ã¤ã®ã¬ã¦ã¹åå¸ã®ãã©ã¡ã¼ã¿ã¯25åãã¤ã®è¦³æ¸¬ç¹ããæå°¤æ¨å®ãã¾ããï¼ã«ã©ã¼ããããã¯å¯åº¦é¢æ°ã®å¤ã®å·®ã表ãã¦ãã¾ãï¼ã«ã©ã¼ãã¼ã表ã0ã®å¤ãã¡ããã©åé¡çµæãå¤åããç¹ã§ãï¼
ãã®ããã«ãã¼ã¿ç¹ã«å¯¾ãã¦ååãªæ°ã®ã©ãã«ãä»ä¸ããã¦ããã°ï¼æã ã¯ãµã³ã¿ã®åå¸ï¼éãµã³ã¿ã®åå¸ã¨ããããã«å¥ã ã«åå¸ãã©ã¡ã¼ã¿ã®æ¨å®ãå¯è½ã¨ãªãï¼ãã®çµæã使ã£ã¦åé¡ãããã¨ãã§ãã¾ãï¼
åèã¾ã§ã«ãã¼ã¿ãçæããå ã®åå¸ã§è²åãããå ´åã«ã¯ä¸å³ã«ãªãã¾ãï¼
ãµã³ãã«æ°ãå°ãªãããï¼çã®åå¸ã¨æå°¤æ¨å®ã§ãã£ããããåå¸ã®å½¢ãããªãç°ãªããã¨ããããã¾ããï¼
å°ãä½è«ã«ãªãã¾ããï¼ ã®ãã©ã¡ã¼ã¿æ¨å®ã«ä»åã¯ãã¡ãã¨å ±åæ£ãèæ ®ããã¬ã¦ã¹åå¸ã®ãã£ããã£ã³ã°ãè¡ã£ã¦ãã¾ãï¼ãã¨ãã°ï¼å ±åæ£ã0ã§ãããããªã¬ã¦ã¹åå¸ãèããã¨ï¼å¤æ¬¡å ã¬ã¦ã¹åå¸ã¯1次å ã¬ã¦ã¹åå¸ã®ç©ã§è¡¨ç¾ã§ãã¾ãï¼
2次å ã¬ã¦ã¹åå¸ã®å ´åã§ãã¨ãããªæãã§ãï¼
å ±åæ£ã0ã¨ãããã¨ã¯ï¼ç¹å¾´ç©ºéã®å次å ãç¬ç«ã§ããã¨ãããã¨ãä»®å®ãã¦ããï¼ããã¯ãããããã¤ã¼ããã¤ãºä»®èª¬ã¨ãããã¤ã§ãï¼ML Advent Calendar 20日目ã§ãç´¹ä»ããã¦ãã¾ãããï¼ãã¤ã¼ããã¤ãºã¯ããã¹ãåé¡ã®æèã§å©ç¨ãããå ´åãå¤ããããï¼é¢æ£åå¸ã¨ã»ããã§èª¬æããã解説ãå¤ãã§ããï¼ã¬ã¦ã¹åå¸ã®ãããªé£ç¶åå¸ã§ããã¡ããå©ç¨å¯è½ã§ãï¼
ãã®è¨äºã®æå¾ã«ãã¤ã¼ããã¤ãºãå©ç¨ããåæ師ããå¦ç¿ã«ã¤ãã¦ãä¸è¨è§¦ãã¾ããï¼ããã¾ã§åºæ¬çã«ãã¤ã¼ããã¤ãºã®ãã¨ã¯å¿ãã¦å¤§ä¸å¤«ã§ãï¼
ã±ã¼ã¹1: ã©ãã«ãããã¼ã¿ãä¸åå©ç¨ã§ããªãå ´å (ææªã®ã±ã¼ã¹)
ãã¦ãã¼ã¿ã«å¯¾ããã©ãã«ã¯èª°ãä»ä¸ããã®ã§ãããã? ãµã³ã¿ã®ã©ãã«ä»ãã«ã¯é«åº¦ãªæè¡ãå¿ è¦ã¨ãªãï¼ãªããªãã©ãã«ãå©ç¨ãããã¨ãã§ãã¾ããï¼
ããã§ã¾ã極端ãªç¶æ³ã¨ãã¦ã©ãã«ãããã¼ã¿ãä¸åå©ç¨ã§ããªãç¶æ³ãèãã¾ãï¼ãã®ãããªå ´åã«ããã¦ã©ããããã¨ãããã¨ãèãã¾ãï¼å¹¸ããªãã¨ã«ä»åã¯ãä½éã¨å¹´åãã¨ããç¹å¾´ç©ºéã«ããã¦ããããåºæã®ã¬ã¦ã¹åå¸ã«å¾ãã¨ããç¥èãå©ç¨å¯è½ã¨ãã¾ãï¼ãã ãï¼ããããã®ã¬ã¦ã¹åå¸ã®ãã©ã¡ã¼ã¿ (å¹³åï¼åæ£) ãäºååå¸ (æ··åæ¯) ã¯ãããã¾ããï¼
ä¸ããããç¥èãå©ç¨ããã¨ï¼ãã¼ã¿éåã«å¯¾ãã¦æ··åæ°2ã®æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã°ããããã¨ã«ãã£ã¦ï¼ãªãã¨ãªããµã³ã¿ã®ã¬ã¦ã¹åå¸ï¼éãµã³ã¿ã®ã¬ã¦ã¹åå¸ãæ¨å®ã§ããããªæ°ããã¾ãï¼
ã§ã¯ãã£ã¦ã¿ã¾ãããï¼ã¿ãªããè³ã¿ã³ã®æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã°ã¯ï¼EMã¢ã«ã´ãªãºã ã§æ¨å®ããã¨ä»¥ä¸ã®ã¢ã«ã´ãªãºã ã§æ¨å®ã§ãã¾ãï¼
Algorithm: æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã° INPUT: ã©ãã«ãªããã¼ã¿U, æ··åæ°K OUTPUT: Kåã®ã¬ã¦ã¹åå¸ãã©ã¡ã¼ã¿ï¼æ··åæ¯ 1: Kåã®ã¬ã¦ã¹åå¸ãã©ã¡ã¼ã¿ãé©å½ã«åæåãã 2: åæããã¾ã§ä»¥ä¸ã®Eã¹ãããï¼Mã¹ããããç¹°ãè¿ã 3: Eã¹ããã: ç¾å¨ã®ãã©ã¡ã¼ã¿ãç¨ãã¦Uã«å«ã¾ããå ¨ãã¼ã¿ã«ã¤ã㦠Kåã®ã¬ã¦ã¹åå¸ããçæããã¦ãã£ã½ã (è² æ ç) ãè¨ç®ãã 4: Mã¹ããã: æ¨å®ãããè² æ çãç¨ãã¦Kåã®ã¬ã¦ã¹åå¸ã®å¹³åï¼åæ£ã¨æ··åæ¯ãæ¨å®ããï¼ æ··åã¬ã¦ã¹åå¸ã®å ´åï¼è² æ çãéã¿ã¨ããéã¿ã¥ãå¹³åï¼éã¿ã¥ãåæ£ã¨ãªãï¼
ãã¤ã³ãã¯ãåãã¼ã¿ç¹ã«ã¤ãã¦ã©ã®åå¸ã«å±ãã¦ãããããããªãããï¼ååå¸ã«å±ãã¦ããå ·åã表ãè² æ çãè¨ç®ã (Eã¹ããã)ï¼ãã®è² æ çã«åºã¥ãã¦åå¸ãã©ã¡ã¼ã¿ãåè¨ç®ãã (Mã¹ããã)ãã¨ãããã¨ã§ãï¼
æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã°ã«ãã£ã¦2ã¤ã®ã¬ã¦ã¹åå¸ã¯æ¨å®ã§ãã¾ãããï¼ãã®ã¾ã¾ã§ã¯ã©ã¡ãããµã³ã¿ã§ã©ã¡ããéãµã³ã¿ããããã¾ããï¼ãã¨ãã°ï¼ããã«äºåç¥èã¨ãã¦ããµã³ã¿ã¯éãµã³ã¿ã«æ¯ã¹ã¦ä½éãå¹´åãå¤ããã¨ããç¥èãå©ç¨å¯è½ãªå ´åã«ã¯ï¼ã©ãã«ãä¸åå©ç¨ããã«çæã¢ãã«ã®åé¡å¨ãæ§ç¯ãããã¨ãå¯è½ã§ãï¼ããªãã¡åå¸ã«å¯¾ããç¥èãååã«ããã°ï¼äºä¾ã«å¯¾å¿ããã©ãã«ã¯å¿ ãããå¿ è¦ãªãã¨ãããã¨ã§ãï¼
(è±ç·ãããã)
å°ã横éã«ããã¾ãï¼äºæ¸¬åé¡ãæ©æ¢°å¦ç¿ãç¨ãã¦è§£ããã¨ããã¨ï¼æ£è§£ã©ãã«ãç¨æãã¦æ師ããå¦ç¿ãç¨ããã³ã ï¼ã¨ããèãæ¹ããã¦ãã¾ããã¡ã§ããï¼å¿ ãããããã ãã§ã¯ããã¾ããï¼ä¸è¿°ã®ä¾ã®ããã«ï¼åé¡ã«å¯¾ãã¦äººéãµããæã£ã¦ããç¥èãæ´çãã¦ï¼ãããã®ç¥èããã«ã«æ´»ç¨ã§ããå½¢ã§é©ç¨ããã¹ãã ã¨èãã¦ãã¾ãï¼
å¥ãããæ¬æ¥æçµåãè¿ãã機械学習はじめようの最終回ã§ããæ©æ¢°å¦ç¿ã使ããã®ããããã¨ãã話é¡ãããã¾ããï¼äººéãµãã®ç¥èãç´æ¥æ´»ãããæ段ããããªãã°æ©æ¢°å¦ç¿ã¯ä½¿ããªãã¦ãããï¼ã¨ããããã«è§£éããã¨ï¼ããã»ã©ç³ãä¸ããããã«äººéãµããæã£ã¦ããç¥èã軸ã«èããç¹ã«ããã¦åãèãæ¹ã ã¨æã£ã¦ãã¾ãï¼
(è±ç·ããã¾ã§)
ããã»ã©ã®ãã¼ã¿ã«ã¤ãã¦2æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã°ãè¡ã£ãçµæã示ãã¾ãï¼ããããEMã¢ã«ã´ãªãºã ã«ãã£ã¦å¾ãããå±æ解ã«ãããçµæã§ãï¼ãããã¥ããã§ããï¼åãã¼ã¿ç¹ã®è²ãè² æ çã表ãã¦ãã¾ãï¼ã¾ãï¼ã«ã©ã¼ããããã«ããã¦è²ãæ¿ããªã£ã¦ããã¨ãããã¬ã¦ã¹åå¸ã®å¯åº¦ãé«ãã¨ããã§ãï¼2ã¤ã®ã¬ã¦ã¹åå¸ã®å¯åº¦ã®å·®ã«åºã¥ãã¦ã«ã©ã¼ããããããã®ã§ï¼èµ¤è²ãæ¿ãã¨ãªã¢ã¨éè²ãæ¿ãã¨ãªã¢ã§2ã¤ã®ã¬ã¦ã¹åå¸ã®å±±ã表ç¾ãã¦ãã¾ãï¼
(a)ã®çµæãä¸çªã¾ã¨ãã§ãï¼(b)ããªãã¨ãªã許容ã§ããçµæã§ãï¼ãããï¼(c)ã(d)ã¯ãªããªãã¢ãã¼ãã¼ãªçµæã§ããï¼ä»åã®ã±ã¼ã¹ã§ã¯ï¼(a)ã®å¯¾æ°å°¤åº¦ãæ大ã«ãªã£ã¦ããï¼ä¸çªããå±æ解ãé¸ã¶ã ãã§(a)ã®çµæãé¸æãããã¨ãã§ãã¾ãï¼ãããï¼ä»åã¯2ã¤ã®ç°ãªãã¬ã¦ã¹åå¸ãããµã³ããªã³ã°ããããã¼ã¿ãç¨ãã¦ããã¨ãããã¨ãããã®ã§ï¼å¿
ããã対æ°å°¤åº¦ã®æ大åãä¸çªè¯ããã£ããã£ã³ã°çµæãçã¿åºãã¨ã¯éããªãã¨ãããã¨ãè£è¶³ãã¦ããã¾ãï¼æ··åã¬ã¦ã¹åå¸ã®å ´åã¯ç¹ç°æ§ã®åé¡ãããã¾ãããï¼
ã±ã¼ã¹2: ã©ãã«ãããã¼ã¿ãä¸é¨å©ç¨å¯è½ãªå ´å (ç¾å®çãªç¶æ³)
ãã¦ç¾å®çãªç¶æ³ã¨ãã¦ã¯ï¼ã©ãã«ãããã¼ã¿ãä¸é¨å©ç¨å¯è½ã§ããï¼ã»ã¨ãã©ã®è¦³æ¸¬ã¯ã©ãã«ãªããã¼ã¿ã§ããã¨ããç¶æ³ãèªç¶ã§ãï¼ãã®ãããªå ´åã«ã¯ï¼ã©ããªã¢ããã¼ããåããã§ãããã?
é常ã®åæ師ããå¦ç¿ã§ã¯ï¼"ã©ãã«ãããã¼ã¿ã«å ãã¦" ã©ãã«ãªããã¼ã¿ãå©ç¨å¯è½ã§ããï¼ã¨ãããããªæµãã§è§£èª¬ããããã¨ãå¤ãã§ããï¼ä»åã¯éã«ã©ãã«ãªããã¼ã¿ã大éã«åå¨ãã¦ããç¶æ³ã«ããã¦ï¼"ä¸é¨ã®ãã¼ã¿ã«ã©ãã«ãä»ä¸ããã¦ãã" ã¨ããããã«è§£éãã¦è©±ãé²ãã¾ãããï¼
ããèããã¨ï¼åºæ¬çã«ã¯ã±ã¼ã¹1ã®ç¶æ³ã¨å¤ããã¾ããï¼ãã¯ã2ã¤ã®ã¬ã¦ã¹åå¸ã§ããã¨ããç¥èãå©ç¨ãã¦ï¼æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã°ãèãã¾ãï¼
ç°ãªãç¹ã¯ä¸é¨ã®ãã¼ã¿ã«ã¤ãã¦ã¯çã®ã©ãã«ãããã£ã¦ããã¨ããç¹ã§ãï¼ããã»ã©ãåãã¼ã¿ç¹ã«ã¤ãã¦ã©ã®åå¸ã«å±ãã¦ãããããããªãããï¼ååå¸ã«å±ãã¦ããå ·åã表ãè² æ çãè¨ç®ã (Eã¹ããã)ï¼ããã¨ãã説æããã¾ããï¼ãããï¼ã©ãã«ãä»ä¸ããããã¼ã¿ã«ã¤ãã¦ã¯ã©ã®åå¸ã«å±ãã¦ãããããã£ã¦ãã¾ãï¼ãã®ããï¼è² æ çãè¨ç®ããå¿ è¦ãããã¾ããï¼
ã©ãã«ãããã¼ã¿ã«ã¤ãã¦ã¯è² æ çã¯åºå®ã§ããï¼
ã¨ãããã¨ã§ãï¼
ã§ã¯ãã®é¨åã ãå¤ãã¦åæ師ããæ··åã¬ã¦ã¹ãã£ããã£ã³ã°ãèãã¦ã¿ã¾ãããï¼ã¢ã«ã´ãªãºã ã«ç´ãã¨ä»¥ä¸ã®ã¨ããã«ãªãã¾ãï¼
Algorithm: åæ師ããæ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã° INPUT: ã©ãã«ãªããã¼ã¿U, ã©ãã«ãããã¼ã¿L (new!), æ··åæ°K OUTPUT: Kåã®ã¬ã¦ã¹åå¸ãã©ã¡ã¼ã¿ï¼æ··åæ¯ 1: Lãç¨ãã¦ã¬ã¦ã¹åå¸ã®ãã©ã¡ã¼ã¿ã¨æ··åæ¯ãæ¨å®ããï¼(new!) 2: åæããã¾ã§ä»¥ä¸ã®Eã¹ãããï¼Mã¹ããããç¹°ãè¿ã 3: Eã¹ããã: ç¾å¨ã®ãã©ã¡ã¼ã¿ãç¨ãã¦Uã«å«ã¾ããå ¨ãã¼ã¿ã«ã¤ã㦠Kåã®ã¬ã¦ã¹åå¸ããçæããã¦ãã£ã½ã (è² æ ç) ãè¨ç®ãã ã©ãã«ãããã¼ã¿Lã«ã¤ãã¦ã¯è² æ çãæå®ãããã¯ã©ã¹ã«åºå®ãã (new!) 4: Mã¹ããã: æ¨å®ãããè² æ çãç¨ãã¦Kåã®ã¬ã¦ã¹åå¸ã®å¹³åï¼åæ£ã¨æ··åæ¯ãæ¨å®ããï¼ æ··åã¬ã¦ã¹åå¸ã®å ´åï¼è² æ çãéã¿ã¨ããéã¿ã¥ãå¹³åï¼éã¿ã¥ãåæ£ã¨ãªãï¼
ä½ãéãããããã¾ãã? å¤ãã£ãé¨åã«(new!)ã¨ä»ãã¦ã¿ã¾ããï¼ããã»ã©è¨ã£ãããã«ã©ãã«ãããã¼ã¿ã«ã¤ãã¦ã¯ãè² æ çãåºå®ãã¦ãEã¹ãããï¼Mã¹ããããè¨ç®ãã¦ãããã¨ããããã¾ãï¼
PRMLã®EMã¢ã«ã´ãªãºã ã®èª¬æã®ã¨ããã§å®å ¨ãã¼ã¿ï¼ä¸å®å ¨ãã¼ã¿ã¨ããè¨èãåºã¦ããã¨æãã¾ãï¼æ師ãªãã®ç¶æ³ã«ããã¦ã¯ãã¹ã¦ã®ãã¼ã¿ãä¸å®å ¨ãã¼ã¿ã§ããï¼åæ師ããã®ç¶æ³ã«ããã¦ã¯ï¼ä¸é¨ã®ãã¼ã¿ã¯å®å ¨ãã¼ã¿ã¨ãã¦åå¨ããããã§ãï¼
æ¹ãã¦è¨ãããã¾ã§ããªãããããããã ãã¨ããæãã§ãããï¼
ä¸é¨ã®ã©ãã«ãããã¼ã¿ãå©ç¨ããå ´åã®æ··åã¬ã¦ã¹åå¸æ¨å®ã®å¯è¦åçµæã¯ä»¥ä¸ã®ã¨ããã§ãï¼
ä»åã¯âã§å²ã¾ããååå¸3ã¤ãã¤ã®ãã¼ã¿ã«ã©ãã«ãä»ä¸ãã¾ããï¼ããã»ã©ã®æ··åã¬ã¦ã¹åå¸ãã£ããã£ã³ã°ã®çµæ(a)ã¨å¤ãã£ã¦ãã¾ããï¼ãããï¼ä»åã®å ´åã«ã¯ã¬ã¦ã¹åå¸ãã©ã¡ã¼ã¿ã®åæå¤ãã©ãã«ãããã¼ã¿ã«ãã£ã¦æ±ºå®ãããããï¼(b)-(d)ã®ãããªçµæã«ãªããã¨ã¯ããã¾ããï¼
æ¬å½ã¯ã©ãã«ãä¸å使ããªãç¶æ³ã«æ¯ã¹ã¦ããçµæãå¾ããããã¨ã示ãããã£ãã®ã§ããï¼ãã¹ã¦ã®å³ãä½ãç´ãå¿ è¦ãããããããããã¾ããï¼
ãã¦ï¼ããã§ã¯ãã©ãã«ãããã¼ã¿ã ãããå©ç¨ããå ´åã«ã¯ã©ããªãã§ããããï¼ã±ã¼ã¹0ã«ããã¦ã©ãã«ãããã¼ã¿ã6ã¤ã ãå©ç¨å¯è½ãªç¶æ³ã§ãï¼ã©ãã«ãããã¼ã¿ã®ã¿ãç¨ãã¦ã¬ã¦ã¹åå¸ãã©ã¡ã¼ã¿ã¨äºååå¸ (3ã¤3ã¤ãªã®ã§0.5, 0.5) ãæå°¤æ¨å®ãã¦ãã¾ãï¼
ãã¡ãã¯ããããããæªãçµæã«ãªã£ã¦ããã¾ãããï¼å°ãé¢ããç¹ã«å¯¾ãã¦éãµã³ã¿ã©ãã«ãä»ä¸ãã¦ããããï¼ã¬ã¦ã¹åå¸ã®åæ£ãã©ã¡ã¼ã¿ã大ããæ¨å®ããã¾ããï¼ãµã³ã¿ã¯ã©ã¹ã«ã¤ãã¦ã¯ãããªãã«ã¾ã¨ã¾ã£ã¦ãããã¼ã¿éåã«ã©ãã«ãä»ä¸ããã¦ããããï¼ã¬ã¦ã¹åå¸ã®åæ£ãã©ã¡ã¼ã¿ã¯å°ããã§ãï¼ãã®çµæï¼äºå¾åå¸P(Y|X)ãã²ã£ãããããç·ãã¸ããªã¨ããã«åå¨ãã¦ãã¾ãï¼
ãããã«
æ¬æ¥ã¯åæ師ããå¦ç¿ã®ä¸ææ³ã§ããæ··åã¢ãã«ã«ã¤ãã¦ï¼æ··åã¬ã¦ã¹åå¸ãä¾ã«æãã¦æ師ãªãã®æ··ååå¸ãã£ããã£ã³ã°ã«ããã¦ï¼è² æ çè¨ç®ã®é¨åãä¸ããããã©ãã«ã§åºå®ããï¼ã¨ããæµãã§èª¬æãã¾ããï¼
Nigamã[1]ã¯ï¼ããã¹ãåé¡ã«ãããæ··ååå¸ã®åæ師ããå¦ç¿ãé©ç¨ãææ¡ãã¦ãã¾ãï¼ä¸è¨ã§ããã°åæ師ãããã¤ã¼ããã¤ãºã§ãï¼Nigamãã¯åå¸ã¨ãã¦å¤é åå¸ãå©ç¨ãã¦ãã¾ãï¼å¤é åå¸ã«ãã¤ã¼ã仮説ããããã¨ã«ãã£ã¦ï¼åæ師ãããã¤ã¼ããã¤ãºã¢ãã«ã®ã§ããããã§ãï¼
ãã¤ã¼ããã¤ãº->åæ師ããï¼ã¨èª¬æãããããæ··ååå¸ãã£ããã£ã³ã°->åæ師ããã¸ã®æ¡å¼µ->åå¸ã«å¯¾ãã¦ãã¤ã¼ããã¤ãºä»®èª¬é©ç¨ã¨ããæµãã®èª¬æã®æ¹ãç解ããããããªãã¨æã£ãã®ãä»åã®è¨äºã®çºç«¯ã ã£ãããã¾ãï¼
ãªãä»åã¯1ã¯ã©ã¹1åå¸ã®ä»®å®ãç½®ãã¦ãã¾ãããï¼å½ç¶æç«ããªãç¶æ³ãããã¾ãï¼å è¿°ã®Nigamãã1ã¯ã©ã¹ã«è¤æ°åå¸ãç¨æããæ¹æ³ã«ã¤ãã¦è¨åãã¦ãã¾ãï¼ããã»ã©è¿°ã¹ãããã«ãµã³ã¿ã«ãå ¬èªãµã³ã¿ï¼åå µãµã³ã¿ï¼ç¡å 許ãµã³ã¿ï¼è¾»æ¬ããµã³ã¿ãã¾ãã¾ãªç¨®é¡ãããã¾ãããï¼å é¨ã«è¤æ°ã®åå¸ãèããã¢ãã«ã®æ¹ãé«æ§è½ã«ãªãããã§ãï¼
åæ師ããå¦ç¿ã«ã¯ãããããªã¢ããã¼ããããï¼æ··åã¢ãã«ã¯ãã®ä¸ã¤ã§ãï¼æåã«ã©ãã«ãããã¼ã¿ã§åå¸ãã©ã¡ã¼ã¿ãè¨ç®ãã¦ããï¼EMãåãæ§åã¯ã©ãã«ãããã¼ã¿ã使ã£ã¦æ§ç¯ãããåé¡å¨ã®äºæ¸¬çµæããã®ã¾ã¾æ°ããªã©ãã«ã¨ãã¦å©ç¨ããself-trainingã¨ãä¼¼ã¦ãããã¨ããããã¾ãï¼
ã°ã©ããã¼ã¹ã®æ¹æ³ã§ã¯Zhuã®Gaussian Random Field [2]ãæåã§ãï¼ä»å¹´ICML2013 Classic Paper Prizeãåè³ãããã¨ã話é¡ã«ä¸ãã£ãããã¾ããï¼ã°ã©ããã¼ã¹ã®åæ師ããå¦ç¿ã«ã¤ãã¦ã¯@niam さんの資料ãåèã«ãªãã¾ãï¼
ã¨ããããããã®ã§ããï¼å®å ¨ã«ã¨ãã«ã®ã¼åãã§ãï¼Python+NumPy+matplotlibã«ããä½å³ã«ã¨ãã«ã®ã¼ã注ãããã¾ãã*3ï¼
ã¾ã£ãããã£ã¦ãªãªããªã«è¦åããªãå
容ã ã¨æãã¾ããï¼åå (å·ç) ãããã¨ã«æ義ãããã¨ä¿¡ãã¦ML Advent Calendaræçµæ¥ã®è¨äºããããããããã¨æãã¾ãï¼ML Advent Calendarå¹¹äºã® @naoya_t ããï¼å·çè
ã®ã¿ãªãã¾ï¼èªè
ã®ã¿ãªãã¾ãããã¨ããããã¾ããï¼ããã¾ã§èªãã§ãã ãããããã¨ããããã¾ãã!
ã¨ããã¼ã°
ãããã¦èå¤ã¯çµããï¼å¥´ãã¯å»ã£ãï¼ãããï¼ãã¤ãã¯ã¾ã帰ã£ã¦ããï¼2014å¹´ããµã³ã¿ã¨ãµã³ã¿ãã¹ã¿ã¼ãºã®æ¦ãã¯ç¶ãã®ã ! æ¥å¹´ã¯ Google Glass ã«ãµã³ã¿å¤å¥æ©è½ãå®è£
ãã¦éè¡ã人ã
ããµã³ã¿å¤å¥ãããã¿ãæ¸ãããã¨æãã¾ã! Ok, Glass! ããã§ã¯ã¿ãªãããããå¹´ã!
References
- [1] Kamal Nigam, Andrew McCallum, Sebastian Thrun, Tom M. Mitchell, "Text Classification from Labeled and Unlabeled Documents using EM", Journal of Machine Learning 39(2/3), pp.103-134, 1999.
- [2] Xiaojin Zhu, Zoubin Ghahramani, John Lafferty, "Semi-Supervised Learning Using Gaussian Fields and Harmonic Functions", ICML '03, 2003.
- [3]
- ä½è : Xiaojin Zhu,Andrew B. Goldberg
- åºç社/ã¡ã¼ã«ã¼: Morgan and Claypool Publishers
- çºå£²æ¥: 2009/09/15
- ã¡ãã£ã¢: ãã¼ãã¼ããã¯
- è³¼å ¥: 1人 ã¯ãªãã¯: 52å
- ãã®ååãå«ãããã° (9件) ãè¦ã
- ãã¶ãä¸çªå¹³æã«æ¸ããã¦ããåæ師ããå¦ç¿ã®è§£èª¬æ¬ï¼
- [4]
Semi-Supervised Learning (Adaptive Computation and Machine Learning)
- ä½è : Olivier Chapelle,Bernhard Schoelkopf,Alexander Zien
- åºç社/ã¡ã¼ã«ã¼: The MIT Press
- çºå£²æ¥: 2010/03/31
- ã¡ãã£ã¢: ãã¼ãã¼ããã¯
- è³¼å ¥: 1人 ã¯ãªãã¯: 4å
- ãã®ååãå«ãããã°ãè¦ã
- ããããªè«æãã¾ã¨ãã¦æ¬ã«ããæãï¼Nigamè«æãã»ã¼ãã®ã¾ã¾ã§æ²è¼ããã¦ãã