TokyoNLP
ã使ãã®ããã¤ã¹ã«ãã£ã¦ã¯ï¼ï¼¤ã«è¦ããªããã¨ãããã¾ããããããããäºæ¿ãã ããã
TokyoNLP #9 㧠tkng ããã MCMC ã§æ£è¦åå¸ãããµã³ããªã³ã°ãã¦ã¿ããã©ã1000件ãããã ã¨ãªããªãããããªé£éåã«ãªããªããã¨ãã話ãããã¦ããã éä¸ã®ç³»åãæ¨ã¦ã¦ãªãã¨ãããã¨ã ã£ãã®ã§ããã®ããã§ã¯ï¼ ã¨æã£ã¦ã¡ãã£ã¨è©¦ãã¦ã¿ãããçµè«â¦
TokyoNLP 第8åã« ã®ãã®ãåå ã主å¬è ã® id:nokuno ãããçºè¡¨è ï¼åå è ã®ã¿ãªãããããã¦ä¼å ´ãæä¾ãã¦ãã ãã£ã EC ããããæ¹ã VOYAGE GROUP ããï¼ @ajiyoshi ããããç²ãæ§ã§ããï¼ãããã¨ããããã¾ããã ä»åã¯ãâ-gram ã使ã£ãçæè¨èªå¤â¦
第8åèªç¶è¨èªå¦çåå¼·ä¼ #TokyoNLP http://atnd.org/events/22199 主å¬ã® id:nokuno ãããé¤ãã°ãTokyoNLP ã§ãã£ã¨æå¤çºè¡¨ã ã¨æãããæ¥é±ã®ç¬¬8åã§ãã¾ãã¾ãã®ãã®ãçºè¡¨ã ä»åã¯ãâ-gram ã使ã£ãçæè¨èªå¤å®ãã¨ããã¿ã¤ãã«ã§ããã£ãã¤ãã¦ãâ¦
æ©ç¬¬6åã¨ãªã£ãèªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬(#TokyoNLP)ã«ã®ãã®ãè¡ã£ã¦ããã 主å¬è ã® id:nokuno ãããä¼å ´ãæä¾ãã¦ä¸ãã£ã EC ãããã(@ajiyoshi ãã)ãçºè¡¨è åå è ã®åä½ããç²ãæ§ã§ããï¼ãããã¨ããããã¾ããã 第6å èªç¶è¨èªå¦çåå¼·ä¼ #Toâ¦
第5å èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ ã«ã®ãã®ãè¡ã£ã¦ãã¾ããã ãã¤ããã¤ããããã¨ããããã¾ãï¼ä¸»å¬ã® @nokunoãããä¼å ´ã® ECãããã(@ajiyoshiãã)ãçºè¡¨è ãåå è ã®çãã ä»åãããã¤ãã®ããã«æ°å¢å°ã§ãçæææ³ãã«ã¤ãã¦çºè¡¨ããã¦ããã£ãâ¦â¦â¦
第4å èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ : ATNDã« ã®ãã®ãè¡ã£ã¦ãã¾ããã主å¬ã® id:nokuno ãããåå è ï¼çºè¡¨è ã®ã¿ãªãããããã¦ä¼å ´æä¾ãã¦ä¸ãã£ã EC ããããããããã¨ããããã¾ããï¼ãç²ãæ§ã§ããã 第ï¼å #TokyoNLP - Togetter 詳ããå 容㯠nokuâ¦
第3åèªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ ( #tokyonlp ) ã«ä¾ã«ãã£ã¦ã®ãã®ãè¡ã£ã¦ãã¾ããããç²ãæ§ã§ããï¼ãããã¨ããããã¾ããï¼ä¸»å¬ãçºè¡¨ãåå åä½ã é·ä¸å ´ãªã®ãçã«çï¼ ã£ã¦ãã¤ãã¯ä¸»ç¯ã®ä¸äººã ãã©(æ± ç¬¬3åèªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ : ATND 第ï¼åâ¦
ãã®è¨äºã¯ 第ï¼å èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ ã®ãã¾ãè³æã§ãã [岡éå+ 2008] å ¨ã¦ã®é¨åæååãèæ ®ããææ¸åé¡ http://ci.nii.ac.jp/naid/110006980330 n-gram ã¨ç°ãªããä»»æé·ã®é¨åæååãç´ æ§ã®åè£ã¨ããã ãã ããã®ã¾ã¾ã§ã¯ç´ æ§æ°ãæç« é·â¦
ãã®è¨äºã¯ 第ï¼å èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ ã§ã®çºè¡¨è³æã§ãã EMNLP 2010 (The 2010 Conference on Empirical Methods on Natural Language Processing) ã®è«æãï¼æ¬ï¼ï¼æ¬ç´¹ä»ãã¦ãã¾ãã質ããæ°ã§åè² ã è«æãåºãæµ ãèªãã¹ã¹ã¡(ä»®) ããã¾ãã¾æâ¦
é ãã°ããªãã 第2å èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ ã®ææ³ã ã¾ããèªåã®çºè¡¨ããã¤ã¼ããã¤ãºã§è¨èªå¤å®ãã«ã¤ãã¦ããã¤ããã©ãã¼ã é·æéçºè¡¨ãã¦ãã¾ã£ã¦èãæ¹ãç²ããã ããã«ããã£ã±ã質åãæè¦ãããã ãããã¨ãæè¬ã ããªããã¤ã¼ããã¤ãºï¼ â¦
第2åèªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ ã«ã®ãã®ãè¡ã£ã¦ãã¾ããã ãããã¨ããããã¾ããï¼ãç²ãæ§ã§ããï¼åä½ã ä»åãå ¨ç¶å°éããããªãã®ã«ããã¤ã¼ããã¤ãºã§è¨èªå¤å®ãã¨ããã¿ã¤ãã«ã§çºè¡¨ãã¦ããã ãã¤ã¼ããã¤ãºã«ããè¨èªå¤å® from Shuyo Nakataniâ¦
ãZipfåã¯ãªãæãç«ã¤ã®ãã®çè«çè£ä»ããã®ç¶ããããããããã¨ã«ãªã£ã¦ãã¾ããã FSNLPã«æ¸ãã¦ãã£ããã©ã³ãã ã«ã¢ã«ãã¡ãããï¼ç©ºç½ãçæãããã空ç½åºåãã®ãåèªãã®åã¨èããã¨ããããã®åèªã®é »åº¦åå¸ã Zipf ã«å¾ããã試ããã¨ãããâ¦
id:nokuno ãã主å¬ã®èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ã«ã®ãã®ãè¡ã£ã¦ããã 主å¬è ãçºè¡¨è ãåå è ãããã¦ä¼å ´ãæä¾ãã¦ãã ãã£ã mixi ãããã¿ãªãããããã¨ããããã¾ããã ãããªæ©ä¼ãèªåã§ä½ããã¨ã¯åºæ¥ãªãã®ã§ã次åãæ¯éä½ãä½ã£ã¦åå ãããâ¦
ä»æ¥ã®èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ã«ã¦ãZipfå(ããåå¸)ã®çè«çè£ä»ãã¨ãã¦ãã©ã³ãã ã«ã¢ã«ãã¡ãããï¼ç©ºç½ãçæãããã空ç½åºåãã®ãåèªãã¨èããã¨ããããã®åèªã®é »åº¦åå¸ã Zipf ã«å¾ããã ããçãªã話ã FSNLP ã«æ¸ãã¦ãã£ãã ã¸ã¼ã§çµãâ¦
æ¬æ¥ã® tokyotextmining ã㨠èªç¶è¨èªå¦çåå¼·ä¼ï¼ æ±äº¬ 第1å ã§è©±ããWebãã¼ã¸ã®æ¬ææ½åº using CRFãã®è³æ(èªå·±ç´¹ä»ã¯é¤ã)ã§ãã 以åãRuby ã§ä½ã£ãæ¬ææ½åºã¢ã¸ã¥ã¼ã« ãæ©æ¢°å¦ç¿ã®æè¡ã使ã£ã¦ä½ãç´ãã¦ã¿ãããã¨ããã話ã CRF 㯠Conditional â¦