åã«ãããªãã¤ã¼ãããããã©ããã¡ãã£ã¨ã¡ããã¨ã¡ã¢ã£ã¦ãã
ãããµãã«ã¸ã¥ã¢ã«å¢()ãªã®ã§å
容ã«ééã£ã¦ãç¹ããã£ããæãã¦ãã ããã¨å¬ããã§ã
åæãªã¤ã¡ã¼ã¸ã ã¨ãMeCab âä¸çªä½¿ããã¦ã ãéããè¾æ¸ãå¼ããã®ãç°¡åããããã移æ¤ããã¦ããJumanâåºåã詳ããã代表表è¨ã«æ£è¦åã§ãããKNPã使ãã¨ãã¯ãããKyTeaâæ°ããã¦ããããæ´æ°ããã¦ããèªã¿ã®æ¨å®ãã§ãããé¨åçã¿ã°ä»ãã«ãããã¡ã¤ã³é©å¿ãã§ããã
— ç¡éç¿(id:sucrose)@12æç
(@Scaled_Wurm) October 22, 2014
大éæã«è¨ãã¨å½¢æ
ç´ è§£æã§ã¯æç« ãåèª+åè©ã®åã«å解ãã
ããããå¦æ ¡ã§ãªãã£ãææ³ã¨ã¯éãææ³ã使ã£ã¦ããã®ã§æ³¨æãå¿
è¦
ãã ãå½¢æ
ç´ è§£æå¨ã«ãã£ã¦åè©ä½ç³»ãè¾æ¸ã«è¼ã£ã¦ããåèªãç°ãªã
å½¢æ ç´ è§£æå¨ã§ã¯åèªãåè©ã®åã«ã³ã¹ããè¨ç®ã§ããããã«ãªã£ã¦ãã¦ããã®ã³ã¹ããæå°ã«ãªãå½¢æ ç´ ã®åãæ¹ãè¨ç®ãã¦åºåãã
MeCab
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
- ä¸çªãã使ããã¦ããå½¢æ ç´ è§£æå¨ã§æ å ±ãå¤ã
- é«é
- Javaãªã©ã®ä»ã®è¨èªã«ããå®è£
ãå¤ããããããããããªç°å¢ã§ä½¿ãããã
- æ°å¹´åã«èª¿ã¹ãè¨äºâMeCabのバリエーションいろいろ - 唯物是真 @Scaled_Wurm
- å¤ãã®è¾æ¸ãå ¬éããã¦ãã
- CRFã«ããæ©æ¢°å¦ç¿ã§ã³ã¹ããå¦ç¿ãã¦ãã
- è¨ç·´ãã¼ã¿ãç¨æããã°è¿½å ã§å¦ç¿ã§ãã
JUMAN
JUMAN - KUROHASHI-KAWAHARA LAB
JUMAN メモ - murawaki の雑記 - rekkenグループ
- åºåã詳細(åèªã®ã«ãã´ãªããã¡ã¤ã³ãªã©ãåºã)
- 代表表è¨ãããã®ã§ã表è¨ãããæ£è¦åã§ãã
- Wikipediaã®åèªãè¾æ¸ã«åãå ¥ãã¦ãã
- é£æ¿ããé·é³ãã¼ãå°ããªæ¯é³ãããã ãããã®æ¿å ¥ãªã©ããã£ã¦ã解æã§ãã
- 人æã«ãã£ã¦ã³ã¹ããå²ãå½ã¦ã¦ãã
- KNPã§æ§æ解æãæ ¼è§£æãç §å¿è§£æãããããªããå½¢æ ç´ è§£æé¨åã¯JUMANãå¿ è¦ã«ãªã
KyTea
- æ¯è¼çæ°ããå½¢æ ç´ è§£æå¨ã§é »ç¹ã«æ´æ°ããã¦ããã¤ã¡ã¼ã¸ããã
- èªã¿ã®æ¨å®ãã§ãã
- 追å ã®å¦ç¿ã«ããåéé©å¿
- ç¹æ¨å®ã«ããå¦ç¿
Rakuten MA
rakuten-nlp/rakutenma · GitHub
- ä»å¹´å ¬éããã¦ã¡ãã£ã¨è©±é¡ã«ãªã£ã¦ãã®ã§ã¡ã¢
- JavaScriptã§ã§ãã¦ãã¦ãã©ã¦ã¶ä¸ã§ãåãããã
- Soft Confidence Weightedã«ããå¦ç¿
- 追å ã§å¦ç¿ã§ãã
Kuromoji(追è¨)
kuromoji - japanese morphological analyzer
Kuromojiの日本語のドキュメント
ã¯ã¦ãªããã¯ãã¼ã¯ã®ã³ã¡ã³ãã§ãKuromojiã¯ãªãã®ï¼ãçãªã³ã¡ã³ããã¤ãã¦ããã®ã§ä¸å¿è¿½å (ãã¾ã詳ãããªãã®ã§ä¸è¬çãªèª¬æã ã
- 主ã«LuceneãSolrãªã©ã®å ¨ææ¤ç´¢ã¨ã³ã¸ã³ã§ä½¿ããã¦ãããã¨ãå¤ã
- è¾æ¸è¾¼ã¿ã§ä¸ã¤ã®jarãã¡ã¤ã«ã«ãªã£ã¦ããã®ã§æ±ãããã
- Apache License v2.0
- æ¤ç´¢ã§ãããããããããã«è¤åèªãåå²ããããã«ããã¢ã¼ãããã
- è¾æ¸ã¯MeCabã¨åæ§ã«IPADicãUniDicã使ã
- å¦ç¿ãªã©ã©ãããææ³ã使ã£ã¦ãããã¯ãã¾ãããã¥ã¡ã³ãåããã¦ããªã(ä¸è¨ã®è¨äºåç §)
Kuromojiは何で研究にあまり使われないのか? - Topics Related to Computers and NLP