æ¬æ¥ã® tokyotextmining ã㨠自然言語処理勉強会@東京 第1回 ã§è©±ããWebãã¼ã¸ã®æ¬ææ½åº using CRFãã®è³æ(èªå·±ç´¹ä»ã¯é¤ã)ã§ãã
以前、Ruby で作った本文抽出モジュール ãæ©æ¢°å¦ç¿ã®æè¡ã使ã£ã¦ä½ãç´ãã¦ã¿ãããã¨ããã話ã
CRF 㯠Conditional Random Fields ã®ç¥ã
å®è£ ã¯ãã®ãããã
- http://github.com/shuyo/iir/blob/master/sequence/crf.py
- http://github.com/shuyo/iir/blob/master/sequence/pg.py
- http://github.com/shuyo/iir/blob/master/extractcontent/webextract.py
ã追è¨ã
å¦ç¿ç¨ãã¼ã¿ã®ä½ææ¹æ³ã«ã¤ãã¦ã¾ã¨ãã¾ããã
ãï¼è¿½è¨ã