19. HMM と CRF の相違点
Hidden Markov Model Conditional Random Fields
状態空間モデル マルコフ確率場
(有向グラフィカルモデル) (無向グラフィカルモデル)
生成モデル 識別モデル
教師無し 教師有り
������(������������ |������������ )で記述できる素性 バイナリ素性を自由に設計
������(������, ������)から������(������|������)を計算 ������(������|������)を直接計算
計算量はどちらも O(素性数×状態数^2×系列長) だが、
CRFは素性数が爆発する傾向あり(bigramの素性=状態数^2)
• Vapnikの原理:ある問題を解くとき,その問題よりも難しい問題
を途中段階で解いてはならない
• "When solving a problem of interest, do not solve a more general problem as an
intermediate step. Try to get the answer that you really need but not a more general one."
• http://en.wikipedia.org/wiki/Transduction_(machine_learning)
24. 実行例(パターン3)
• 正しく抽出(先頭が付与されたラベル)
H Project Gutenberg's Etext of Shakespeare's First Folio/35 Plays
H Copyright laws are changing all over the world, be sure to check
H Please take a look at the important information in this header.
不規則な本文開始位置を
: ( 66 paragraphs) 正しく判定
H If you find any scanning errors, out and out typos, punctuation
H David Reed
H Project Gutenberg's Etext of Shakespeare's First Folio/35 Plays
B To the Reader.
B This Figure, that thou here feest put, It was for gentle Shakesp
B B.I. 長い系列でも
: ( 27143 paragraphs) 正しくラベリング
B Cym. Laud we the Gods, And let our crooked Smoakes climbe to
B Exeunt.
B FINIS. THE TRAGEDIE OF CYMBELINE.
F End of Project Gutenberg's Etext of Shakespeare's First Folio/35
36. References
• [Lafferty+ 2001] Conditional Random Fields: Probabilistic
Models for Segmenting and Labeling Sequence Data
• [Sutton+ 2006] An Introduction to Conditional Random
Fields for Relational Learning
• [Kudo+ 2004] Conditional Random Fieldsを用いた日本語
形態素解析
• [Marek+ 2007] Web Page Cleaning with Conditional
Random Fields
• 岡野原さんの「機械学習による自然言語処理チュート
リアル~PerceptronからCRFまで~」
– http://hillbig.cocolog-nifty.com/do/2008/08/post_040f.html