注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
固有表現とは、MUC6 (Message Understanding Conference) において提唱された7種類の表現で ある。各表... 固有表現とは、MUC6 (Message Understanding Conference) において提唱された7種類の表現で ある。各表現は単語列であり、7種類のいずれかに分類されている。7種類とは、組織名 (ORGANIZATION)、人名 (PERSON)、地名 (LOCATION)、日付表現 (DATE)、時間表現 (TIME)、金額 表現 (MONEY)、割合表現 (PERCENT) である。IREX では、さらに人工物 (ARTIFACT) が追加され た。 手法 一般の固有表現認識では、CRFs (Conditional Random Fields) が用いられることが多い。しか しながら、ある程度の量の学習コーパスがある状況では、未知の固有表現を効率良くカバーする ことが課題となる。そのため、一部の単語にのみアノテーションした部分的アノテーションコー パスも学習データとして
2014/05/23 リンク