タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
英和辞書・和英辞書として使える辞書検索システムを作る連載の4回目である。今回はWictionaryから辞書データを抽出して、WordNetとも併合して、本物の英和辞書として使えるシステムを構築した。今回もデモサイトを作ったので、お試しいただきたい。凝った機能はまだ入れていないが、普通に使えるレベルになっていると思う。 英語の文字列を入力して検索すると、英和辞書としてその語を検索する。単語だけではなく複数語からなる熟語も数多く収録されている。日本語を入力すると和英辞書として逆引きしてそれに対応する英語を検索する。 英語も日本語も現状では完全一致のみで検索を行う。 デフォルトでは文字種を見て正引き(英和モード)か逆引き(和英モード)かが自動的に選択される。正引きと逆引きを明示的に切り替えたい場合は、「Auto Mode」を「En-to-Ja」か「Ja-to-En」に変えればよい。表示方法もデフ
wordnetは、同一概念の単語をまとめ、さらに概念の抽象度に基づくネットワークが定義されたデータです。 概要 単純なモジュール 文を生成する 何がしたいのか 参考 今回は、wordnetを使って単純な文を文レベルで抽象化・具体化します。 概要 以下の文があるとします: おいしいコーヒーを飲む。 この文を、以下のように抽象化することができます。 おいしい飲み物を飲む。 具体化する場合は以下のようになります。 おいしいエスプレッソを飲む。 「おいしい」という言葉についても、「美味しい」「旨い」「辛い」「酸っぱい」などの類似語に置き換えられると考えます。 ただし、「飲む」という述語については、述語によって使われる項が異なるため、固定します。(これは、述語項構造解析の問題です)。 単純なモジュール 日本語のwordnetは以下のリンクから取得できます: http://compling.hss.n
はじめに 日本語を弱らせるプログラム で類義語を取得する用があり、調べてみた結果WordNetを必要があるとわかったので、WordNetについて調べて見ました。 WordNetとは 日本語WordNetは、「日本語の概念辞書で、個々の概念が"synset"という単位にまとめられており、それらが他のsynsetと意味的に結びついている」ものです(by 提供サイト)。主な用途は類義語検索かと思います。そのほかの用途については要調査です。 WordNetはこちらにて提供されており、いくつか種類があるようですが、ここでは、 "Japanese Wordnet and English WordNet in an sqlite3 database" をのぞいてみます。 WordNetに含まれているテーブルは以下の11テーブル。 ancestor link_def pos_def sense synli
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く