2015年度講義ノート
栗林ゆき絵
(10)簡易翻訳ツールを使ってみよう。--「自動(機械)翻訳のしくみ」(自動翻訳入門①)--
本日のポイント
- 自動翻訳の大まかな流れを知る。
- コンピュータによる翻訳のための辞書を作ってみる。
[1]機械翻訳(traducción automática, 英:machine translation)
機械翻訳 (自動翻訳とも)
コンピュータによる翻訳
人工知能(inteligencia artificial)の一つである自然言語処理(procesamiento de lenguaje natural)技術の一分野。
開発例・NICT(情報通信研究機構)
Mastarプロジェクト
⇒スマートフォン用音声翻訳アプリ、ダウンロードできるようです。¡Pruébate!
*(基本的=古典的な)機械翻訳の流れ .... 現在では様々な手法あり
入力文 (原言語 source language)
↓
形態素解析
↓
構文解析
↓
変換
↓
生成
↓
出力 (目的言語 target language)
[2]perlを使った簡易翻訳ツール
★以下は2012版。今年度の課題は授業中に指示します。★
本授業用簡易翻訳ツール....本来は上記のように構文解析、変換の後に、目的言語の「生成」(語尾の生成*、性数一致**など)を行うが、 このツールでは語順の変換までを行い、対訳を並べている。 (*食べる ない た ⇒食べなかった、** yo hablar ⇒yo hablo, mucho gente ⇒mucha genteなど)
参照する辞書は
dicsjforMT.txt
(←コピーペーストして使用可)。 単語追加の際もこの書式に準ずる(品詞はスペイン語、日本語訳語それぞれに付与してください)。⇒
品詞コード一覧
プログラムその1(最長一致法による形態素解析、対訳表示)
mt1.pl....対訳を画面に、形態素の辞書情報をファイルに出力。 [出力ファイル:outtaiyaku.txt]
ダウンロードはこちら
プログラムその2(解析と変換)
mt2.pl....形態素解析結果のファイルを読み込んで、文頭から順にスペイン語の品詞情報を参照し、 それに従って、対訳を適切な順序で訳出する。 [翻訳結果の出力ファイル : MToutput.txt](追加書き込み)
ダウンロードはこちら
[3]サンプル文で翻訳テスト
0.
Perlインタプリタ(簡易版)
を各自のフォルダinformaticaに保存
1.mt1.pl, mt2.plを各自のフォルダinformaticaに保存(上記リンクから)
2.辞書ファイルdicsjforMT.txtを各自のフォルダinformaticaに保存(上記リンクから)
3.西日翻訳を例文でテスト...
西日翻訳例文集
●まずは最初のサンプル文で動作確認。
●語頭の大文字は辞書にマッチしないので、全て小文字で入力してください。
(1) >perl mt1.pl [ENTER](形態素解析)
(*文末には必ず.(punto)か,(coma)を入れてください。)
(2) >perl mt2.pl [ENTER] (解析と変換)
4.最初のサンプル文の翻訳結果確認
5.
西日翻訳例文集
中の
[2辞書作成練習用例文][3辞書拡張用例文]
の文を、辞書を整備しつつ、翻訳テスト。
●まずmt1.pl, mt2.plで翻訳テストをしてみてください。その結果を見て対応を考えてみましょう。
[簡易翻訳ツールmt1.pl, mt2.pl使用に関する注意]
(2012.4.6現在)
★例文の入力時は、
固有名詞と「いいえ」のNoを除いて
「文頭は小文字」
で入力してください。
文末は常に「ピリオド(punto)」か「?」「!」(いずれも半角)
を入力してください。
★本翻訳ツールで用いる品詞は
「品詞コード一覧」
に従ってください。
⇒(
少々特殊なものもありますが指定されたコードに従うこと。
不明な点は質問してください!!)
⇒(実はルールベースの機械翻訳では「品詞の振り方」が動作を決定する要となります!!)
★コマンドプロンプトの起動等については
「講義ノート4」
参照。
* 上記の例文集の対応までは全員で行う予定です。
(課題は自由例文を各自で)
◇本日の課題
◎[予告]自由例文の翻訳テストの結果報告を、翻訳ツールの最終回に実施予定
[スペイン語情報処理HOME]
©Yukie Kuribayashi