1983年の商用版DOS対応版登場以降、マイクロソフトの標準搭載IME(MS IME)の登場など、様々なプラットフォームの変遷を生き抜き、日本語入力の分野で揺るぎない地位を占めているジャストシステム社の「ATOK」シリーズ。
近年、Mac OSのIME・ことえりは「愛/し/て/い/る」といったように言葉を最小単位まで解析する「形態素解析」に対応。さらに標準搭載IMEとの競争が厳しくなってきた中、今月3日に発表された「Google日本語入力」の登場によって、ATOKの存在意義が危うくなったのではないかという意見も聞かれる。
一方、仕事で文書を作成するプロユースの場合はATOKを優位と見る向きもある。Google日本語入力でサジェストされる候補に、一般に広まっている誤用も抽出されることや、校正機能の有無などが分かれ道となっている。
Google日本語入力により、これまでプレイヤーが固定されていたIMEに再び注目が集まり、2月に新バージョンを予定しているATOKが果たしてどのような一手を打ってくるのかに関心が集まっている。新バージョンのプロジェクトメンバーにさっそく話を聞いた。
「はてな村」など、ネットのフィルタリング効果は大切
―― Google日本語入力に対する「一手」という形となったATOK 2010ですが、バージョンアップのポイントについて聞かせてください。
井内 毎回のバージョンアップで行なっていることですが、やはり変換精度の維持・向上には注力しています。2010では特に同音異義語の処理精度の向上と、入力効率を改善しています。
カタカナ語で綴りを入力してしまった単語でも、正しく英単語として変換できるという機能を加えました。校正機能では、重ね言葉の指摘も強化しています。またウェブ連携の部分では、以前から備わっていたウェブ辞書「ATOKダイレクト」のユーザビリティを改善しました。
竹原 ATOKダイレクトは、はてなキーワードなどが提供するRSS配信のAPIを利用して、現在変換を行なっている文字列に対し、その結果をATOKの中でダイレクトに表示する機能です。
―― なるほど。ネット上の流行語などをローカルの辞書としてダウンロード提供する「はてなキーワード辞書」はどんな形で更新しているんですか?
竹原 辞書については、はてなさんから定期的にキーワードの提供を受け、それをこちらで辞書データに加工し、ATOKバリューアップサービスで公開するということをATOK 2007から行なっています。
―― 更新の頻度はどのくらいでしょうか?
竹原 はてなキーワード辞書については現在、年1回ですね。ジャストシステムが独自に収集し作成した、たとえば野球選手や漫画家の名前辞書などのデータは、ほぼ毎月何らかのテーマで提供しています。
佐藤 これは5年ほど前に提供して好評だった「2ちゃんねる用語辞書」以来続けている取り組みです。
―― はてなキーワード辞書はGoogle日本語入力のようなフレーズも含めた内容となっているのでしょうか? たとえば「ただしい」と打つと「ただしイケメンに限る」がサジェストされるといったことはあるのでしょうか?
竹原 現在のところ、フレーズは対象ではありません。単語単位となります。ただし、すでに「ただしイケメンに限る」ははてなキーワード辞書に含まれていますので、変換は普通に行なえます。
佐藤 実は私たちはいわゆる「はてな村」(はてなダイアリーを核とした文章を書くことが好きなコミュニティ)による、キーワードのフィルタリング効果にも期待している部分があります。ダイアリー内での出現頻度が高いものを辞書に反映しているのです。
―― なるほど、確かに検索ボックスに入力される文字列の出現頻度と、実際に文章を「書く」際のそれとは結果が異なってくるようにも思えます。