Showing posts with label IME. Show all posts
Showing posts with label IME. Show all posts

2011-03-04

Google 日本語入力 TechTalk の資料公開

2010-10-23 (土)、Google 主催による「Google 日本語入力 TechTalk」が開かれた。その資料 (スライドと公演のビデオ) が Google Japan ブログ上で公開されている。

特に「Mazc コードリーディング」のスライドとビデオが良い。この公演は説明が早くて、その場に居ても追いきれなかった。こうやって資料を公開してもらえると自分のペースでコードを追えるので、非常に参考になる。開発に興味を持っている人には、Must See でせう。

ref

ぼくの過去記事は下記の通り:

2010-11-10

Google 日本語入力 TechTalk 2010 まとめ at Togetter

半分自分用のブックマーク。2010-10-23 (土) に、Google が主催する「Google 日本語入力 TechTalk」が開催された。その時の Twitter のログが Togetter にまとめられている。

日本語入力 TechTalk については、まとめメモをブログのエントリーにしようと思っていたけれど、前半は公式マンガにまとめられているし、後半は話を追うのに精一杯だったのでまともにメモをとれていない。そもそも、コードレビューを全部メモするってのが無茶な試みだった。

その点 Twitter の呟きは要点がまとまっている。ポイントとなる用語だけしか出てないこともあるけれど、それは自分で調べればいい (恥ずかしいことに、自分のメモにはその用語すら書ききれてなかったりしたし)。あと、会場の雰囲気が伝わり易いのも Twitter のよい所だと思う。

というわけで、メモをブログにまとめることはやめて、Togetter のリンクを残すだけにした。

ちなみに、ぼくのプレゼン資料はエントリーにまとめてあるので、興味のある方はそちらもどうぞ。

2010-11-01

十万円ほどの PC が欲しいと言われて困った

先日、twitter 友達とのツイートして思ったこと。別に批判とか意見ではなく、そのツイートで考えたことをつらつらとメモ書きしてみるだけ。

発端

始まりのツイートはこう始まった。「友人から10万程度でおすすめのパソコン聞かれた。」

その後、「(友人の) 友人は素人さん」「Windows を使っている」「(友人の) 友人の友人も使うことがある」「Mac 移行は大変 (アプリも使えなくなるし) & 取説が不親切」等々、色々と条件が出てきた。

こういう場合、大きく分けて 3 つの選択肢があると思う。そして、どれも一長一短で最良のものがないなぁ、というのが本エントリーの結論。

選択肢について

  1. メーカー製の Windows PC を買う
  2. ショップメイド (通販・Dell 含む) で Windows PC を買う
  3. Mac に移行する (今なら MacBook Air が魅力的ね)

以下、各々の選択肢について長所・短所を書いてゆく。

メーカー製

長所は安心感。安定している。壊れにくい。サポートがしっかりしている。そういった「安心感」がウリ。あと、実際に売り場で触れる安心感も大きい。PC に詳しい人を連れていければ尚よし。

短所は、上に挙げた「安心感」が幻想に近いこと。特に十万円台ともなると、メーカー製といえども変な部品を使っていることがある。ぼくは NEC、富士通、Sony の PC で痛い目に遭った。他のメーカーが良いわけじゃない。単に使ったことがないだけ。きっと他のメーカーも五十歩百歩と考えている。

メーカー製 PC で出会った不具合は下記の通り:

  • 1 年の間に 5 回近くハードディスクがクラッシュした
  • Linux に移行したら X が起動しなかった (某シリーズの後期 3 モデルだけかなり特殊なグラフィック・チップを使っていて、そのうちの一モデルを買っていた)
  • ディスプレーの使い回しが出来なかった (ディスプレーを次の PC でも使い回そうとしたら、ディスプレー・ケーブルと電源ケーブルがセットになっていた)
  • Windows の OS をバージョン・アップしたら Mathematica と競合を起こして止まった (クリーン・インストールが必要になった)
  • Windows OS のサービス・パックのバージョンを上げたら、音が鳴らなくなった (サウンド・チップのメーカーが倒産? してて、新サービス・パック用のデバイス・ドライバーが提供されていなかった)
  • Microsoft Office を再インストールできなかった

最後の Office の件は話が少し長くなる。一つ前の項目で「音が鳴らなくなった」ので、OS をダウングレードさせるべく OS の再インストールを行なった。そこで Office をバックアップ CD-ROM からインストールしようとしたところ、ディスクが不良品だった。当然 Office のインストールは出来なかった。メーカーのサポート・センターに連絡したところ、5 年以上も古いモデルだったもので「Office のバックアップ CD-ROM」の在庫がないと返された。どうしようもないので、今、その PC に Microsoft Office は入っていない (そのお金は新しい PC を買うためにとってある)。

と、このやうに、メーカー製の PC と雖もサポートは完璧ではない。むしろ、宜伝費や (ほとんど使わない) デフォルト・インストール・アプリ、各々のメーカーの「色」を出すための特殊仕様のために、同価格のショップ・メイド PC よりも安定性は劣るのではないかと思う。

ショップ・メイド

Dell を最大手として、ぼくがで静音 PC を買うのに使った OLIOSPEC のように小さなショップまである。基本 BTO。そこが長所。どの部品を使うのか自分で決められる。メーカー製のやうにわけの分からないチップを使われる心配がない。少し知識があれば、安定性で定評のある部品を使って PC を組むことができる。

短所は「不安感」。サポートは最小だし、PC の知識は必須。初心者一人に買わせるのは、無茶を通り越して無謀。ショップ・メイドを利用する場合は、最低でも一回はショップ・メイド PC を買ったことのある人間が購入者をサポートする必要がある。それも、困ったと言われた時にすぐ行ける距離に居られること。

ぼくは実家の PC を最初ショップ・メイドにしようと思ったが、実家まで新幹線で 2 時間かかるので諦めた。というより、帰省しないとサポートしてくれないような PC は買いたくない、と親に拒否された。

一度、動き出せば下手なメーカー製より安心できるのだけど、購入者の心理的障壁はとても高い。

マック

初めて PC を買う人間には、Mac が一番良いと思う。OS と PC の両方作っているから、安定性が高い。OS のバージョン・アップでデバドラが云々という不具合など絶対に起こさない。とにかく作りが素直。電話サポートの質も非常に高い。取説が不親切という説もあるが、それは Windows に慣れているからで、初めて Windows と Mac の両方を使うことになったら、どちらも大した差はないと思う。

閑話休題

Windows から移行する場合の話をしているんだった。話を戻そう。

Windows から Mac に移行する時の障壁は、大きく分けて 3 つある。

  1. Mac の使い方を勉強しないといけない (少くとも Windows で出来たことは全部できるようになりたい)
  2. Windows 用に買ったアプリが無駄になる
  3. 日本語入力が賢くない

一点目については、Mac 使いのサポートが必要になるでせう。Windows に出来て Mac に出来ないことはない (少くとも素人レベルでは) ので、最初の数日教えてあげれば移行はスムーズになると思われる。

二点目はとても痛い問題だけれども、素人レベルであれば乗り越えられる壁だと思う。昨今、ウェブ・サービスとフリー・ソフトの台頭が目覚ましく代替手段が増えた。Microsoft Office には Google Docs や Open Office。写真管理には iPhoto を使っても良いし、Picasa をダウンロードしてもいい。ウェブ・ブラウザーにおいて Mac でリリースされていないのは、(メジャーどころでは) Internet Explorer だけ。むしろ、ここは Safari, Google Chrome, Firefox へ移行してもらった方がセキュリティー的にも安全かつ健全。あと必要なのは年賀状ソフト位いかな? これは買い替えるしかないかもしれない。

Mathematica、Photoshop、Microsoft Visual Studio のやうに一万円、下手すると十万円を越えるソフトウェアをインストールしている人は... いや、もう素人というレベルじゃないよね。

三点目。Google 日本語入力を使いませう。

Windows から Mac への移行は素人にとってもそれほど大変ではないと思う。けれど、それには Mac 使いが最低一人サポートに入ることが前提。

ちなみに、来年、Lion が出るあたりに実家の PC を Mac にしやうと計画している。ぼくの親が無事、Mac へ移行できるかその顛末をエントリーにしたいと考えている。

あとがき

「素人」と「十万円台」という条件で PC を買い替えやうとすると、誰もが安心できる商品がない。近くに居てすぐサポートにかけつけられるなら、ショップメイドや Mac が良いと思う。でも、そうじゃない場合、どこかに不本意な思いを残しながらメーカー製 PC を選ぶか、「これがイイよ!」と言いながら(でも、貴方は後で泣くほど苦労するけどね)と心の中で呟くことになる。

というわけで、最初に書いた結論に至る。「どれも一長一短で最良のものがないなぁ」。

2010-10-24

「日本語入力 T-Code のススメ」〜 Google 日本語入力 TechTalk ライトニングトーク

2010-10-23 (土) に、Google が主催する「Google 日本語入力 TechTalk」に参加した。

そして、飛び入りでライトニング・トークをやってきた。5 分ほどのライトニング・トークだったけど、発表資料と質問の答えをエントリーにしておく。

T-Code って何?

T-Code は、いきなり漢字を直接入力する日本語入力。漢字変換の必要がない。

その入力する様はまるで「ルパン三世のタイトル入力」のように見える。

補足説明

ぼくらは英語入力をする時、26 のアルファベットと 10 の数字、あと少しの記号の位置を記憶して入力を行なっている。つまり、「a」という文字を打つには「a」というキーがどこにあるかを憶えていて、その対応関係を思い出して「入力」を行なっている (タッチタイプするほとんどの人は、もう反射の域に達しているでせう)。

キーの数は 40 ちょっと (26 + 10 + 記号が少し)。余分な記号は削って、ここではキーの数は 40 とする。

さて、ここで発想の転換。キーを 2 打うつ組み合わせは、40 x 40 = 1,600。この 1600 の組み合わせ一つ一つに文字 (漢字) を割り当てて、その組み合わせを全部覚えてしまったらいいんじゃないか? これが T-Code。

実際は、ユーザー用領域や特殊キーがあって、割り当てられている漢字は 1200 程。

ぼくはそのうち、約 800 を憶えているが、自分のブログでチェックすると 95% の文字はこの 800 字だけで入力できている。

では残り 5% はどうするか? T-Code は 2 つの方式を用意している。部首合成変換と交ぜ書き変換の二つ。

合成

例えば、「仏」という文字を入力したいとする。

この場合、「jf」と入力してから「イ」と「ム」を入力する。すると「イ」と「ム」が合成されて「仏」という文字になる。

「jf」の 2 ストロークは、部首合成変換を始めるプレフィックス。読みが分からなくても、似た漢字を知っていたら「合成」で漢字を作れてしまうのが利点。

交ぜ書き変換

一つ有名な文章を入力しませう。

記者が汽車で貴社に帰社した

この入力は次のように行なう。

記者がき車 fj でき社 fj に帰社した

「fj」の 2 ストロークで交ぜ書き入力を行なう。注目すべきは、この時、変換候補が一つも現れないこと。例えば、「き車」という入力に対して結果は「汽車」しかないので変換候補は一つも現れない。

「貴社」と「帰社」の場合は少し複雑。普通に「き社」を変換しようとすると、「記者」や「汽車」は変換候補に現れないけれど「貴社」と「帰社」は変換候補に現れる。ユーザーはたった 2 つの候補の中から、自分が入力したい漢字を選ぶ。ただ、幸いなことにぼくは「帰」という漢字を憶えていた。T-Code には、憶えた漢字を「交ぜ書き変換辞書」から削除する機能がある。そこでぼくは「帰」という漢字を辞書から削除した。そういうわけで、「き社」の入力に対して変換候補は一つだけ「貴社」に絞られる。一つだけなので変換候補ウィンドウは現れなかった。

このように、変換候補の数を減らしていけるのが交ぜ書き変換の良いところ。

質問・その他

T-Code を始めたきっかけは?

1998 年頃か? 当時、ぼくは ATOK を使っていた。その頃の ATOK はこんな変換をした (口語モードにしたのに!!)

○○なんだ世

この語尾を修正するのが、たまらなく苦痛だった。そこで出会ったのが SKK だった。

極めるととともに、小指がつった。

他の入力方式を探した。そして T-Code に出会った。

T-Code を選んだ理由は?

T-Code のやうに直接漢字を入力できる方式は T-Code だけではない。他にも数多くある。例えば、ひらがな入力だけは普通と同じにして、余った部分に漢字を割り当てる方式など。そう。誰でも考える。漢字直接入力方式は敷居が高すぎる。

その中にあって、T-Code は一つ異色だった。

T-Code は東京大学理学部情報科学科山田研究室で開発された。新聞のデータを集め単語の出現確率を求めた。(どうやってか知らないけれど) 2 打鍵入力する際の効率表を得た。その 2 つを組み合わせて T-Code の配列は決まった。

元は (新聞社なんかの) コピーライター向けの研究だったという。記者の手書きの原稿を電子データにする職業ね。海外のコピーライターは、仕事に携わる前に 400 時間の研修時間を持つ。ならば、日本でも同じように研修時間を取るべきである。T-Code はそういうプロのための研究であり、入力手法だった。だから、素人が手を出すなんて想定していなかった。ある意味、ストイックな入力方式だった。

そのストイックさに惚れた。

憶えるのは大変ではないか?

Emacs 用の T-Code パッケージには、EELLL という練習用プログラムが付いてくる。

まず、3 単語「の」と「が」と「、」の入力位置が表示され、練習用文章が表示される。これをクリアすると、次のレッスンに進むかと聞かれる。十分、入力位置を憶えたと思ったら次のレッスンに進む。新しい単語 (と古い単語) による練習用文章が現れる。こうやって、まずはひらがなを覚える。

レッスンを続ければ全ての漢字を憶えることができるけど、一まず「ひらがな」まで憶えれば十分。「ひらがな→カタカナ」変換と「交ぜ書き変換」を使って最低限の入力は出来るやうになる。

後は、少しずつ良く使う漢字の位置を憶えていく。漢字の位置を憶えると、交ぜ書き変換辞書から (手動で) 漢字を削除できるので、交ぜ書き変換の変換候補が少なくなって変換効率が上がる。すると、楽しくなってどんどん漢字を憶えたくなる。

T-Code は速いのか?

十分に訓練された人間が、新聞のコピーライトに使う分には最強だと思う。しかし、そんな人間が一体何人いるかしらん?

もう少し現実的に、一般人がコピーライトする場合。対象が新聞なら最速に近いと思う。ただし、対象が小説だと疑問。元データが「新聞」なので、新聞によく現れる「殺(人事件)」「(東)芝」「渋(谷)」といった文字が比較的打ち易い場所に配置されている。一方、新聞では絶対に現れない一人称「僕」は T-Code のコード表に存在すらしない。交ぜ書き変換で入力するしかない。それでも、単語頻度が大きく変わることはないので、十分速いと思う。

更につっこんで、コピーライトの需要はあるのか? ほとんどの人は自分で考えた文章を入力するのに「日本語入力」を使うでせう。その場合、タイピング・スピードだけなら Google 日本語入力を始めとした「日本語変換系」の方が速い。なんせ、どんな漢字を打つか考えないで良いんだから。だけど、そこから、変換候補を選ぶのに時間がかかる。頭も使う。一方、T-Code は入力時に「どの漢字を使うか」も一緒に考えて入力する。これはノートに文字を書くのと同じ感覚。特に T-Code を使い始めると、「日本語をちゃんと正確に入力したい」という誘惑が強くなる。「遇う」と「遭う」は使い分けたい。「会う」と「逢う」も使い分けたい。といった感じ。ここら辺で時間をロスしているやうに思う。

少し話しを極端にして、Google 日本語入力と T-Code を両方「極めた」としませう。この場合、どちらが文章を書くのが早いか? きっとスピードは同じ。入力速度 (手の早さ) よりも、文章を考える時間 (頭の早さ) の方がボトルネックになる。どんなに速く入力できる人間も、自分が考えるより速く入力は出来ない。

話しを戻して、現実的な話。ブログなんかを書くんなら、T-Code より Google 日本語入力の方が速いかもしれない。ただし代償はある。「変換候補を選ぶ」という作業。これはかなり頭を使う。T-Code を使っている時は交ぜ書き変換を使うにしても「変換候補が少なくて楽だな」と感じたことはなかったのだけど、ATOK に戻ったとたん「変換候補を選ぶ」だけでえらく疲れた。一度、T-Code の「直接入力」に慣れると、変換の煩わしさには堪え難い。

まとめると、(ある程度の域に達したことを前提に) 普通に文章を書くのであれば T-Code も Google 日本語入力も大きな差はない。ただし、T-Code の方が「楽」。

入力スピード・蛇足

入力スピードに興味のある方は、日本語入力だけでなく英語配列においても関心があることと思う。そういう方は、安岡氏の「キーボード配列 QWERTY の謎」がお勧め。詳細はレビュー記事をどうぞ。

開発は止まっているか?

T-Code の開発ページはこちら。

Unicode 化されていない Emacs で動く tc-2.3.1 が公開中。

ただ、ここ一、二年忙しくって体を壊した

当てなきゃいけない色んなパッチがあるし、Unicode 版 Emacs で動くかテストもしなくちゃいけない。課題は山積みだけど、もう少しお待ち下さい。

T-Code のローマ字テーブルファイルはまだかっ

ローマ字テーブルはインポート・エクスポートできるみたいなので、t-codeのローマ字テーブルファイルはまだかっ!!

Twitter より引用

えっと。頑張る。

あとがき

今回、Google 日本語入力 TechTalk に申し込んだ時は、まさか自分が LT をすることになるなんて思ってもみなかった。それが場の勢いに乗せられて、飛び入り参加。実は初 LT。

資料の用意もないし、講演は聞かなくちゃいけないし、でも話す内容はまとめなきゃだし。もう大変。そして、たった四行のプレゼン資料が出来上がった。時間配分も計からずに、LT 本番に突入。でも、何かウケが取れてたようなので良かった。時間ピッタリ (?) だったのは奇跡だね。

懇親会では三人の方から質問を受けることができて感無量。

それから、MacBook 用に DVI-D-sub 変換アダプタを買ったなんてエントリーを書いておきながら、持っていかなかった自分を反省。いや、まさか LT するなんて自分ですら知らなかったから。。。ええ、人生何が起きるか分からないので、まさかの準備はしておくべきですね。変換アダプターを貸して下さった方、直接お礼を言う機会がありませんでしたが、ありがとうございます。

2009-12-04

Google 日本語入力 (ベータ) リリース

Google が日本語入力ソフト (IME) をリリースした。

対応 OS は、Windows 7, Vista SP1, XP SP2 以降と MacOS X 10.5 以降。Linux は未対応。繰り返す。Linux は未対応。

上記ダウンロードページから「Google 日本語入力」をダウンロードして、あとは普通のアプリを入れるのと同じやうにダブル・クリックすればインストール・ウィザードが始まる。

特徴

手元にある MacBook にさっそくインストールしてみた。ぼくの MacBook は英語配列なので Command + Shift で入力を切り替える。

Google 日本語入力を最初に触ってみての印象は...

  • 軽快
  • オフラインでも動作する
  • 予測入力機能がハンパない

IME といふものは、使ってみて変換精度の差に驚くのが普通の反応。今回の Google 日本語入力は、予測入力 (彼らはサジェスト入力と呼んでいる) でぼくの度肝を抜いた。例えば、「こんしゅう」と入力すると「サジェスト」として「今週妻が浮気します (同名のスレ、書籍、テレビドラマが有名)」が現れる。「けいたいそ」と入れると「形態素解析」がサジェストされる。専門用語にも強い。

変換精度は使い込んでみないと何とも言えないけれど、遊びで一週間入れてみる価値はありそう。

落ち穂拾い

Google 日本語入力はデフォールトで、「ひらがな」「カタカナ」「半角カナ」「全角英数」「英数」の 5 つの入力メソッドを用意する。ぼくは「ひらがな」だけで十分だったので、それ以外は一時的に利用をオフにした。設定は、Mac の「設定画面」から「言語とテキスト > 入力ソース」から行なうことができる。

工藤氏と小松氏

Google Japan Blog によると、本 IME は工藤氏と小松氏の 20% タイムの成果物とのこと。Google には (Yahoo! にもだけど)、日本語処理に関わるエキスパートが何人もいる。それは、「検索エンジン」のバックグラウンドで日本語処理の大学院クラス以上の技術・知識がどうしても必要になってしまうから。

工藤氏は形態素解析エンジン MeCab の開発者として知られる。ぼくにとっては、Ajax IME の作者という印象が強いかな。一方の小松氏は予測入力システム PRIME の開発者として有名。どちらも、日本語処理に精通していないと作れないソフトウェアであり、ソフトウェアの完成度としても非常に高い。

ちなみに、工藤氏はぼくが Google 新卒採用の面談で 2 人目の面談者となった方だった。その時から Google には恐ろしい人が居ると思っていた。何かあれば、日本語入力メソッドなんかポンと作ってしまうんじゃないかと思ってた。その思いは当たるもので、今回、開発のきっかけとなった二人のうち一人が工藤氏と聞いてとても嬉しい。

2009-10-22

Android の Open Wnn フリック対応版を入れてみた

Google Chrome 一周年記念パーティーにて、同じく HT-03A を持ってる方と歓談する機会を得て、「Android の OpenWnn フリック対応版が神アプリなんですよ」と猛プッシュされた。それなら、ぼくがエントリー書きますよ... と言って少々時間が空いてしまったけれども。まずはインストール方法から

インストール方法

  1. Home 画面で「Menu」キーを押して「設定」をタップ
  2. 「地域 > 設定/言語&字文入力」から「JapaneseIME」を ON に設定する

IME の変更方法

  1. テキストボックスで長押しすると、「テキストを編集」というダイアログ・ボックスが現れる
  2. 「入力方法」をタップ
  3. 「Japanese IME」を選択する

iPhone ユーザー的な設定

ここいらをチェックしておくと、iPhone っぽい動作になって、iPhone ユーザーは移行しやすいと思われる。

以下、設定のポイント:

  • トグル入力機能にチェック
  • 「英字 QWERTY キーボード」を「常に自動切り替え」に選択
  • 「数字 QWERTY キーボード」を「常に自動切り替え」に選択

iPhone との比較

フリック単体としての動きは、iPhone とそっくり。iPhone 使いのぼくとしては、HT-03A のデフォールトの入力方式には戻れないと思った。

OpenWnn 版の素晴らしい点を列挙しやう

  • 入力がスムーズ (iPhone 3G はもたつく。3GS はどうか知らないけど)
  • 変換候補の出がはやい (2〜3 文字入力するだけで、すぐに変換候補が現れる: iPhone はもう少し入力しないと候補が現れないことが多い)
  • 変換候補が多い (iPhone が一行しか変換候補を出さないのに対して、OpenWnn 版は 2 行で候補を出す)

とにかく入力がスムーズになるのが大きい。

iPhone ユーザーが一番苦しむのは、「変換候補」の表示位置が iPhone と OpenWnn 版で違うところ位いではないかな?

最後に iPhone 版の良い点も書いておく:

  • 画面が大きい
  • 静電式でタッチが軽くても反応する
  • キーボードの見せ方がスマート (色使いとか、アニメーションとかね)

もし、HT-03A の購入を「フリック入力がないから」というだけでためらっているのなら、「OpenWnn フリック対応版で解決だよ」、と強く主張できる。それ程に質が高い。

2006-11-12

Sumibi のデモ・ムービー

Ajax で動作する日本語入力 Sumibi.org。このデモ・ムービーがあることを知った (気がつかなかった。何時出来たんでせう。最近かな?)

「Sumibi の使い方を入力している画面」をデモ・ムービーにしている。このムービーを見れば (読めば)、Sumibi の使い方が一発で分かる。Sumibi の使い方が、clmemo@aka の説明じゃ分からなかった、という方は是非ご覧あれ。

アニメーション GIF

Sumibi のデモ・ムービーは、アニメーション GIF で作られている。なので、YouTube や Google Video のビデオのやうに Flash を必要としない。基本的にどんなマシンでも見られる。

そもそも、Sumibi は海外出張 etc... で日本語 IM の入ってない他人の PC を使う時に重宝されてる日本語入力。だから、Sumibi を使う状況では、マシンのインストール権限がない場合もあるでせう (他人のマシンに勝手にソフトをインストールするのって気が引けるものね)。その点、アニメーション GIF ならどんなブラウザーでもサポートされてる。デモ・ムービーとしては、この配慮は親切なのではないかな。

それにしても、スクリーン・ショットを繋げてアニメーション GIF にすれば、デモ・ムービーとしては十分なんて、どうやって思いついたんでせう。スゴイ。

2006-10-29

Sumibi.org でアルファベット・ひらがな・カタカナを指定して入力する Tips

Sumibi.org の Nishiyama さんが jus 関西で購演するというので、京都女子大に行って来た。

Sumibi.org Sumibi.org というのは、Ajax で動作する日本語入力 (IME)。海外旅行や海外出張で、日本語入力環境のない PC を使う羽目になった場合でも、ブラウザーさえ動けば日本語が入力できるというもの。海外出張先の PC から、mixi やブログの更新をする人達に使われているらしい。海外の図書館で、日本語の検索が必要になった時なんかにも更利とか。

使い方は簡単。Sumibi.org

にアクセス。文節をスペース区切りで入力する。

例えば、「僕はブロガーの卵です」という文章は

boku ha buroga- no tamago desu

という風に入力する。漢字変換候補が現れるので、調整。よければ「確定」ボタンを押す。

ひらがな・カタカナ指定

Nishiyama さんから教えてもらった Tips を紹介しませう。それは、入力語を強制的に「ひらがな」「カタカナ」にする方法。上の例文の「boku (ぼく)」を例に説明しませう。

「boku (ぼく)」の候補は「木」「目」「僕」... となってて、カタカナの「ボク」は候補の 4 つ目に、ひらがなの「ぼく」は 6 つ目に現れる。そこで、文節の最後に「.k」「.h」を付ける。すると第一候補が各々「カタカナ」「ひらがな」になる。

つまり、入力は次のやうになる

boku.h ha buroga- no tamago desu
(ぼくはブロガーの卵です)

boku.k ha buroga- no tamago desu
(ボクはブロガーの卵です)

※括弧の中は、第一候補を繋ぎ合わせて文章を作った例。

アルファベット指定

Sumibi を使うと、アルファベットのままで入力したいものが日本語に変換されてしまうことがある。例えば、「sumibi wo tsukau (sumibi を使う)」という文章。変換すると、「sumibi」が「炭火」になる。ここはアルファベットのままにしたい。

そういう場合、文節の最後に「.l」を追加する。つまり、こんな感じ。

sumibi.l wo tsukau

あとがき

この Tips は、Sumibi の FAQ ページに紹介されている。

でも、気付いてる人は少ないと思うし、「.k」みたいな形で「カタカナ」指定する新規性にびっくりしたので取り上げた。

ref