UTF-8小話

UTF-8はWikipediaに書かれている通り、

当初は、Plan 9で用いるエンコードとしてベル研究所で考案された。

ものだけど、最近古本屋で見つけた「インターネットヒストリー」の村井純先生のあとがきに気になる記述があった。
ちょっと長くなるけど引用する。

かなり昔の話だが、ベル研のUNIXを作ったオペレーティングシステムを担当していたグループにオペレーティングシステムについての講演を頼まれたときに「日本語」の話をしたことがある。正直にいうと、ケン・トンプソンやデニスリッチなど、コンピュータ界のノーベル賞といわれるチューリング賞をとった錚々たるメンバーを前にして、当時「ただの研究者」であった自分がオペレーティングシステムについて何を話したらよいのだろうと悩んでしまった。結局開き直って話すことにしたのが漢字の問題だったわけだ。しかし、このときの講演の内容が、彼らにとっては1バイト1文字という「彼らの常識(UNIX記述言語のC言語では、8bitの領域をcharと呼ぶひどさ!)」を覆すことになり、UNIXの国際化が進むことになった。私はその1年後にまた彼らに招かれたのだが、その時に気づいたのは、それ以降の半年間というもの、デニスリッチはビットマップに漢字を出す研究しかしていたかったということだ。好きなことをやらしてくれるベル研の環境にも感心したが、それだけ「マルチバイト文字」というのは彼らにとっても興味を持続するに値するほどのまったく新しい概念だったようだ。

なかなかすごいシチュエーションだけど、この出会いがなければUTF-8が生まれることもなかったのだろうか?
ちなみにISO-2022-JPを発案したのは村井先生。

あわせて読みたい:

(追記:2008-10-08)かなりブックマークされていてびっくり。Plan9がらみってことで無理矢理このエピソードを紹介したけど、「インターネットヒストリー」は良書なので、インターネットの歴史に興味ある人は一読をお勧めする。ちなみにちょっと前に出会った人がインタビューイとして出てきて、あのおじさんはそんなにすごい人だったんだと驚いた。

インターネットヒストリー―オープンソース革命の起源

インターネットヒストリー―オープンソース革命の起源