
@moji_memo 漢字Talk 6.0.7の外字は0xF040から0xF9FCまで(1,880字)だと思います。@ogwata
2013-05-15 11:59:20
相変わらずシフトJISについて調べているわけだが、先日の文字の学校で狩野さんから「『CJKV』第2版ではシフトJIS関連がばっさり削られているんですよね」との情報を得て、ひょっとしたらと一番最初の版『日本語情報処理』(1995年、ソフトバンク)を見てみたら、これが一番詳しい!
2013-05-23 22:08:51
さすが1995年の本だけあって、ベンダーごとの実装差は必要不可欠。新しい版が出たらかといって、古い版を捨てなくてよかった…と書いたところで、Facebook経由で安岡さん曰く「でもミスも多い!」だそうです。しょぼん。
2013-05-23 22:12:38
そうか、EPSONの98互換機は単純にJIS83だと思っていたけど、符号化文字集合としては78JISにJIS83の追加分を加え、レパートリにJIS83例示字体を採用というややこしい実装なのね。つまりJIS83における追加はサポートするが、入れ替えはサポートしてない。
2013-05-24 18:34:45
ただし、JIS83における符号位置の入れ替えのうち、伝統的な字体を略字体に入れ換え、入れ換えられた字を別区点に追加した4組についてはJIS83準拠。まあ現実的だけどね。
2013-05-24 18:38:33
先のエプソン98互換機のツィート、1993年『EPSON PCシステム・ガイド』クリエイト・クルーズの文言、〈EPSON PC シリーズのコード体系は基本的に旧JIS(JISC6226)にしたがっている。〉に引きずられたが、要するに「22組の入れ替え以外はJIS83」ということ。
2013-05-24 23:47:45
まあ、どっちつかずの折衷的、でも現実的な実装ではある。しかし、シフトJISの実装って調べるほど面白いなあ。当時のエンジニアには地獄だったろうけど。
2013-05-24 23:49:35
この「EPSON PC システム・ガイド」という本は、巻頭の推薦文をエプソンが書いている。副題も「100万人EPSONユーザーのためのオフィシャル・データブック」だから、信頼性が高いように思える。でも間違いはある。
2013-05-25 00:21:58
p.301 「新JISで字体を変更した漢字」での間違い。「稽」のつもり→ http://t.co/yWsUNhG08r どういう字体なのかなあ。
2013-05-25 00:23:54
p.302 「新JISで字体を変更した漢字」新旧字体を比較しているんだが、どうも同じ字っぽい。 http://t.co/Is8PjD1V0d
2013-05-25 00:31:30
p.302 「新JISで字体を変更した漢字」どうも字体の解釈を間違っているっぽい。 http://t.co/qsrYphIryy 「最終画が離れる」と解釈したみたいだが、そうではなくて、「免」のうち「口」の内部から足が生えるか、外部からかの違い(書くのがむずかしいw)。
2013-05-25 00:38:54
p.303 「新JISで字体を変更した漢字」これはどこが違うというのか。 http://t.co/8vfD7reUbd というか、そもそもJISコード 613A(区点65-25)は例示字体を変更されてないと思うけど。
2013-05-25 00:51:29
こんなものかな。まあ、1993年の本とはいえね…。やはり字体を扱うと、どうしても間違いはでるので、プリンタの出力をそのまま印刷というのは、やはり見識ではあるのだろう。
2013-05-25 00:58:46
どなたか、「NEC特殊文字」「NEC選定IBM拡張文字」「IBM拡張文字」などの語の初出、典拠をご存知ないでしょうか? 少なくとも日本アイ・ビー・エム『漢字コード一覧表』(1987年)には「IBM拡張文字」の語は見えません。どこの誰が最初に使ったのか。
2013-05-28 18:00:53
「NEC特殊文字」「NEC選定IBM拡張文字」「IBM拡張文字」等の初出の件、安岡さんがFacebookで「私が最初にその文字列を見たのは、Windows NT3.1J 日本語マニュアルの末尾だったような…。」とコメントくれた。
2013-05-28 21:18:51
返答。〈お答え、ありがとうございます。IBMとNECの外字を呼び分ける必要が生じたのは、1993年のWindows 3.1Jのはずなので、このあたりかなあと当たりをつけていたんですが、なるほど、1994年のNT3.1J ですか。Windows 3.1Jで見た覚えはありません?〉
2013-05-28 21:19:24
@ogwata Windows 3.1 の外字周りのコードを書かれた 川俣 晶さん曰く「 むむ。難しい話ですね。おそらく、IBMではなく互換機メーカーが使ったのではないでしょうか。」だそうです。
2013-05-28 21:40:31
関連した疑問。「NEC選定IBM拡張文字」という語はIBMが先行していたことを示唆しているが、IBM最初の日本語パソコンは1983年3月発表のマルチステーション5550。他方でNECの初代PC-9801は1982年10月発売。つまりNECの方が先。5550より先があったのかな?
2013-05-28 21:44:12
まあ、元を辿れば大型機の文字セットということになるのでしょうけれど。このあたり、本当は大型機だけでなく、日本語専用ワープロの実装も丹念に調べないといけないのだろうけど。
2013-05-28 21:45:59
@sakamotoh ありがとうございます。互換機メーカーって、1Compaqなどのことでしょうか? DOS/Vの普及が背景になり、Windows 3.1Jで各社の外字を統一する必要ができた、という動きをイメージしていたのですが…。
2013-05-28 21:55:50