文章記述能力
昨日の続き。
コメント欄が盛り上がっているようだが、なんだかなあぁ。あ、なんかだれかがここの URL を張ってますね。メチャクチャだというのならどうメチャクチャだというのか個別に指摘しないとまともな議論にはならないと思うんですけどね。
しかし IKeJI さんのコメントを見て StoryGenerator の一件を思い出した。まぁそれはどうでもいい。
とりあえず、UTF-8 と UTF-16 が混在する理由がよく分からない。だから、それを持って統一は無理とか言われてもなぁ、という感じである。
まぁ、実装に問題があるという話は確かにありうる。特に JISX 0213 で新たに追加された文字(Unicode 3.1, 3.2 で追加)は BMP*1 ではなく、SIP*2 に収録されているため、実装によっては対応されていないこともあるだろう。Python も --enable-unicode=ucs4 でビルドしないとまともに扱えない。
Windows ユーザの多くが UTF-8 のテキストを読むスキルがないという指摘も間違ってはいない。が、Mac OS X も UTF-8 になったし、各種 Linux Distribution も UTF-8 に移行しつつあるし、Windows XP 標準のメモ帳も UTF-8 のテキストは普通に読めるしで、実はあんまり問題になることもないんじゃないかと思う。
しかし、
特に、UTF-8 しかサポートしていないソフトで、JIS第3水準・第4水準の難読文字を入力すると、まったく漢字を扱えなくなる、という問題が生じることもある。(アプリが UTF-8 には対応していても、UTF-16BE,UTF-16LE,UTF-32 には対応していない場合。)
に対して、
同一ファイル内ではなく、複数のファイル複数のエンコードが混在する、ということ。それ以上の説明は省略します。
という説明はないよ。これを誤読だというなら何でもありだし、(知識のない人が)これを読めば誰だって UTF-8 より UTF-16/UTF-32 の方が扱える文字が多いと思うだろう。
まぁ、なにより事実誤認(もしくは誤解を与える表現)に対する指摘を揚げ足取りというメンタリティは正直理解できないところであるが。誤読がどうこう言う前に正確性を欠かない、誤解を招かない書き方をするという心がけはないものか。
あとまぁ、枝葉の話だけど
論理の初歩を教えておこう。AとBという集合があるとき、AとBの大きさだけを比較して、「AはBの上位にある(含む)」とは言えない。「AはBの上位にある」と言うためには、BのすべてがAの内部にある必要がある。その条件を満たさなければ、AがBの代用になることはない。
そういうのを論理とは言わない。