アカウント名:
パスワード:
実社会、物理社会では「⼤」(U+2F24)も「大」も紙に書き下したときの形が同じなら同じ文字なのに、コンピューター用に符号化されると別の文字という扱いになる。コンピューター用の文字は、言語というコンテキストが付与された、現実世界の文字の上位互換の概念なのか。さんざん言われているけど、文字って奥が深いな。
いわゆる藤田二コル問題 [itmedia.co.jp]ですね。
「ニ」は「仁」を仮名化した文字とはいえ、読みが同じなら日本語の慣用的には「に」の音には「二」と書くこともできるので、本質的には同一だと言えなくもない
漢数字の二とカタカナのニは形は同じだけど違う文字で、ひらがなのへとカタカナのヘもやっぱり違う文字。英語とドイツ語には、エスツェットとかドイツ語にしか現れない文字もあるけど、たいていは「同じ文字」を使っている。
ならば日本語の漢字と中国語の漢字も同じ文字は同じコードで表そうと試み、普及しているのがUnicodeのCJK統合漢字。ただ、日本語の漢字と中国語の漢字で「同じ文字」って何?それは何かの客観的な基準に基づいて定義されたものなの?とは思う。中国語を知らないのでよくわからないけど。
形が同じだから同じ文字ってのはやや乱暴なのでは。
BMP (基本多言語面) に納めようとして失敗した Unicode の負の遺産だね。その辺りの解消がない限り、日常の日本語の文脈では JIS X 0208 の…当面の仮のコンテナでしかない。
>漢数字の二とカタカナのニは形は同じだけど違う文字で、ひらがなのへとカタカナのヘもやっぱり違う文字。
物理的に印刷なり紙に書くなりして、本当に形が同じで見分けがつかないなら、それは同じ文字でしょう。いや、違う文字なのか。文字は単独ではどの文字なのか確定せず、漢数字の文脈、カタカナの文脈、どちらの文脈で書かれたかによって確定するのか。であれば、文脈関係なく単独の文字として、二/ニの形の文字が書かれた場合、それが何の文字であるのかは「不定」になるのか。
> 英語とドイツ語には、エスツェットとかドイツ語にしか現れない文字もあるけど、たいていは「同じ文字」を使っている。
「同じ文字」なのか?英語のA(エィ)と、ドイツ語のA(アー)は同じ形の別の文字ではないのか。コンピューター上の符号化の話じゃなくて、実世界での人間の認識の話ね。
> 「同じ文字」なのか?英語のA(エィ)と、ドイツ語のA(アー)は同じ形の別の文字ではないのか。これは、厳密なことは知らないなぁ。第二外国語としてドイツ語をごく簡単にやった上では、同じ文字と思って勉強していたので、そのように書いたのだが。ドイツ語のアーベーツェーデーエーエフゲー・・・はエスツェットが終わりの方に入ってくること以外は、順番も、大文字小文字の2種類があることも、個々の文字の大文字小文字の形も英語の文字と同じじゃないか。これは「同じ文字の定義は?」というもともとの疑問に結局帰着するのではないか。
例えば、数字の7、我が国では横棒と斜め線からなる(横棒の左側に垂直な短い縦線を書く人もいる)が、外国に行くと、斜め線に直交するように短い3画目(カタカナのヌみたいな)を書く形が広く使われている地域がある。日本ではその書き方をする人はめったにいない。形が違うが、やっぱり、同じ「数字のなな」と考えるだろう。やっぱり、「同じ文字とは?」ってなる。
田口さんは手書きだったらたろさんでもいいじゃん、ってこと?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
身近な人の偉大さは半減する -- あるアレゲ人
文字とは何なのか (スコア:0)
実社会、物理社会では「⼤」(U+2F24)も「大」も紙に書き下したときの形が同じなら同じ文字なのに、
コンピューター用に符号化されると別の文字という扱いになる。
コンピューター用の文字は、言語というコンテキストが付与された、現実世界の文字の上位互換の概念なのか。
さんざん言われているけど、文字って奥が深いな。
Re: (スコア:0)
いわゆる藤田二コル問題 [itmedia.co.jp]ですね。
Re: (スコア:0)
「ニ」は「仁」を仮名化した文字とはいえ、読みが同じなら日本語の慣用的には「に」の音には「二」と書くこともできるので、本質的には同一だと言えなくもない
Re: (スコア:0)
漢数字の二とカタカナのニは形は同じだけど違う文字で、ひらがなのへとカタカナのヘもやっぱり違う文字。
英語とドイツ語には、エスツェットとかドイツ語にしか現れない文字もあるけど、たいていは「同じ文字」を使っている。
ならば日本語の漢字と中国語の漢字も同じ文字は同じコードで表そうと試み、普及しているのがUnicodeのCJK統合漢字。
ただ、日本語の漢字と中国語の漢字で「同じ文字」って何?それは何かの客観的な基準に基づいて定義されたものなの?とは思う。中国語を知らないのでよくわからないけど。
形が同じだから同じ文字ってのはやや乱暴なのでは。
Re: (スコア:0)
BMP (基本多言語面) に納めようとして失敗した Unicode の負の遺産だね。
その辺りの解消がない限り、日常の日本語の文脈では JIS X 0208 の…当面の仮のコンテナでしかない。
Re: (スコア:0)
>漢数字の二とカタカナのニは形は同じだけど違う文字で、ひらがなのへとカタカナのヘもやっぱり違う文字。
物理的に印刷なり紙に書くなりして、本当に形が同じで見分けがつかないなら、それは同じ文字でしょう。
いや、違う文字なのか。
文字は単独ではどの文字なのか確定せず、漢数字の文脈、カタカナの文脈、どちらの文脈で書かれたかによって確定するのか。
であれば、文脈関係なく単独の文字として、二/ニの形の文字が書かれた場合、それが何の文字であるのかは「不定」になるのか。
> 英語とドイツ語には、エスツェットとかドイツ語にしか現れない文字もあるけど、たいていは「同じ文字」を使っている。
「同じ文字」なのか?英語のA(エィ)と、ドイツ語のA(アー)は同じ形の別の文字ではないのか。
コンピューター上の符号化の話じゃなくて、実世界での人間の認識の話ね。
Re: (スコア:0)
> 「同じ文字」なのか?英語のA(エィ)と、ドイツ語のA(アー)は同じ形の別の文字ではないのか。
これは、厳密なことは知らないなぁ。第
二外国語としてドイツ語をごく簡単にやった上では、同じ文字と思って勉強していたので、そのように書いたのだが。
ドイツ語のアーベーツェーデーエーエフゲー・・・はエスツェットが終わりの方に入ってくること以外は、順番も、大文字小文字の2種類があることも、個々の文字の大文字小文字の形も英語の文字と同じじゃないか。
これは「同じ文字の定義は?」というもともとの疑問に結局帰着するのではないか。
例えば、数字の7、我が国では横棒と斜め線からなる(横棒の左側に垂直な短い縦線を書く人もいる)が、外国に行くと、斜め線に直交するように短い3画目(カタカナのヌみたいな)を書く形が広く使われている地域がある。日本ではその書き方をする人はめったにいない。
形が違うが、やっぱり、同じ「数字のなな」と考えるだろう。やっぱり、「同じ文字とは?」ってなる。
Re: (スコア:0)
田口さんは手書きだったらたろさんでもいいじゃん、ってこと?