本当にあった紛らわしい文字
この記事は「文を紡ぎ編む人たちの Advent Calendar 2022」の3日目です。
先日、ポケモン公式ツイッターアカウントで、誤字の詫び訂がありました。
藤田ニコルさんのお名前の記載に誤りがございました。
— ポケモン公式ツイッター (@Pokemon_cojp) November 28, 2022
誤:藤田二コルさん
正:藤田ニコルさん
お詫びして訂正させていただきます。
こういう文字を目視で見分けるのって難しいですよね。
ここでは、私が実際に遭遇した、目で見つけにくい誤字の例を挙げてみます。ありがちなネタですが、日本語テキストを扱う人あるある、ぐらいのつもりでお読みいただければ幸いです。
「山」と「⼭」
前者が普通にmountainの意味で使う「山」、後者は康煕部首の文字です。Unicodeでいうと、前者がU+5C71、後者がU+2F2Dです。
詳しいことはわかりませんが、康煕部首というのはUnicodeで部首を表すための特殊な文字だそうです。
ググってみると、PDF化したときに置きかわることがあるという話がいくつか見つかりますが、なぜPDFじゃない文書に入っていたかはわかりません。
「竜」と「⻯」
前者が普通にdragonの意味で使う「竜」(U+7ADC)、後者はCJK部首補助の文字(U+2EEF)です。
CJK部首補助というのも、Unicodeで部首を表すための特殊な文字だそうです。私にはまったくわけがわかりません。
「?」と「︖」
前者は普通のクエスチョンマーク(U+FF1F)、後者は縦書き用句読点の文字(U+FE16)です。
縦書き用の句読点が普通の句読点とは別に用意されているなんて、遭遇するまで知りませんでした。「︑」や「︒」などもあるようです。
「これ」と「これ」
前者は普通に「こ」と「れ」が並んでいますが、後者はその間にゼロ幅スペース(U+200B)、が入っています。
ゼロ幅スペースの類には、ほかに分割しないゼロ幅スペース(ZERO WIDTH NO-BREAK SPACE、U+FEFF)や制御文字などがあります。
ゼロ幅スペースは、Webなどで、幅に合わせて改行される位置の調整などに使われることがあります。また、コピペされたときにわかるよう、目印としてこっそり分割しないゼロ幅スペースを入れていることもあると聞きます。コピペするときには注意しましょう。
「が」と「が」
前者は1文字の「が」(U+304C)、後者は「か」(U+304B)に結合文字の濁点(U+3099)を組み合わせたものです。
けっこう遭遇頻度の高いやつです。これについては2017年の「編集とライティングにまつわるアレコレ Advent Calendar」で書いたので、詳細は省略します。
以上、私が実際に遭遇した紛らわしい文字の話でした。こういうのは、フォントの字形や、テキストエディタの機能、チェックツールなどに頼るしかないですよね。