UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。また、UnicodeはASCIIだけでなく、Western Europeanもほぼ同時に追い越している。
Unicodeは多くの言語に対応した標準文字コード体系で、発音区別符号などを利用したローマ字なども扱っている。何十年も前に定められたASCIIコードは128文字あるいは256文字(ASCIIで128 文字、拡張ASCIIで256文字)しか表現できず、タイプライターの影響を受けた同文字コードの拡張は苦戦している。
UnicodeがASCIIとWestern Europeanを追い越したのは12月で、双方が追い越された日は10日も違わなかった。
Unicodeの動きについて、同氏は「Unicodeが他を単純に上回ったことよりも、これが起きたスピードが印象的だ」と述べている。
GoogleはUnicodeを積極的に使用している。Googleはウェブサイトからのデータを処理する際、UnicodeでなければまずこれをUnicodeに変換する。これにより、言語をまたがった検索機能が向上するからだ。
「Unicodeの利用が継続的に増えてきているため、Googleがカバーする多くの言語の処理が容易になる」とDavis氏は述べた。
同氏はさらにGoogleがUnicode 5.1をサポートし始めたことも付け加えた。「このおかげでマラヤーラム語を話す人たちは、新しい文字を含んだ単語を検索することが可能になる」(Davis氏)
ASCIIと比べたときのUnicodeの短所としては、ローマ字を格納するのに2倍のメモリ容量を必要とする点が上げられる。これはUnicodeがより多くの文字記号に対応するため、文字をより多くのバイト数で表現するためである。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「戦えるデータ基盤」の条件
そのAI、精度の低いデータで動かしてない?
顧客DBの落とし穴と成果につながる整備
再現性ある改革の軌跡
法人データを武器に営業支援の限界を超える
競争しない企業が誰よりも速く成長する理由
プライバシーを守って空間を変える
ドコモビジネス×海外発スタートアップ
共創で生まれた“使える”人流解析とは
【独占】生成AI勃興でリストラ敢行 巨額調達ダイニーが人材削減に踏み切った理由
【独占】みずほFG傘下の道を選んだUPSIDER宮城社長インタビュー 「スイングバイIPO当然目指す」
メルカリが「2四半期連続のMAU減少」を恐れない理由--日本事業責任者が語る【インタビュー】
なぜPayPayは他のスマホ決済を圧倒できたのか--「やり方はADSLの時と同じ」とは
AIが通訳するから英語学習は今後「オワコン」?--スピークバディCEOの見方は
パラマウントベッド、100人の若手が浮き彫りにした課題からCVCが誕生
野村不動産グループが浜松町に本社を「移転する前」に実施した「トライアルオフィス」とは
「ChatGPT Search」の衝撃--Chromeの検索窓がデフォルトで「ChatGPT」に
「S.RIDE」が目指す「タクシーが捕まる世界」--タクシー配車のエスライド、ビジネス向け好調
物流の現場でデータドリブンな文化を創る--「2024年問題」に向け、大和物流が挑む効率化とは
「ビットコイン」に資産性はあるのか--積立サービスを始めたメルカリ、担当CEOに聞いた
培養肉の課題は多大なコスト--うなぎ開発のForsea Foodsに聞く商品化までの道のり
過去の歴史から学ぶ持続可能な事業とは--陽と人と日本郵政グループ、農業と物流の課題解決へ
通信品質対策にHAPS、銀行にdポイント--6月就任のNTTドコモ新社長、前田氏に聞く
「代理店でもコンサルでもない」I&COが企業の課題を解決する