共有
  • 記事へのコメント281

    • 注目コメント
    • 新着コメント
    その他
    kmaebashi
    うーん、でも、Unicodeには当初から合成文字があるので、最初から1文字固定長を目指していたわけでもなく、ではいったい何を目指していたのかと思うとよくわからなくなるのです。

    その他
    inoueyuworks
    絵文字によって全てが utf-8 に集約しつつある、という話。

    その他
    tailtame
    2017。UTF-16…(`・ω・´)

    その他
    uehaj
    絵文字がある種のUnicodeバグを世界から一掃しつつある件について

    その他
    suganokei
    絵文字によるunicode革命の震源地としての日本。世界の中での日本の位置を確認するために有用な記事。ただしITの基礎知識がないと難しいでしょう。

    その他
    adatom
    “UTF-8”

    その他
    joint1
    わろす。この内容とは関係ないけど、絵文字の問題悩まされたな。

    その他
    kat0usi
    “絵文字は後からUnicodeに収録された文字としては異例に利用頻度が高いので、〜、結果として世界的にプログラマの認識の改善とプログラムの品質向上に貢献することになった”

    その他
    causeless
    "@Vixeur 絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama|no…" via https://twitter.com/Vixeur/status/930010971258503169

    その他
    luccafort
    UTF-16とかUTF_32ってなんなのだろう?とは思ってたけどこれ読んで違いがわかった、なるほど。非常に有用だこれ。というのを今更読んだ。でも絵文字は死滅してほしい。文字じゃねえもん。

    その他
    Gururi
    「Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ」IPv4みたいな(´・ω・`)

    その他
    natroun
    面白い。絵文字、そんなに広まっていて、そんな副作用をもたらしていたのか。/さすがに4バイトあれば足りなくなることはないんかねえ。

    その他
    hhungry
    マジかよ???????

    その他
    mory2080
    海外の漫画&アニメファンが日本語習得するのに似てる。

    その他
    takatama
    絵文字のバグを直すと必然的にマイナーな漢字などもきちんと扱えるようになってしまう。これは絵文字の普及の意図せぬ副作用と言えるだろう

    その他
    vanbraam
    "ほとんどの絵文字は他の最近採用された文字と同じくUTF-16では4バイト必要なのだが、どの言語でも極端に利用頻度が高いので、急に世界中の誰もがサロゲートペアについてきちんと考えざるを得なくなった"<なるほどなぁ

    その他
    AmaiSaeta
    ここらへんの話が面白いと思う人には、ちょっと古い本だけど「ユニコード戦記 文字符号の国際標準化バトル」って本オススメ。Unicodeの闇っぷりにゲロ吐きたくなってくるけど。

    その他
    Hamukoro
    昔のYahooトップはEUCで書かれていてヘッダにコメントアウトされた漢字がひょっこりと貼り付けられていたものだ…

    その他
    K2ICE
    "歴史上で初めて、英語圏ですらASCIIの範囲内では日常的に文字が足りないという状況になったともいえる。しかもその足りない文字はよりによってUTF-16では処理がトリッキーなサロゲートペアばかりなのである。"

    その他
    blueribbon
    「絵文字は後からUnicodeに収録された文字としては異例に利用頻度が高いので、いろいろなシステムにある種のストレステストを強いることになり、結果として世界的にプログラマの認識の改善とプログラムの品質向上…」

    その他
    anenpenmen
    おもしろい話だった。やっぱり自分から距離が近くないと他人事なんだよね。

    その他
    bobbyjam99
    世界のみなさん マルチバイトの世界にようこそ

    その他
    nokkojiro
    絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama|note Tags: from Pocket November 14, 2017 at 07:19PM via IFTTT

    その他
    arajin
    “絵文字は後からUnicodeに収録された文字としては異例に利用頻度が高いので、いろいろなシステムにある種のストレステストを強いることになり、”

    その他
    poppen
    絵文字のおかげでStellarisとかHoI4もマルチバイト文字使えるようになったかと思うと胸熱(本当にそうかどうか知らないけど)

    その他
    mikage014
    いい話だった。応用が利きそう。

    その他
    T-norf
    これは面白いね。日本人の遠謀ってことにしとこうw

    その他
    hevohevo
    面白いなぁ。UTF-16が欠点だらけ(UTF-8の方が良い)とか、MySQLの自称utf8とか中にちりばめられたお話も含めて面白い。

    その他
    myrmecoleon
    絵文字すごい。世界中のプログラマさんおつかれさま。

    その他
    tanimiyan
    何事も必要に迫られないと行われないし、何がきっかけ突破口になるかわからない、という話

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama

    UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unico...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む