共有
  • 記事へのコメント23

    • 注目コメント
    • 新着コメント
    その他
    totttte
    totttte “つまりUnicodeがUTF-8よりも上位の概念にあたるわけです。言ってみれば仕様と実装といったところでしょうか。”

    2016/09/19 リンク

    その他
    kasumani
    kasumani Unicodeを斬りたい こんにちは。 Yahoo! JAPANで通知プラットフォームの開発をおこなっています佐々木海(@Lewuathe)と申します。 普段は全社向けのPush通知プラットフォームやメール配信プラットフォームの開発、保守をしてい

    2014/04/20 リンク

    その他
    UDONCHAN
    UDONCHAN 有用情報

    2014/04/17 リンク

    その他
    takc923
    takc923 斬るってそういう意味かよ!

    2014/04/17 リンク

    その他
    hidex7777
    hidex7777 はてブ参照

    2014/04/17 リンク

    その他
    kat0usi
    kat0usi UTF8の文字境界を知りたければ0で始まっているか、1が2つ以上連続しているかをbyte毎に見てあげればいい

    2014/04/17 リンク

    その他
    shodai
    shodai 雑学

    2014/04/17 リンク

    その他
    wasai
    wasai はてブのコメントを見てさらに勉強する

    2014/04/17 リンク

    その他
    tengo1985
    tengo1985 黙って「プログラマのための文字コード技術入門」を読めばいい

    2014/04/17 リンク

    その他
    ockeghem
    ockeghem あのー、些末な指摘で恐縮ですが、 char *bufp = original; while (bufp < original) { だと、ループには入らないのでは?

    2014/04/17 リンク

    その他
    ryonext
    ryonext わかりやすい記事でした

    2014/04/17 リンク

    その他
    bayaread
    bayaread こういう記事、いつも読んだ後「へぇ〜」ってなってからブコメを見てはてなの兄貴達の知識に脱帽する

    2014/04/16 リンク

    その他
    habarhaba
    habarhaba 斬ってるようには見えないんですが

    2014/04/16 リンク

    その他
    yrkhnshk
    yrkhnshk 確かにUnicodeとUncodeは似ている

    2014/04/16 リンク

    その他
    rryu
    rryu 合成文字必須のチベット文字に比べれば、ひとつの文字が複数のUnicodeスカラ値から構成されることを忘れられる日本語はまだ簡単な方だと思う。

    2014/04/16 リンク

    その他
    gerarad
    gerarad Yahooは会社としてこんなクソみたいな記事を公開してどうしたいんだ?

    2014/04/16 リンク

    その他
    y-kawaz
    y-kawaz あぁ、切るってそういうことか。そして浅い。

    2014/04/16 リンク

    その他
    houyhnhm
    houyhnhm ナマクラな感じ。

    2014/04/16 リンク

    その他
    t-tanaka
    t-tanaka 浅い。これだと「が」が「か゛」の二文字になったりするぞ。NFC/NFDとかIVSとかって知ってます?

    2014/04/16 リンク

    その他
    mandel59
    mandel59 まずこの記事を斬るべきだろう

    2014/04/16 リンク

    その他
    naga_sawa
    naga_sawa UTF-8はエンディアンの影響なしでは?/『byte順の影響がない』と言っているのに『どの2つのbyteを見てもビッグエンディアンなのか、リトルエンディアンなのかの順番の区別をつけることができます』って矛盾

    2014/04/16 リンク

    その他
    deep_one
    deep_one 後ろの方が相当おかしい。UTF-8で「文字コードが何種類もできてしまう」ことがあるのは「合字」とかの例であって、取りあげているのは「一文字あたりのバイト長が一定にならない」という問題の方。全く斬れてない。

    2014/04/16 リンク

    その他
    kokorohamoe
    kokorohamoe UTF8にはサロゲートペアはありませんが異字体セレクタがあるので最大8バイト http://revilog.com/2014/04/10896.html

    2014/04/16 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    Unicodeを斬りたい

    ※2014/4/17 記事の内容に関していくつか訂正させていただきました。 ご指摘いただいた皆様ありがとうご...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事