だめじゃん>「サロゲートペアな文字 U+219C3 を Word 2007 で保存すると \xF0\xA1\xA7\x83 と UTF-8 のサロゲートペアのバイト列で保存されてなかなか興味深いです。」

hasegawayosukehasegawayosuke のブックマーク 2007/06/25 11:16

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

2007-05-04

    Word 2007のデフォルトでは Docx(Open XML)形式でデータを保存しますが、ファイル内容が圧縮されている*1ので、バイナリパターンで文字列検索を実施しても検索対象の文字列は圧縮されちゃってるのでひっかかりま...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう