共有
  • 記事へのコメント100

    • 注目コメント
    • 新着コメント
    その他
    ANNotunzdY
    ANNotunzdY トルコ語問題

    2019/07/31 リンク

    その他
    bleu-bleut
    bleu-bleut 大文字と小文字でバイト数が異なる言語があるために一行読み込んで変換、検索していたのを、[Ff][Oo][Oo]という正規表現に変換して検索すると高速化した。

    2015/03/24 リンク

    その他
    nilab
    nilab いまさらgrepが10倍高速化したのはなぜか | はむかず!

    2014/07/05 リンク

    その他
    mkusunok
    mkusunok 枯れたコマンドで今更こんな最適化が効くって驚愕

    2014/07/05 リンク

    その他
    nevlib
    nevlib 単純だけど深いな…

    2014/03/06 リンク

    その他
    airj12
    airj12 「英語、トルコ語混じりファイルの検索で、トルコ人が苦労することはないんだろうかと思った。」思いますね。

    2014/03/01 リンク

    その他
    magelixir
    magelixir “マルチバイトロケールによっては、「大文字→小文字」または「小文字→大文字」の変換をすると文字のバイト数が変わってしまうことがある”うひえー

    2014/02/26 リンク

    その他
    t-tanaka
    t-tanaka 『「foo」という文字列を検索するときは「[fF][oO][oO]」という正規表現に変換してから検索』え? 今まで違ったの?

    2014/02/26 リンク

    その他
    field_combat
    field_combat 「世界には、大文字/小文字の変換を行うとUTF-8で表現した時のサイズが変わる言語がある」トルコ語とかがそれにあたるらしい。へー

    2014/02/26 リンク

    その他
    tarchan
    tarchan >マルチバイトロケールによっては、「大文字→小文字」または「小文字→大文字」の変換をすると文字のバイト数が変わってしまうことがある

    2014/02/26 リンク

    その他
    tettekete37564
    tettekete37564 軽く驚愕>“マルチバイトロケールによっては、「大文字→小文字」または「小文字→大文字」の変換をすると文字のバイト数が変わってしまうことがある”/"正規表現にする"ことで高速化するってもの軽く驚く。時代だな

    2014/02/26 リンク

    その他
    habarhaba
    habarhaba 構成が美しい!読みやすい記事

    2014/02/25 リンク

    その他
    smbd
    smbd へー。ていうか、大文字小文字で文字のバイト数が変わる文字があるのか…

    2014/02/25 リンク

    その他
    amino_acid9
    amino_acid9 マルチバイトロケールで「大文字」「小文字」のバイト数が違う場合があるためケース・インセンシティブでは正規表現に変換で検索速度10倍アップ

    2014/02/25 リンク

    その他
    futtafutta
    futtafutta なるほど

    2014/02/25 リンク

    その他
    cubicdaiya
    cubicdaiya マルチバイトロケールによっては、「大文字→小文字」または「小文字→大文字」の変換をすると文字のバイト数が変わってしまうことがある(!)

    2014/02/25 リンク

    その他
    decoy2004
    decoy2004 正規表現を使うことで高速にしたそうだ。発想は migemo に似ている。

    2014/02/25 リンク

    その他
    asakura-t
    asakura-t 昔どこかで似たような話を見かけたと思ったけど、たぶんこのあたりかな?>http://d.hatena.ne.jp/gfx/20091001/1254375323 その後perlに修正があったようななかったような/perldeltaのUnicode正規表現まわりを読んでるとほんと魔境だな…

    2014/02/25 リンク

    その他
    kaipu1224
    kaipu1224 世界は広いっつーことですね。

    2014/02/25 リンク

    その他
    Vaduz
    Vaduz へー

    2014/02/25 リンク

    その他
    radiocat
    radiocat トルコ語でiとIがそれぞれ別の文字の小文字大文字だということのほうが驚いた。

    2014/02/25 リンク

    その他
    ama-ch
    ama-ch “世界には、大文字/小文字の変換を行うとUTF-8で表現した時のサイズが変わる言語がある”

    2014/02/25 リンク

    その他
    nari_ex
    nari_ex grep の-i オプションを利用した時の性能が10倍向上した話

    2014/02/25 リンク

    その他
    teppeis
    teppeis 大文字と小文字でバイト数が変わる場合の対応。なるほどー。

    2014/02/25 リンク

    その他
    karia
    karia -i付けたときの速度確かに遅かった

    2014/02/25 リンク

    その他
    tmtms
    tmtms 正規表現の謎の技術によりプログラムで頑張るよりも速い

    2014/02/25 リンク

    その他
    matsumoto_r
    matsumoto_r “そこで発想を変えて、検索される文字列を同値な正規表現にあらかじめ変換すると速くなった。”

    2014/02/25 リンク

    その他
    labocho
    labocho 文字コード ほえー

    2014/02/25 リンク

    その他
    AmaiSaeta
    AmaiSaeta これ、トルコ語が魔境と言うよりは、Unicodeが地獄なんだろうなと思う。各言語を符号化する際の大変さは「ユニコード戦記」って本で読んだわ。 http://amaisaeta.seesaa.net/article/281877385.html

    2014/02/25 リンク

    その他
    namikawamisaki
    namikawamisaki [これはすごい]

    2014/02/25 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    いまさらgrepが10倍高速化したのはなぜか – はむかず!

    最近GNU grepコマンドの最新バージョンがリリースされ、速度が10倍になったとのアナウンスがあった。そ...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事