エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
1行1単語のファイルから、単語の数を集計しようとしました。 ところが。 uniq -c の結果がおかしい! gr... 1行1単語のファイルから、単語の数を集計しようとしました。 ところが。 uniq -c の結果がおかしい! grep すると 1つしか見つからないのに、 uniq -c だと、その単語が 713 もあるって出てくる!なんなの! よく見たらそもそも sort も並び順おかしい!同じ単語がばらばらの場所にある! …とか思ったのですが、LC_ALL=C をつけたらうまくいきました。 問題になった環境では試せていませんが、LC_COLLATE=C で充分かもしれないです。 LC_ALL=C sort text.txt | LC_ALL=C uniq -c > result.txt ロケールの確認は locale コマンドで。 ■参考 Ubuntu日本語フォーラム / utf-8に対応したソートコマンドってありますか。 LC_ALL環境変数とsortコマンド - sileの日記 追記: sort を