注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
文字コード変換 Ruby に限らずだと思うけど、以下のように、”波ダッシュ”や”全角ダッシュ”のような文字... 文字コード変換 Ruby に限らずだと思うけど、以下のように、”波ダッシュ”や”全角ダッシュ”のような文字を NKF でUTF-8 にエンコードする際に文字化けする。 環境としては、入力文字は Windows で入力。プログラムの実行は Solaris 10 で行ってる。 require 'nkf' puts NKF.nkf('-w', '―') ここで NKF のオプションの --cp932 を追加するとうまく行く。 require 'nkf' puts NKF.nkf('-w --cp932', '―') これってSJIS(実態はMS932)を UTF-8 に変換するときのコードポイントのマッピングに問題があるようだけど、例えば上記のスクリプトを記述したファイルのエンコードがSJIS で保存した場合ではなく、 UTF-8 で保存してから実行しても、やはり --cp932 が無いと正しく
2009/03/20 リンク