注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
諸々の事情によりEUC-JPのDBをダンプ→UTF8のDBにリストアするというスクリプトを毎日バッチで実行してい... 諸々の事情によりEUC-JPのDBをダンプ→UTF8のDBにリストアするというスクリプトを毎日バッチで実行しているが、ある日突然エラーを吐いてデータのインポートができなくなった。 pg_restore: [archiver (db)] COPY failed: ERROR: character 0xfce2 of encoding "EUC_JP" has no equivalent in "UTF8" ということなので、EUC-JP の 0xfce2を確認してみると、「(はしごたか)」だった。この周りの文字はいろんなところでトラブルが起こる。「(たつさき)」も同様。 そこで、ほかのエンコードについても対応する文字の区点を調べてみる。 http://pentan.info/doc/sjis_list.html SJIS UTF8 UTF16 EUC-JP JIS 文字
2013/08/07 リンク