注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
やりたいことー 大量に作成したPDF(10,000個以上!)の内容が問題ないか、 (ファイル名と中身が合って... やりたいことー 大量に作成したPDF(10,000個以上!)の内容が問題ないか、 (ファイル名と中身が合っているかなど)ざっと調べたくなりました。 環境 Python 2.7 Windows7 64bit 使うライブラリ PDFMinerを使用します。 公式サイトに、コマンドプロンプトを使った場合のサンプルは掲載されているのに、 なぜかライブラリをインポートして使う方法が掲載されていなかったので、ちょっと戸惑う。 インストール 公式からダウンロードしたファイルを展開して、 pdfminer-20140328フォルダで、今回はWindowsなので以下のコマンドを実行。 mkdir pdfminer\cmap python tools\conv_cmap.py -c B5=cp950 -c UniCNS-UTF8=utf-8 pdfminer\cmap Adobe-CNS1 cmaprsrc\
2020/02/21 リンク