Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

PDF

PythonでPDFからテキスト/表情報の抽出精度を比較してみた

はじめに こんにちは。ついにジム通いを始めて四六時中筋肉痛を感じながら過ごしているイワツカです。 最近はLLM(大規模言語モデル)とRAG(検索拡張生成)を用いて企業内ドキュメントを活用する取り組みが多く見受けられます。 ドキュメントは基本PDFで保…