エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
概要 本記事では、Gemini、Claudeの各LLMでPDFを読み込ませてmarkdownへ変換し、その際、文章の欠落がな... 概要 本記事では、Gemini、Claudeの各LLMでPDFを読み込ませてmarkdownへ変換し、その際、文章の欠落がないかの精度や、その処理で発生する料金について比較した結果を紹介します。 一方で、GPTは現時点でPDFを扱えないので対象外としています。 LLMによるPDFからmarkdownへの変換 Claudeの公式ドキュメントによると以下の流れでPDFを読み込み扱えるようにしているようです。 ドキュメントの内容を抽出 ドキュメントの各ページを画像に変換 各ページからテキストが抽出され、ページの画像とともに提供 文書をより深く理解するために、テキストと画像の両方を分析 ドキュメントは分析用にテキストと画像の組み合わせとして提供 これにより、ユーザーは、グラフ、図、その他の非テキストコンテンツなど、PDF の視覚要素に関する洞察を求めることができる ドキュメントをmarkdownへ