HEROZ Tech Blog
id:heroz-tkubo
PDFの図表はRAGで扱えるのか?6つの方法で検証して分かった“現実的な最適解”
PDFに含まれる図表をRAGで扱うことはできるのか?本記事では、テキスト抽出・LLMによるOCR・マルチモーダルEmbeddingなど6つの手法を比較し、精度・コスト・処理時間の観点から検証を行いました。最新の研究動向とも照らし合わせながら、実務で使える現実的な最適解を整理します。