簡単そうで簡単ではないPDFのテキスト抽出 - アンテナハウス PDF資料室

PDFを、Adobe Readerを始めとするPDFリーダー(PDFビューアとも)で表示し、画面上でページ全体や矩形または任意の領域のテキストについて抽出したり、コピー&ペーストして再利用することがあります。しかし、たまにコピーして取り出したテキストについて、文字やその並びなどが期待したとおりに抽出できていないというこ…