PDFから文字情報を抽出するには、PDFMiner一択 - Qiita

PDFから文字情報を抽出するために環境構築FROM python:3.6ENV LC_ALL C.UTF-8ENV LANG C.UTF-8 RUN apt-get -y update &&…