PDFから文字情報を抽出するには、PDFMiner一択 - Qiita
PDFから文字情報を抽出するために 環境構築 Dockerfile FROM python:3.6 ENV LC_ALL C.UTF-8 ENV LANG C.UTF-8 RUN apt-get -y update && \ apt-get install...