地平線まで行ってくる。
id:bwgift
Doclingを利用してpdfからmarkdownへの変換を見直してみる。
LLMでの文書ファイルを活用するためには、まだまだmarkdownをうまく活用する場面が多くあります。Pythonでコーディングする場合には、改めて調べるとPyMuPDF4LLMかDoclingあたりが候補になりそうでした。PyMuPDF4LLMも軽量で良好でしたが、今回はDoclingを手を動かして試してみます。 github.com markdownに図データを切り…