この手のアプリ作っている人には既知のことなんだろうけど、このあたりでアジア言語圏で作られたPDFから抽出したテキストが文字化けするという話題があって、下記の方法で一応解決できたぽいのでメモ。 "TJ"や"Tj"のオペレータコールバックから、 static void stringCallback(CGPDFScannerRef inScanner, void *userInfo) …

ぽんぽこ日記

アジア言語圏のPDFのテキスト抽出