ABEJA Tech Blog
id:yukiito723
エッジ環境でのLocal によるセキュアOCR:Grammar制約で構造化出力を行う
こんにちは、ABEJAでデータサイエンティストをしている伊藤祐希です。 今回は、セキュリティ・リソース制約下でVision Language Model (VLM) を使用する方法と検証を行いました。 サマリ 本記事の主張は以下の3点です。 エッジ(閉域/オフライン)環境でも、Local VLMで画像→構造化データ抽出は成立する ただしプロンプト…