Googleが公開しているVision&Languageモデル(VLM)の「PaliGemma」を使ってみる

はじめにVision&Languageモデル(VLM)を使って写真の説明をしてもらいます。今回はGoogleが最近オープンソースとして公開してくれた「PaliGemma」を使ってみました。その他のVision&Languageモデル(VLM)touch-sp.hatenablog.comtouch-sp.hatenablog.com touch-sp.hatenablog.com touch-sp.hatenablog.com 画像と結果…