はじめに Sarashina2.2-Vision-3Bは日本の知識が豊富なVision Language Modelです。 学習時に日本のデータを多く使ったようです。 画面 Pythonコード import gradio as gr import threading import torch from transformers import AutoModelForCausalLM, AutoProcessor, set_seed, TextIteratorStreamer # Define model p…