【FLUX.1-dev】量子化を行う時にDiffusersでは「bitsandbytes」より「optimum-quanto」を使うことが推奨されていたのでさっそく使ってみました

はじめに前回「bitsandbytes」を使って量子化を行いました。 touch-sp.hatenablog.com 公式ページでは「optimum-quanto」を使うことが推奨されていたのでさっそく試してみました。 pip install optimum-quanto 「optimum-quanto」を使って量子化したモデルを保存する方法はこちらを参照しました。 github.com github.com q…