拡散モデルで、将棋の方策を学習できないか試してみた。拡散モデル拡散モデルは、高品質で多様なサンプルを生成できる生成モデルである。昨年8月にStable Diffusionが公開されたことで注目を集めている。拡散モデルは、確率微分方程式によって表される確率分布を近似するモデルで、モード崩壊を起こさず多様な分布を学…

TadaoYamaokaの開発日記

拡散モデルで将棋の方策を学習する