#05 LLMでマリオをプレイ「Large Language Mario」に挑戦。Qwen2も味見。

ColabのT4環境でコンピューティングユニットを消費しながらスーパーマリオのステージ8-3を強化学習とLLM(MobileVLM)のコンビで学習させていました。学習がさちってきた感じがしてきたので、打ち切りました。また、LLMとしてQwen2_vl(2b)を味見しました。 LLM+強化学習 bwgift.hatenadiary.jp 残念ながらゴールならず。 Sta…