VRAM96GBが使える環境が増えてきていますね。そんな中、どのLLMを使うのがいいか考えてみます。候補としては、gpt-oss-120b、GLM-4.6V、Qwen3-Coder-Nextがあります。で、まあ、安定性のgpt-oss、汎用性のGLM、複雑なコードはQwen3、という感じで使いわけがいいんではないかと。常用チャットは画像対応のGLM-4.6Vかな。…

きしだのHatena

VRAM96GB(Unified memory 128GB)でどのLLMが使えるか