大規模言語モデルLLMの論理的思考を強くするデータセットを考える①|AIサトシ

OpenAIがo1を発表しLLMによる知的生産能力がさらに高いところにあることが証明されました。 o1ではLLMのCoT(Chain of thought 思考の鎖)のにおける強化学習の工夫があるようですが、利用しているLLMの基本的な構造は同じと考えられます。 現状のオープンウェイトのLLMでは論理的思考を備えていますが不安定であり、推論の…