LLMの自律的な調査力を高めるAgenticRLの取り組みと知見

こんにちは。 ABEJAでデータサイエンティストをしている服部です。 LLMの進化は速いですね。 Reasoning能力があることは勿論Agenticな動きをすることも最近求められており、LLM開発においてもPost Trainingの重要性は高まっています。 本記事では、Agenticな能力の向上に向けた Post Training、特にSFTと強化学習で実施し…