Prime Intellect Labで始めるAgentic RL ―― 4BモデルでGPT-5を超える

zenn.dev zenn.dev