Prime Intellect Labで始めるAgentic RL ―― 4BモデルでGPT-5を超える