ハーネスエンジニアリングのすすめ: 27BモデルでSWE-bench VerifiedのSLM SOTAを達成 (TTS@8=74.8%)

Qwen3.5-27B を追加学習なしで使い、実在する OSS issue をどこまで直せるかを測る SWE-bench Verified で、8本の候補から最終パッチを選ぶ構成により 229B 未満のローカル LLM としては2026年4月7日時点で SOTAである 74.8% を達成しました。