「何をテストすべきか」を自動で決める ― 業務AIエージェントのレッドチーミング