オープンLLMのLLM as a JudgeにおけるJudgeモデルとしての性能を検証してみる