オープンLLMのLLM as a JudgeにおけるJudgeモデルとしての性能を検証してみる

zenn.dev zenn.dev