MLflow素振りの記:2.8からサポートされたLLM-as-a-Judgeを触る

はじめに あらたなユーフォニアム...!! nikkieです。 MLflowを触ってみました。 なんでもLLM-as-a-Judgeができると聞きまして 目次 はじめに 目次 「静的データセットで評価する」のコードを動かしてみる MLflow 2.8 リリースブログより 動作環境 & スクリプト 評価結果を確認 MLflowは裏で一体何をしたのか 終わりに P.…