レコメンドの目視テスト、もう限界なのでLLMに任せた話 — 自動評価ワークフロー構築の裏側

zenn.dev zenn.dev