Legal Brain で開発に携わっている菅原です。今回は判例の要約を自動生成するにあたり、ファインチューニングしたモデルが自動評価指標では圧勝したにもかかわらず、専門家による評価ではまったく異なる結果になった話を紹介します。背景実験設定データ比較モデルファインチューニング設定自動評価指標：ROUGE と B…

弁護士ドットコム株式会社 Creators’ blog

判例要約のファインチューニングで学んだ「スコアが高い ≠ 品質が良い」という教訓