サーバーワークスエンジニアブログ
id:swx-tomoya-ikeda
LLMの品質を可視化!Langfuseで実現する自動評価システムの構築
はじめに 前回の記事では、LangfuseをAWS上にデプロイしてLLMアプリケーションのトレースを可視化する方法をご紹介しました。トレースによって「何が起きているか」は見えるようになりましたが、これだけでは「その回答は良いのか悪いのか」を判断することはできません。 そこで今回は、Langfuseの「評価」機能を使って、L…