Langfuse の Datasets 機能を利用した AIエージェント機能の性能評価のためのデータセット構築

LayerX の提供するバクラクAIエージェントを題材に、Langfuse を利用したAIエージェント機能の性能評価の取り組みについて紹介します。今回は、性能評価の肝であるデータセット構築について紹介します。次回は、そのデータセットを用いて実際に性能評価を実施する仕組みについて紹介します。 バクラクは、バックオフィスに…