OpenAIのプロンプトエンジニアリングガイドに従って、LLMの回答を自動評価するプラクティスを整理します。はじめに LLM回答の自動評価ベストプラクティス回答評価の具体例例1. ある既知の事実が回答に含まれているか評価する例2. 理想回答との矛盾や重なりを評価するおわりに参考はじめに LLMアプリケーションの開…

BioErrorLog Tech Blog

LLMの回答を自動評価するOpenAIプラクティス