BioErrorLog Tech Blog
id:BioErrorLog
LLMの回答を自動評価するOpenAIプラクティス
OpenAIのプロンプトエンジニアリングガイドに従って、LLMの回答を自動評価するプラクティスを整理します。 はじめに LLM回答の自動評価ベストプラクティス 回答評価の具体例 例1. ある既知の事実が回答に含まれているか評価する 例2. 理想回答との矛盾や重なりを評価する おわりに 参考 はじめに LLMアプリケーションの開…