評価駆動開発で趣味のLLMアプリを育てきってみた【やり抜く!】

はじめまして。Insight Edgeデータサイエンティストのnakanoです。 LLMアプリケーションの開発において、「とりあえず動くもの」を作ることは比較的容易です。しかし、実用的なレベルにまで仕上げることは難しい課題です。その理由は、LLMアプリの良し悪しを測る評価軸が曖昧なままだと、改善の方向性が定まらず開発が迷走…