アンドエンジニア - エンジニアのこと、エンジニアから。
id:andengineer
Google、自社開発のAIサービスを評価するAIテストツール「Stax」を発表
(画像提供:Stax公式サイト) Googleは現地時間8月27日、Google Labsにて、LLM(大規模言語モデル)などの生成AIを活用してAIサービスを自社開発する際に、AIを評価するテストツール「Stax」を発表した。 Googleによると、AIの評価は「バイブコーディング(vibe coding)」のような感覚的な判断によって行われているのが現状…