富士通が提案する企業向けベンチマーク:AIエージェントモデルの真価を引き出す #2 AAAI 2026 AABA4ET参加報告とFujitsu RAG Hard Benchmarkの紹介

本記事は、TechBlog シリーズ「富士通が提案する企業向けベンチマーク:AIエージェントモデルの真価を引き出す」の第 2 回です。本シリーズは全 3 回で構成され、以下のスケジュールで公開予定です。 第 1 回:AIが「見ていないものを見る」とき:マルチモーダル大規模言語モデル(MLLM)の幻覚診断用ベンチマークの紹介(…