OpenAI、AIの経済的価値を測る新指標「GDPval」発表 トップ性能はClaude
OpenAIは、AIの経済的価値を測る新ベンチマーク「GDPval」を発表した。44職種の現実的なタスクで人間の専門家と比較したところ、競合のClaude Opus 4.1が最高性能を示し、AIの品質が人間に迫っていることが判明したとしている。