渋谷駅前で働くデータサイエンティストのブログ
id:TJO
「推論する生成AI」は事前学習されていない課題を正しく推論することができない(共変量シフトに弱い)
先日の記事で「CoTを用いて『推論』する生成AI」の「推論」能力の限界について、論文2点を挙げて論じたところ思いの外反響が大きくてちょっとびっくりしたのでした。なのですが、最近になって同じテーマに対して「厳密に条件統制されたデータセットを用いてLLMを実際に構築した上で実験した」という論文が出てきたとのこと…