大規模言語モデルが“目”を持つとどうなる? グーグルによるデモの内容は
米グーグルは、大規模言語モデル(LLM)が、人間で言うところの視覚を備えるようになったらどうなるか、大規模視覚モデル(VLM)のデモを公開した。