【マルチモーダル】Vision-Language Navigation

Index Index Vision-Language Navigation アルゴリズム OVRL-V2 / 2023 テクニック・工夫 EnvEdit / 2022 参考 Web サイト Vision-Language Navigation 3D 環境内のエージェントに対して、テキストで指示をすることで、行動させるマルチモーダルなタスク. マルチモーダルの中でも、Vision Language のタスク. マルチモーダ…