Index Index GLIP Natural Language Supervision Phrase Grounding Phrase Grounding と Object Detection の融合 Frame Work Formulation / 定式化 Object Detection Object Detection + Phrase Grounding Deep Fusion Cross-Modality Multi Head Attention 学習データセット 実装編 参考 Web サイト GLIP 物体検出のおけ…