CNN+ViTモデルの傾向【サーベイ】 - Qiita

画像認識モデルの2強 CNN vs ViT 画像認識分野において,スタンダードとなる2つのベースモデルがある.それは,CNNとViT. 今回は,CNNとViTの違いと組み合わせモデルについて紹介する. CNN カーネル範囲で特徴抽出 局所的な認識に有効→エッジなど...