* CNNにおいて、任意サイズの入力画像から固定サイズの特徴量ベクトルを出力するSpatial Pyramid Pooling (SPP)層を提案 * 例えば、ImageNetで事前学習しているモデルの多くは、入力画像サイズが224x224となっており、処理対象画像サイズが224x224でない場合、リサイズもしくはクロッピングする必要がある。 * 入力画像サ…

医療系AIエンジニアの技術メモ

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition