3D CNN まとめ · Issue #3 · t-koba-96/paper_summarize

3D CNN とは 動画の行動認識のタスクにおける最近(2018年12月現在)のトレンド. 入力動画に対して空間情報(2D)と時間情報(1D)をまとめて3Dの畳み込みを行うことにより、時空間情報を考慮した動画の行動認識を行うことが可能(理論上). 基本的に入力としては、動画をある決まった長さのtフレームごとに分割して入力する. 例…