ディープラーニングブログ
id:Ryobot
論文解説 Depthwise Separable Convolution for Neural Machine Translation (SliceNet)
テンソル分解は 2017 年の密かなブームだったかもしれない.論文数は多くないが,テンソル分解を用いた手法が中規模言語モデル,大規模言語モデル,機械翻訳 (本紙),動作認識で軒並み SOTA を達成している.(中略) SliceNet は巨大な ResNet の畳み込み層を空間方向の畳み込みチャネル方向の畳み込みに分解する Depthwise…