【詳説】Attention機構の起源から学ぶTransformer

みなさんは、Transformerについてどのようなイメージを持っていますか?最近は、BERT、GPTなどのTransformerベースのモデルが目を見張るような成果をだしているので、それらを想像する