Transformer

Transformerとは2017年にGoogle Reserchが発表した自然言語処理における深層学習モデルのひとつであり, それまでの主流となっていたRNN, LTSMよりも少ない計算量で圧倒的な精度を出し, それ以降の自然言語処理による機械学習界のブレイクスルーを起こした.

Transfomerは RNN, LSTM で問題となっていた逐次的に出力を計算しなければならない $O (N)$ 問題を克服しAttentionのみからなる計算量が $O (1)$ のモデルであり、並列化も容易である。

Transformerモデルなどのトランスダクションモデル(ある文章を他の文章に変換するモデル(翻訳など))において主流なのは以下のようなエンコーダ-デコーダモデルである。