AAAI-17にて、Lantao YuらによるGAN（Generative Adversarial Net）のフレームワークで、強化学習のpolicy gradientを学習し、テキストや音楽などのシーケンスを生成する方法に関する論文が発表される。 SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient https://arxiv.org/pdf/1609.05473.pdfちなみに…

八谷大岳の覚え書きブログ

シーケンスGAN