以前覚え書きに書いたシーケンスGANだが、いろいろなバージョンがでているようだ。
hirotaka-hachiya.hatenablog.com
以下のgithubレポジトリに上がっているのは、割引報酬和と真の報酬との二乗誤差の最小化と、報酬の最大化をマルチタスク学習で、generatorを学習しているのが特徴である。
https://github.com/ofirnachum/sequence_gan
以下は、手書きメモ。
seqGANをいろいろなデータで試した例。
https://qiita.com/knok/items/5e079420f05ddfc1ae75