シーケンスGAN（generatorのマルチタスク学習）

以前覚え書きに書いたシーケンスGANだが、いろいろなバージョンがでているようだ。
hirotaka-hachiya.hatenablog.com

以下のgithubレポジトリに上がっているのは、割引報酬和と真の報酬との二乗誤差の最小化と、報酬の最大化をマルチタスク学習で、generatorを学習しているのが特徴である。
https://github.com/ofirnachum/sequence_gan

以下は、手書きメモ。
f:id:hirotaka_hachiya:20170824125121p:plain

seqGANをいろいろなデータで試した例。
https://qiita.com/knok/items/5e079420f05ddfc1ae75