覚え書きブログ

シーケンスGAN(generatorのマルチタスク学習)

以前覚え書きに書いたシーケンスGANだが、いろいろなバージョンがでているようだ。
hirotaka-hachiya.hatenablog.com

以下のgithubレポジトリに上がっているのは、割引報酬和と真の報酬との二乗誤差の最小化と、報酬の最大化をマルチタスク学習で、generatorを学習しているのが特徴である。
https://github.com/ofirnachum/sequence_gan

以下は、手書きメモ。
f:id:hirotaka_hachiya:20170824125121p:plain
f:id:hirotaka_hachiya:20170824125142p:plain
f:id:hirotaka_hachiya:20170824125017j:plain
f:id:hirotaka_hachiya:20170824125026j:plain
f:id:hirotaka_hachiya:20170824125039p:plain

seqGANをいろいろなデータで試した例。
https://qiita.com/knok/items/5e079420f05ddfc1ae75