覚え書きブログ

Pythonによる機械学習8(Q学習の応用)

前回実装した強化学習の代表的な手法であるQ学習を、各グループで設定したタスクに応用してみましょう。
タスクは、OpenAI gymから選んでください。
gym.openai.com

宿題

MountainCarタスクを参考に、各グループで選定した課題に、Q学習を適用してみましょう。各グループにて以下の内容を発表してください。
1) 選択したタスクの内容
2) 状態、行動および報酬の概要
3) Q学習を応用する上でのアルゴリズムおよび実装上の工夫
4) 実験設定と実験結果
5) まとめ(できた所、難しかった所など)