前回実装した強化学習の代表的な手法であるQ学習を、各グループで設定したタスクに応用してみましょう。
タスクは、OpenAI gymから選んでください。
gym.openai.com
参考書
本ブログの内容の詳細は、「機械学習スタートアップシリーズ ゼロからつくるPython機械学習プログラミング入門」に掲載されています。
機械学習に必要な数学の復習から、機械学習のアルゴリズムの導出およびPythonの基本ライブラリのみを用いた実装方法まで学びたい方は、本書籍をご活用ください。
bookclub.kodansha.co.jp
宿題
MountainCarタスクを参考に、各グループで選定した課題に、Q学習を適用してみましょう。各グループにて以下の内容を発表してください。
1) 選択したタスクの内容
2) 状態、行動および報酬の概要
3) Q学習を応用する上でのアルゴリズムおよび実装上の工夫
4) 実験設定と実験結果
5) まとめ(できた所、難しかった所など)