Pythonによる機械学習６（強化学習の基礎　１／３）

今回は、まず、強化学習の基礎（教師あり学習との違い、動物の行動学習、定式化）について学びます。そして、演習で用いるベンチマークツールのopen AI Gymのセットアップを行います。

【Pythonによる機械学習６（強化学習の基礎　１／３）の目次】

参考書

本ブログの内容の詳細は、「機械学習スタートアップシリーズゼロからつくるPython 機械学習プログラミング入門」に掲載されています。
機械学習に必要な数学の復習から、機械学習のアルゴリズムの導出およびPythonの基本ライブラリのみを用いた実装方法まで学びたい方は、本書籍をご活用ください。
bookclub.kodansha.co.jp
<br />

参考書
機械学習の種類
強化学習の定式化
演習1

機械学習の種類

前回まで学んだニューラルネットワークを用いた分類は、入力ベクトルxがどのカテゴリに属しているのかを表す出力ベクトルtを人間が用意していました。このような正しい出力データを用意する機械学習手法のことを、教師あり学習と呼びます。教師あり学習の他に、機械学習の手法には、大きく分けて「教師なし学習」、「半教師学習」および「強化学習」があります。
f:id:hirotaka_hachiya:20181125230631p:plain