覚え書きブログ

2018-11-28から1日間の記事一覧

Pythonによる機械学習7(Q学習 1/3)

【Pythonによる機械学習7(Q学習 1/3)】 Q学習 Q学習の実装 演習1 Q学習 前回求めた漸化式表現を利用して、価値関数を更新する代表的な方法であるQ学習法を実装します。 以下は、最も単純な強化学習のタスクである2状態マルコフチェーンに、Q学習を適用…