Deep Learning覚え書き(DQN論文)

DQN論文をPlaying Atari with Deep Reinforcement Learning, V. Mnih, K. Kavukcuogl et al.を読んでみた。 http://arxiv.org/pdf/1312.5602.pdf DQNは、行動価値関数(Q関数)を、Convolutional Neural Network(CNN)によりモデル化し、強化学習の反復アルゴリズムを用いて最適化する方式である。この価値関数を表現するCN…