DQN論文をPlaying Atari with Deep Reinforcement Learning, V. Mnih, K. Kavukcuogl et al.を読んでみた。 http://arxiv.org/pdf/1312.5602.pdf DQNは、行動価値関数（Q関数）を、Convolutional Neural Network(CNN)によりモデル化し、強化学習の反復アルゴリズムを用いて最適化する方式である。この価値関数を表現するCN…

八谷大岳の覚え書きブログ

Deep Learning覚え書き（DQN論文）