2. 今回取り上げるのはこれ
[1]H. V. Hasselt, et al. “Deep Reinforcement Learning with
Double Q-learning” arXiv:1509.06461, 2015.
と、そのもとになってる論文
[2]H. V. Hasselt. “Double Q-learning” Advances in NIPS,
23:2613-26212015.
DQNを改良し、ゲームでさらなる高得点を叩き出した!
3. もともとのDQNはこれ
[3]V. Mnih, K. Kavukcuoglu, D. Silver, A. Graves I.
Antonoglou, D. Wierstra, M. Riedmiller. “Playing Atari with
Deep Reinforcement Learning” arXiv:1312.5602, 2013.
もしくは
[4]V. Mnih, et al. “Human-level control through deep
reinforcement learning” nature, 2015.
4. DQNの解説は
DQNの解説に関しては、[3]塚原裕史氏「論文紹介 Playing Atari with
Deep Reinforcement Learning」
http://www.slideshare.net/htsukahara/paper-intoduction-playing-atari-
with-deep-reinforcement-learning
や[4]藤田康博氏「Playing Atari with Deep Reinforcement Learning」
http://www.slideshare.net/mooopan/ss-30336609
あるいは[5]私の「ディープラーニングの最新動向 強化学習とのコラボ
編① DQN」
http://www.slideshare.net/ssuser07aa33/introduction-to-deep-q-learning
などを参考にして下さい