@技术报告{10201,title=“为深度强化学习决斗网络架构”,author=“王子玉、南多·德·弗雷塔斯和马克·兰托特”,year=“2015”,number=“arXiv:1511.06581”,url=“http://arxiv.org/abs/1511.06581",}