@文章{JMLR:v18-16-326,author={大卫·马特\'{i} 内兹还有吉列姆·阿莱尼、托尼·里贝罗、井上胜美和卡梅·托拉斯,title={针对具有外源效应的规划的关系强化学习},journal={机器学习研究杂志},年份={2017},体积={18},数字={78},页数={1-44},url={http://jmlr.org/papers/v18/16-326.html}}