@第{zbMATH07220832条,作者={戈尔巴尼、法扎内赫和阿夫沙奇、莫森和德哈米、瓦利},Title={连续状态-动作多智能体决策过程中的策略预测学习},FJournal={软计算},日志={软计算},ISSN={1432-7643},体积={24},数字={2},页码={901--918},年份={2020年},语言={英语},DOI={10.1007/s00500-019-04600-4},关键词={68T37,68T05},zbMATH={7220832},Zbl={1436.68350}}