“通过奖励建模实现可伸缩的代理对齐:一个研究方向。”
简·雷克 , 大卫·克鲁格 , 汤姆·艾唯瑞特 , Miljan Martic公司 , 维沙尔·梅尼 , 谢恩·莱格 :
通过奖励建模实现可伸缩的代理对齐:一个研究方向。 CoRR公司 abs/1811.07871 ( 2018 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。