曲线 swMATH ID: 42896 软件作者: Aravind Srinivas、Michael Laskin、Pieter Abbeel 描述: CURL:强化学习的对比无监督表征。我们提出了CURL:强化学习的对比无监督表征。CURL使用对比学习从原始像素中提取高级特征,并在提取的特征之上执行非策略控制。在DeepMind Control Suite和Atari Games的复杂任务中,CURL在基于模型和无模型的以前基于像素的方法上都表现得更好,在100K环境和交互步骤基准测试中分别表现出1.9倍和1.2倍的性能提升。在DeepMind Control Suite中,CURL是第一个几乎与使用基于状态特征的方法的采样效率相匹配的基于图像的算法。我们的代码是开源的,可在 主页: https://arxiv.org/abs/2004.04136 源代码: https://github.com/MishaLaskin/curl 依赖项: 蟒蛇 相关软件: OpenAI健身房;亚当;阀总成;SimCLR(模拟清除);QT-点;VIME(可变利益实体);蟒蛇;日出;MOGPTK公司;安全健身房;安全PILCO;GPy火炬;PILCO公司;PyTorch公司 引用于: 2文件 全部的 前5名被10位作者引用 1 穆罕默德·阿明·阿卜杜拉 1 海萨姆·布·阿马尔 1 亚历山大一世,科恩·里弗斯。 1 维尔·基尔基 1 文森特·莫恩斯 1 丹尼尔·帕勒尼斯克 1 艾瓦·索特拉 1 奥利弗·斯特鲁克迈耶 1 提瓦里,克什提吉 1 王军 连载1篇 2 机器学习 在1个字段中引用 2 计算机科学(68至XX) 按年份列出的引文