×

曲线

swMATH ID: 42896
软件作者: Aravind Srinivas、Michael Laskin、Pieter Abbeel
描述: CURL:强化学习的对比无监督表征。我们提出了CURL:强化学习的对比无监督表征。CURL使用对比学习从原始像素中提取高级特征,并在提取的特征之上执行非策略控制。在DeepMind Control Suite和Atari Games的复杂任务中,CURL在基于模型和无模型的以前基于像素的方法上都表现得更好,在100K环境和交互步骤基准测试中分别表现出1.9倍和1.2倍的性能提升。在DeepMind Control Suite中,CURL是第一个几乎与使用基于状态特征的方法的采样效率相匹配的基于图像的算法。我们的代码是开源的,可在
主页: https://arxiv.org/abs/2004.04136
源代码:  https://github.com/MishaLaskin/curl
依赖项: 蟒蛇
相关软件: OpenAI健身房;亚当;阀总成;SimCLR(模拟清除);QT-点;VIME(可变利益实体);蟒蛇;日出;MOGPTK公司;安全健身房;安全PILCO;GPy火炬;PILCO公司;PyTorch公司
引用于: 2文件

连载1篇

2 机器学习

在1个字段中引用

2 计算机科学(68至XX)

按年份列出的引文