停止战争！

Остановите войну!

对于科学家：

默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

“通过……统一Meta-Reinforcence学习的梯度估计”

唐云浩等（2021）

>主页

详细信息和统计

内政部：—

访问：打开

类型：非正式或其他出版物

元数据版本：2021-06-30

打开Alex

- 看法
  - 电子版@arxiv.org（开放访问）
- 出口记录
  dblp键：
  - 日记账/corr/abs-2106-13125
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-13125
汤云浩,Tadashi Kozuno公司,马克·罗兰,雷米·穆诺斯,米查尔·瓦尔科:
通过非策略评估统一元强化学习的梯度估计。 CoRR公司腹肌/2106.13125(2021)

请注意：由于提供了开放的元数据API，因此只能提供有关引用和引用的信息交叉参考网站和开放引用.net.如果您的出版物的引用数据尚未公开，请考虑要求您的出版商向公众发布您的引用数据。有关更多信息，请参阅公开引用倡议（I4OC）也请注意，无法直接向dblp提交缺失的参考文献或引用数据。

请注意，此功能是正在进行的工作而且它还远远不够完美。特别是，

由于不可用的引用数据，下面的列表可能是不完整的，
引用字符串可能未成功映射到dblp中列出的项，并且
我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。

需要JavaScript才能检索和显示此记录的任何引用和引用。

工具书类

引用人

服务

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。