默认搜索操作

组合dblp搜索
作者搜索
场地搜索
出版物搜索

问别人

“Q-Probe：语言模型奖励最大化的轻量级方法。”

Kenneth Li等人（2024年）

>主页

SPARQL查询

详细信息和统计

内政部： 10.48550/ARXIV.2402.14688

访问：打开

类型：非正式或其他出版物

元数据版本：2024-03-22

打开Alex

- 看法
  - 通过DOI的电子版（开放存取）
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-14688
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-14688
肯尼思李,萨米·杰拉西,休·张（Hugh Zhang）,沙姆·M·卡卡德,瓦滕伯格,大卫·布兰德福恩布雷纳:
Q-Probe:一种轻量级的语言模型奖励最大化方法。 CoRR公司 abs/2402.14688(2024)

请注意：由于提供了开放的元数据API，因此只能提供有关引用和引用的信息crossref.org网站和开放引用.net.如果您的出版物的引用数据尚未公开，请考虑要求您的出版商向公众发布您的引用数据。有关更多信息，请参阅开放引文倡议（I4OC）也请注意，无法直接向dblp提交缺失的参考文献或引用数据。

请注意，此功能是正在进行的工作而且它还远远不够完美。特别是，

由于引用数据不可用，以下列表可能不完整，
引用字符串可能未成功映射到dblp中列出的项，并且
我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。

需要JavaScript才能检索和显示此记录的任何引用和引用。

工具书类

引用人

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。