默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

休·张

>主页 >珀森斯

人员信息

SPARQL查询

优化列表

优化激活！

放大了??属于??记录

查看优化列表

导出优化列表为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2024
【c4】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/0002JZKWB24
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/0002JZWKWB24
肯尼思李,萨米·杰拉西,休·张,沙姆·M·卡卡德,瓦滕伯格,大卫·布兰德福恩布雷纳:
Q-Probe:一种轻量级的语言模型奖励最大化方法。 ICML公司 2024
[i10]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-11835
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-11835
卢卡·达米科·黄,休·张,马克·兰科特,大卫·C·帕克斯:
简单如ABC：统一Boltzmann Q学习和反事实后悔最小化。 CoRR公司腹肌/24021835(2024)
[第九章]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-14688
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-14688
肯尼思李,萨米·杰拉西,休·张,沙姆·M·卡卡德,瓦滕伯格,大卫·布兰德福恩布雷纳:
Q-Probe:一种轻量级的语言模型奖励最大化方法。 CoRR公司 abs/2402.14688(2024)
[i8]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2405-00332
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2405-00332
休·张,杰夫·达,李院长,沃恩·罗宾逊,凯瑟琳·吴,威尔·宋,Tiffany Zhao（蒂凡尼·赵）,普拉纳夫·拉贾,迪伦·斯莱克,秦柳,肖恩·亨德利克斯,罗素·卡普兰,米歇尔·卢纳蒂,夏月:
仔细检查小学算术大语言模型的表现。 CoRR公司 abs/2405.00332(2024)
[i7]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2406-04520
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2406-04520
怀秀Steven Zheng,Swaroop Mishra公司,休·张,陈新云,陈敏敏,新阿扎德,乐侯,恒泽诚,Quoc V.Le公司,Ed H.Chi先生,丹尼·周:
自然规划：自然语言规划方面的LLM基准。 CoRR公司 abs/2406.04520(2024)
[i6]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2407-13887
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2407-13887
瓦斯卡·纳特,迪伦·斯莱克,杰夫·达,马云涛,休·张,斯宾塞·怀特黑德,肖恩·亨德利克斯:
语言奖励模型的学习目标条件表征。 CoRR公司 abs/2407.13887(2024)
2023
【c3】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/atal/张23a
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/atal/张23a
休·张:
序列相关均衡的无回归学习动力学。美国原子能机构 2023:2700-2702
[i5]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/cor/abs-2309-08589
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2309-08589
休·张,大卫·C·帕克斯:
思想链推理是一种策略改进算子。 CoRR公司 abs/2309.08589(2023)
2022
【c2】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/张LB22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/ShangLB22
休·张,亚当·莱勒,诺姆·布朗:
基于贪婪后悔最小化的正态博弈均衡求解。 AAAI公司 2022:9484-9492
[i4]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2204-04826
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2204-04826
休·张,亚当·莱勒,诺姆·布朗:
基于贪婪后悔最小化的正态博弈均衡求解。 CoRR公司 abs/2204.04826(2022)
[i3]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/cor/abs-2207-06548
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2207-06548
休·张:
一个简单的收敛于放弃相关均衡的自适应过程。 CoRR公司 abs/2207.06548(2022)
2020
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 轴颈/cor/abs-2004-10450
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2004-10450
休·张,丹尼尔·达克沃思,达芙妮·伊波利托,阿尔文德·内拉坎坦:
在自然语言生成中权衡多样性和质量。 CoRR公司 abs/2004.10450(2020)

2010 – 2019

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2019
【c1】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/naacl/桥本ZL19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/naacl/HashimotoZL19
Tatsunori B.桥本,休·张,珀西·梁:
统一自然语言生成的人类和统计评估。 NAACL-HLT（1） 2019:1689-1701
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1904-02792
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1904-02792
Tatsunori B.桥本,休·张,珀西·梁:
统一自然语言生成的人类和统计评估。 CoRR公司 abs/1904.02792(2019)

合著者索引

请参阅常见问题解答

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。