休·张
人员信息
优化列表
2020年–今天
2024 【c4】 肯尼思李 , 萨米·杰拉西 , 休·张 , 沙姆·M·卡卡德 , 瓦滕伯格 , 大卫·布兰德福恩布雷纳 :
Q-Probe:一种轻量级的语言模型奖励最大化方法。 ICML公司 2024 [i10] 卢卡·达米科·黄 , 休·张 , 马克·兰科特 , 大卫·C·帕克斯 :
简单如ABC:统一Boltzmann Q学习和反事实后悔最小化。 CoRR公司 腹肌/24021835 ( 2024 ) [第九章] 肯尼思李 , 萨米·杰拉西 , 休·张 , 沙姆·M·卡卡德 , 瓦滕伯格 , 大卫·布兰德福恩布雷纳 :
Q-Probe:一种轻量级的语言模型奖励最大化方法。 CoRR公司 abs/2402.14688 ( 2024 ) [i8] 休·张 , 杰夫·达 , 李院长 , 沃恩·罗宾逊 , 凯瑟琳·吴 , 威尔·宋 , Tiffany Zhao(蒂凡尼·赵) , 普拉纳夫·拉贾 , 迪伦·斯莱克 , 秦柳 , 肖恩·亨德利克斯 , 罗素·卡普兰 , 米歇尔·卢纳蒂 , 夏月 :
仔细检查小学算术大语言模型的表现。 CoRR公司 abs/2405.00332 ( 2024 ) [i7] 怀秀Steven Zheng , Swaroop Mishra公司 , 休·张 , 陈新云 , 陈敏敏 , 新阿扎德 , 乐侯 , 恒泽诚 , Quoc V.Le公司 , Ed H.Chi先生 , 丹尼·周 :
自然规划:自然语言规划方面的LLM基准。 CoRR公司 abs/2406.04520 ( 2024 ) [i6] 瓦斯卡·纳特 , 迪伦·斯莱克 , 杰夫·达 , 马云涛 , 休·张 , 斯宾塞·怀特黑德 , 肖恩·亨德利克斯 :
语言奖励模型的学习目标条件表征。 CoRR公司 abs/2407.13887 ( 2024 ) 2023 【c3】 休·张 :
序列相关均衡的无回归学习动力学。 美国原子能机构 2023 : 2700-2702 [i5] 休·张 , 大卫·C·帕克斯 :
思想链推理是一种策略改进算子。 CoRR公司 abs/2309.08589 ( 2023 ) 2022 【c2】 休·张 , 亚当·莱勒 , 诺姆·布朗 :
基于贪婪后悔最小化的正态博弈均衡求解。 AAAI公司 2022 : 9484-9492 [i4] 休·张 , 亚当·莱勒 , 诺姆·布朗 :
基于贪婪后悔最小化的正态博弈均衡求解。 CoRR公司 abs/2204.04826 ( 2022 ) [i3] 休·张 :
一个简单的收敛于放弃相关均衡的自适应过程。 CoRR公司 abs/2207.06548 ( 2022 ) 2020 [i2] 休·张 , 丹尼尔·达克沃思 , 达芙妮·伊波利托 , 阿尔文德·内拉坎坦 :
在自然语言生成中权衡多样性和质量。 CoRR公司 abs/2004.10450 ( 2020 )
2010 – 2019
2019 【c1】 Tatsunori B.桥本 , 休·张 , 珀西·梁 :
统一自然语言生成的人类和统计评估。 NAACL-HLT(1) 2019 : 1689-1701 [i1] Tatsunori B.桥本 , 休·张 , 珀西·梁 :
统一自然语言生成的人类和统计评估。 CoRR公司 abs/1904.02792 ( 2019 )