丹尼尔·多伊奇
人员信息
优化列表
2020年–今天
2024 [i19] 帕克·莱利 , 丹尼尔·多伊奇 , 乔治·福斯特 , 维雷什·拉特纳卡尔 , 阿里·达比莫加达姆 , 马库斯·弗雷塔格 :
通过稳定排序概率找到可复制的人类评估。 CoRR公司 abs/2404.01474 ( 2024 ) [i18] 马塞尔·纳雷恩 , 阿格涅斯卡·诺瓦克 , 特里斯坦·拉茨 , 达尼洛·瓦伦塔 , 尤里·奥皮茨 , 莱昂纳多·里贝罗 , 乔·塞多克 , 丹尼尔·多伊奇 , 西蒙·米勒 , 刘一新 , 李宁·张 , 塞巴斯蒂安·格尔曼 , 萨阿德·马哈茂德 , Miruna诊所 , Khyathi Raghavi Chandu公司 , 侯玉芳 :
总结内容单元在文本总结评价中的作用。 CoRR公司 abs/2404.01701 ( 2024 ) 2023 [第18条] 李宁·张 , 西蒙·米勒 , 侯玉芳 , 丹尼尔·多伊奇 , 伊丽莎白·克拉克 , 刘一新 , 萨阿德·马哈茂德 , 塞巴斯蒂安·盖尔曼 , Miruna诊所 , Khyathi Raghavi Chandu公司 , 乔·塞多克 :
大海捞针:对MTurk上高度一致的员工进行总结分析。 ACL(1) 2023 : 14944-14982 [第17条] 丹尼尔·多伊奇 , 丹罗斯 :
通过显著范围选择将基于问答的信号纳入抽象摘要。 EACL公司 2023 : 575-588 [第16条] 丹尼尔·多伊奇 , 乔治·福斯特 , 马库斯·弗雷塔格 :
关系重要:利用成对准确性和关系校准对现代指标进行元评估。 EMNLP公司 2023 : 12914-12929 [第15条] 克里斯托夫·莱特 , 尤里·奥皮茨 , 丹尼尔·多伊奇 , 杨高 , Rotem Dror公司 , 斯特芬·埃格尔 :
Eval4NLP 2023关于将大型语言模型作为可解释指标的提示共享任务。 评估4NLP 2023 : 117-138 [第14条] 詹·托尔斯滕·彼得 , 大卫·维拉尔 , 丹尼尔·多伊奇 , 玛拉·芬克尔斯坦 , 尤拉杰·尤拉斯卡 , 马库斯·弗雷塔格 :
没有比更好的数据更好的数据:使用QE指标进行机器翻译数据过滤。 世界气象组织 2023 : 561-577 [第13条] 马库斯·弗雷塔格 , 尼提卡·马图尔 , Chi-kiu Lo公司 , Eleftherios Avramidis公司 , 里卡多·雷 , 布赖恩·汤普森 , 汤姆·科米 , 弗雷德里克·布莱恩 , 丹尼尔·多伊奇 , 克雷格·斯图尔特 , 克莱苏拉·泽瓦 , 希拉·卡斯蒂略 , 阿隆·拉维 , 乔治·福斯特 :
WMT23指标共享任务的结果:指标可能是有罪的,但参考并非无辜。 WMT公司 2023 : 578-628 [第12条] 尤拉杰·尤拉斯卡 , 玛拉·芬克尔斯坦 , 丹尼尔·多伊奇 , 阿迪蒂亚·西德汉特 , 梅赫迪·米尔扎扎德 , 马库斯·弗雷塔格 :
MetricX-23:谷歌提交WMT 2023指标共享任务。 世界气象组织 2023 : 756-767 [第11条] 苏巴吉特·纳斯卡 , 丹尼尔·多伊奇 , 马库斯·弗雷塔格 :
使用最小贝叶斯风险进行质量评估。 WMT公司 2023 : 806-811 [第10条] 丹尼尔·多伊奇 , 尤拉杰·尤拉斯卡 , 玛拉·芬克尔斯坦 , 马库斯·弗雷塔格 :
段落级的培训和元评估机器翻译评估指标。 WMT公司 2023 : 996-1013 【c9】 帕特里克·费尔南德斯 , 丹尼尔·多伊奇 , 玛拉·芬克尔斯坦 , 帕克·莱利 , 安德烈·马丁斯 , 格雷厄姆·纽比格 , Ankush Garg公司 , 乔纳森·克拉克 , 马库斯·弗雷塔格 , 奥汉·菲拉特 :
魔鬼在错误中:利用大型语言模型进行细粒度机器翻译评估。 WMT公司 2023 : 1066-1083 [电子2] 丹尼尔·多伊奇 , Rotem Dror公司 , 斯特芬·埃格尔 , 杨高 , 克里斯托夫·莱特 , 尤里·奥皮茨 , 安德烈亚斯·吕克雷 :
第四届NLP系统评估与比较研讨会会议记录,Eval4NLP 2023,印尼巴厘岛,2023年11月1日。 计算语言学协会 2023 ,国际标准图书编号 979-8-89176-021-9 [目录] [i17] 丹尼尔·多伊奇 , 乔治·F·福斯特 , 马库斯·弗雷塔格 :
关系很重要:修改Kendall的Tau以进行现代度量元评估。 CoRR公司 abs/2305.14324 ( 2023 ) [i16] 帕特里克·费尔南德斯 , 丹尼尔·多伊奇 , 玛拉·芬克尔斯坦 , 帕克·莱利 , 安德烈·F·T·马丁斯 , 格雷厄姆·纽比格 , Ankush Garg公司 , 乔纳森·克拉克 , 马库斯·弗雷塔格 , 奥汉·菲拉特 :
魔鬼在错误中:利用大型语言模型进行细粒度机器翻译评估。 CoRR公司 abs/2308.07286 ( 2023 ) 【i15】 丹尼尔·多伊奇 , 尤拉杰·尤拉斯卡 , 玛拉·芬克尔斯坦 , 马库斯·弗雷塔格 :
段落级的培训和元评估机器翻译评估指标。 CoRR公司 abs/2308.13506 ( 2023 ) [第14条] 克里斯托夫·莱特 , 尤里·奥皮茨 , 丹尼尔·多伊奇 , 杨高 , Rotem Dror公司 , 斯特芬·埃格尔 :
Eval4NLP 2023关于将大型语言模型作为可解释指标的提示共享任务。 CoRR公司 腹肌/2310.19792 ( 2023 ) [i13] 詹·托尔斯滕·彼得 , 大卫·维拉尔 , 丹尼尔·多伊奇 , 玛拉·芬克尔斯坦 , 尤拉杰·尤拉斯卡 , 马库斯·弗雷塔格 :
没有更好的数据:使用QE指标进行机器翻译数据过滤。 CoRR公司 abs/2311.05350 ( 2023 ) [i12] 徐文达(Wenda Xu) , 丹尼尔·多伊奇 , 玛拉·芬克尔斯坦 , 尤拉杰·尤拉斯卡 , 张彪 , 刘忠涛 , 威廉·杨旺 , 李雷(Lei Li) , 马库斯·弗雷塔格 :
精确,不批评:通过细粒度的可操作反馈优化大型语言模型。 CoRR公司 abs/2311.09336 ( 2023 ) 2022 【c8】 丹尼尔·多伊奇 , 丹罗斯 :
基于问答的总结评估指标的基准答案验证方法。 ACL(调查结果) 2022 : 3759-3765 【c7】 丹尼尔·多伊奇 , Rotem Dror公司 , 丹罗斯 :
论生成文本无参考评价的局限性。 EMNLP公司 2022 : 10960-10977 【c6】 丹尼尔·多伊奇 , Rotem Dror公司 , 丹罗斯 :
重新检查自动摘要评估指标的系统级相关性。 NAACL-HLT公司 2022 : 6038-6052 [电子1] 丹尼尔·多伊奇 , Udomcharoenchaikit能 , 尤里·奥皮茨 , 杨高 , 玛丽娜·福米切娃 , Steffen Eger公司 :
《NLP系统评估与比较第三次研讨会论文集》,Eval4NLP 2022,在线,2022年11月20日。 计算语言学协会 2022 ,国际标准图书编号 978-1-959429-00-5 [目录] [i11] 丹尼尔·多伊奇 , 丹罗斯 :
基于问答的总结评估指标的基准答案验证方法。 CoRR公司 abs/2204.10206 ( 2022 ) [i10] 丹尼尔·多伊奇 , Rotem Dror公司 , 丹罗斯 :
重新检查自动摘要评估指标的系统级相关性。 CoRR公司 abs/2204.10216 ( 2022 ) [第九章] 丹尼尔·多伊奇 , 丹罗斯 :
Repro:一个开放源代码库,用于提高公开可用研究代码的可复制性和可用性。 CoRR公司 abs/2204.13848 ( 2022 ) [i8] 塞巴斯蒂安·盖尔曼 , 阿比克·巴塔查吉 , 阿比纳亚·马亨德兰 , 王培沂 , 亚历山大·帕潘格里斯 , 阿曼·马丹 , 安吉丽娜·麦克米兰(Angelina McMillan-Major) , 安娜·什维茨 , 阿什什·乌帕迪耶 , 姚冰生 , 布莱恩·威利 , 钱德拉·巴加瓦图拉 , 你朝斌 , 克雷格·汤姆森 , 克里斯蒂娜·加巴西亚 , 王大国 , 丹尼尔·多伊奇 , 熊德义 , 狄金 , 迪米特拉·格卡齐亚 , 德拉戈米尔·拉德夫 , 伊丽莎白·克拉克 , 埃辛·杜尔姆斯 , 费萨尔·拉达克 , 菲利普·金特 , Genta Indra Winata公司 , 亨德里克·斯特罗贝尔 , Hiroaki Hayashi先生 , 杰卡捷琳娜·诺维科娃 , 詹娜·卡内娃 , 詹妮·奇姆 , 周嘉伟 , 乔丹·克莱夫 , 约书亚·梅内斯 , 乔·塞多克 , 尤拉杰·尤拉斯卡 , 考斯特·D·霍尔 , Khyathi Raghavi Chandu公司 , 劳拉·佩雷兹·贝尔特拉奇尼 , 莱昂纳多·里贝罗 , 刘易斯·汤斯顿 , 李章 , 马希玛·普什卡纳 , 马蒂亚斯·克鲁茨 , 迈克尔·怀特 , 米希尔·桑杰·卡勒 , 穆萨·卡马尔·埃丁 , 尼科·达海姆 , Nishant Subramani公司 , 昂德雷·杜塞克 , 保罗·浦亮 , 帕万·萨桑卡·阿曼曼奇 , 齐朱 , 拉蒂什小狗 , 里诺·克里兹 , 里法特·沙里亚尔 , 罗纳德·卡德纳斯 , 萨阿德·马哈茂德 , 萨洛米·奥塞 , 塞缪尔·卡海亚维贾亚 , 萨尼娅·斯塔纳 , 塞巴斯蒂安·蒙特拉 , 谢尔扎·乔利 , 西蒙·米勒 , 塔米德·哈桑 , 沈天豪 , 托辛·P·阿马希德乌米 , 维卡斯·劳纳克 , Vipul Raheja公司 , 维塔利·尼古拉耶夫 , 蔡薇安(Vivian Tsai) , 亚辛·杰尼特 , 应旭 , 一思桑 , 刘一新 , 侯玉芳 :
GEMv2:单行代码中的多语言NLG基准测试。 CoRR公司 abs/2206.11249 ( 2022 ) [i7] 丹尼尔·多伊奇 , Rotem Dror公司 , 丹罗斯 :
论生成文本无参考评价的局限性。 CoRR公司 abs/2210.12563 ( 2022 ) [i6] 李宁·张 , 若昂·塞多克 , 西蒙·米勒 , 侯玉芳 , 塞巴斯蒂安·盖尔曼 , 丹尼尔·多伊奇 , 伊丽莎白·克拉克 , 刘一新 , Miruna诊所 , 萨阿德·马哈茂德 , Khyathi Raghavi Chandu公司 :
大海捞针:MTurk上寻找合格工人的分析总结。 CoRR公司 abs/2212.10397 ( 2022 ) 2021 [注2] 丹尼尔·多伊奇 , 塔妮娅·贝德拉克斯·韦斯 , 丹罗斯 :
将问题回答作为评估摘要内容质量的自动度量。 事务处理。 关联计算。 语言学 9 : 774-789 ( 2021 ) [j1] 丹尼尔·多伊奇 , Rotem Dror公司 , 丹罗斯 :
使用重采样方法对总结评估指标进行统计分析。 事务处理。 关联计算。 语言学 9 : 1132-1146 ( 2021 ) 【c5】 丹尼尔·多伊奇 , 丹罗斯 :
了解内容质量指标衡量摘要信息质量的程度。 CoNLL公司 2021 : 300-309 [i5] 丹尼尔·多伊奇 , Rotem Dror公司 , 丹罗斯 :
使用重采样方法对总结评估指标进行统计分析。 CoRR公司 abs/2104.00054 ( 2021 ) [i4] 丹尼尔·多伊奇 , 丹罗斯 :
基于问题的显著跨度选择,用于更可控的文本摘要。 CoRR公司 abs/2111.07935 ( 2021 ) 2020 【c4】 地煞金达尔 , 丹尼尔·多伊奇 , 丹罗斯 :
被杀比逃跑更重要吗? 显著事件检测的上下文模型。 冷却 2020 : 114-124 [i3] 丹尼尔·多伊奇 , 丹罗斯 :
SaceRouge:一个用于使用和开发总结评估指标的开源库。 CoRR公司 abs/2007.05374 ( 2020 ) [i2] 丹尼尔·多伊奇 , 塔妮娅·贝德拉克斯·韦斯 , 丹罗斯 :
将问题回答作为评估摘要内容质量的自动度量。 CoRR公司 abs/2010.00490 ( 2020 ) [i1] 丹尼尔·多伊奇 , 丹罗斯 :
了解摘要评估指标衡量摘要信息质量的程度。 CoRR公司 abs/2010.12495 ( 2020 )
2010 – 2019
2019 【c3】 丹尼尔·多伊奇 , Shyam Upadhyay先生 , 丹罗斯 :
约束序列推理的通用算法。 CoNLL公司 2019 : 482-492 【c2】 丹尼尔·多伊奇 , 丹罗斯 :
摘要完形填空:主题总结中内容选择的新任务。 EMNLP/IJCNLP(1) 2019 : 3718-3727 2018 【c1】 丹尼尔·多伊奇 , 约翰·休伊特 , 丹罗斯 :
英语派生词法的分布正交聚合模型。 ACL(1) 2018 : 1938-1947