{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2026,1,24]],“日期-时间”:“2026-01-24T16:19:57Z”,“时间戳”:1769271597199,“版本”:”3.49.0“},“引用-计数”:53,“出版商”:“麻省理工学院出版社-期刊”,“内容-域”:{“域”:[],“交叉标记限制”:false},”short-container蒂尔”:[“计算语言学协会学报”],“published-print”:{“date-parts”:[[2020,12]]},“abstract”:“超参数选择是在学术界和工业界构建神经机器翻译(NMT)系统的关键部分。对模型\u2019体系结构或训练配方的细粒度调整可能意味着正面和负面研究结果之间的差异,或者最先进和表现不佳的系统之间的差异。虽然最近的文献已经提出了自动超参数优化(HPO)的方法,但将这些方法应用于神经机器翻译(NMT)的工作有限,部分原因是与训练大量模型变量的实验相关的高昂成本。为了促进这一领域的研究,我们引入了一种基于查找的方法,该方法使用预训练模型库进行快速、低成本的HPO实验。我们的贡献包括:(1)发布了大量经过训练的NMT模型集合,涵盖了广泛的超参数,(2)提出了评估NMT上HPO方法的目标指标,以及(3)针对我们的模型库,对几种HPO方法进行了可复制的基准测试,包括新的基于图形的方法和多目标方法。“,”DOI“:”10.1162\/tacl_a_00322“,”type“:”journal-article“,”created“:{”date-parts“:[[2020,7,20]],”date-time“:”2020-07-20T18:01:16Z“,”timestamp“:1595268076000},”page“:“393-408”,“source”:“Crossref”,“is-referenced-by-count”:11,“title”:[“神经机器翻译系统超参数优化的可复制高效基准“],”前缀“:”10.1162“,”卷“:”8“,”作者“:[{”给定“:”选“,”家族“:”张“,”序列“:”第一“,”从属“:[}”名称“:”约翰霍普金斯大学“}]},{”给出“:”凯文“,”家庭“:”杜“,”顺序“:”附加“,”附属“:[[{“名称”:“约翰·霍普金斯大学。“}]}],”成员“:”281“,”引用“:[{”key“:”bib1“,“author”:”Ambikasaran Sivaram“,”year“:”2014“,”journal-title“:”arXiv预印本arXiv:1403.6015“},{”issue“:“1”,“key”:“bib2”,“doi-asserted-by”:“crossref”,”first page“:“13”,“doi”:“10.1515\/pralin-2017-0005”,“volume”:”108“,”author“:“巴哈·帕尼亚”,“年份”:“2017年”,“新闻标题”:“布拉格数学语言学公报“},{“key”:“bib3”,“volume-title”:“第三届学习表征国际会议论文集”,“author”:“Bahdanau Dzmitry”,“year”:“2015”},“key“:”bib4“,”volume-title“:”第三十届国际机器学习会议论文集“,”author“:”Bardenet R\u00e9mi“,”year“:”2013“}”,{key“:”bib5“,”author“:”Beck Daniel“,”year“:”2016“,”journal-title“:”arXiv预印本arXiv:1604.05073“},{“key”:“bib6”,“first page”:”281“,”volume“:“13”,“author”:“Bergstra James”,“year”:“2012”,“journal-title”:“journal of Machine Learning Research”},“key:”bip7“,”volume-title:“Proceedings of the 25th Advances in Neural Information Systems”,“author“:”Bergstra James S.“,”year“:”2011“},{“key”:“bib8”,“author”:“Britz Denny”,“year”:“2017”,“journal-title”:“arXiv预印本arXiv:1703.03906”},“key“:”bib9“,”author:“Brochu Eric”,“年”:“2010”,“日记标题”:“arXiv预印本arXiv:1012.2599”}、{“密钥”:“bib10”,“卷时间”:“第三秒AAAI人工智能会议”,“作者”:蔡涵”,“年份”:“2018”},{“关键”:“bib11”,“非结构化”:“杜凯文。2018。多目标TED对话任务。http://www.cs.jhu.edu\/~kevinduh\/a\/multitarget-tedtalks\/。“},{”key“:”bib12“,”volume-title“:”进化程序设计国际会议“,”author“:”Eberhart Russell C.“,”year“:”1998“}”,{“key”:“bib13”,“volume-title”:“第29届AAAI人工智能会议论文集”,“author”:“Eggensperger Katharina”,“year”:“2015”},“key“”:”bip14“,”volume-titel“:”2011 IEEE进化计算大会(CEC)”,“作者”:“Emmerich Michael T.M.”,“年份”:“2011”},{“key”:“bib15”,“doi-asserted-by”:“crossref”,”first page“:“3”,“doi”:“10.1007\/978-3-030-05318-5_1”,,“volume-title”:“自动机器学习”,“author”:“Feurer Matthias”,“year”:“2019”}第二十届AAAI人工智能会议”,“作者”:“Feurer Matthias”,“年份”:“2015”},{“key”:“bib17”,“author”:“Frazier Peter I.”,“年”:“2018”,“新闻标题”:“arXiv预印本arXiv:1807.02811”}年份“:”2017“},{“issue”:“1”,“key”:“bib19”,“doi-asserted-by”:“crossref”,“first page”:”5“,”doi“:”10.1007\/s00778-006-0029-7“,”volume“:”16“,”author“:”Godfrey Parke“,”year“:”2007“,”journal-title“:”The VLDB JournalThe International journal on Very Large Data Bases“}”,{”key“:“bib20”,“author”:“Hansen Nikolaus”,“year”:“2016年”,“新闻标题”:“arXiv预印本arXiv:1605.03560“},{“key”:“bib21”,“author”:“Hieber Felix”,“year”:“2017”,“journal-title”:“arXiv preprint arXiv:1712.05690”},}“key:”bib22“,”volume-title“:”第五届国际学习与智能优化会议论文集“,”author“:”Hutter Frank“,”year“:”2011“}”,{”issue“:”4“,”key“:”bib23“,”doi-asserted-by“:“”crossref“,”first page“:”455“,”DOI“:”10.1023\/A:1008306431147“,“volume”:“13”,“author”:“Jones Donald R.”,“year”:“1998”,“journal-title”:“Global Optimization journal”},{“key”:”bib24“,”author“:”Klein Aaron“,”year“2019”,”journal-title“:”arXiv预印本arXiv:1905.12982“:”2019“,”新闻标题“:”arXiv预印本arXiv:1905.04970“},{“key”:“bib26”,“volume-title”:“人工智能(UAI)不确定性会议论文集”,“author”:“Li Liam”,“year”:“2019”},“key“:”bib27“,“volum-title“:”第四届机器翻译会议论文集“,”author“:”Li Xian“,“year-title2018年”,“期刊标题”:“arXiv预印本arXiv:1805.02094”},{“关键”:“bib29”,“卷名”:“欧洲计算机视觉会议论文集(ECCV)”,“作者”:“刘辰溪”,“年份”:“2018年”},{'关键“:”bib30“,“卷题”:”国际学习表征会议“,”作者“:”刘汉晓“,”年份“:”2018“},{”问题“:”1“,”关键“:“bib31”,”doi-asserted-by“:”crossref“,”first-page“:”18“,”doi“:”10.1007\/s13721-016-0125-6“,”volume“:”5“,”author“:”罗刚“,”year“:”2016“,”journal-title“:”卫生信息学和生物信息学中的网络建模分析“},{“key”:“bib32”,“author”:“苗亦舒”,“year”:“2014”,“journal-title”:“arXiv预印本arXiv:1412.7180”},}“key”:“bib33”,“卷时间“:”计算语言学协会第40届年会论文集”,“作者”:“Papineni Kishore”,“年份”:“2002年”},{“问题”:“6”,“关键”:“bib34”,“doi-asserted-by”:“crossref”,“首页”:“1265”,“doi”:“10.1007\/s1122-014-9477-x”,“卷”:“25”,“作家”:“Picheny Victor”,《年份》:“2015”,“新闻标题”:“统计与计算”}bib35“,”doi-asserted-by“:”crossref“,”first page“:”784“,”doi“:”10.1007\/978-3-540-87700-4_78“,”volume-title“:”自然并行问题解决国际会议“,”author“:”Ponweiser Wolfgang“,”year“:”2008“},{“key”:”bib36“,”volume-title:“第十四届国际口语翻译研讨会论文集”,“author”:“秦昊”,“年份:“2017年”},{“key”:“bib37”,“首页”:“63”,“volume-title”:“机器学习暑期学校”,“author”:“Rasmussen Carl Edward”,“年份”:“2003”}I“:”10.1214\/lnms\/1215456182“,”author“:”Schonlau Matthias“,”year“:”1998“,”journal-title“:”讲座笔记-专题系列“},{“key”:“bib40”,“volume-title”:“计算语言学协会第54届年会会议记录”,“author”:“Sennrich Rico”,“year”:“2016”},“key“:”bib41“,”first page“:“1919”,“volume-title:”国际机器学习会议”,“author”:“Shah Amar”,“year”:“2016”},{“issue”:“1”,“key”:“bib42”,“doi-asserted-by”:“crossref”,“first page”:”148“,“doi”:“10.1109\/JPROC.2015.2494218”,“volume”::“104”,“author”:“Shahriari Bobak”,“年份”:“2015”,“journal-title”:“IEEE会议记录”}“:”进化优化算法”,“author”:“Simon Dan”,“year”:“2013”},{“key”:“bib44”,“volume-title”:“第32届国际机器学习会议论文集”,“author”:“Snoek Jasper”,“年”:“2015”}、{“密钥”:“bib45”,“volume-titel”:“36届国际机器教学会议论文集“,”author“:”So David“,”year“2019”},{“key”:“bib46”,“volume-title”:“Proceedings of the 28th Advances in Neural Information Processing Systems”,“author”:“Sutskever Ilya”,“year”:“2014”},{”key“:”bib47“,”doi-asserted-by“:”crossref“,”first page“:“250”,“doi”:“10.1016\/j.csda.2015.08.011”,“卷”:“94”,“作者”:“Svenson Joshua”,“年份”:“2016”,“journal title”:“计算统计与数据分析”},{“key”:“bib48”,“volume-title”:“神经信息处理系统第31次进展会议”,“author”:“Vaswani Ashish”,“year”:“2017”}、{“key”:《bib49》,“author”:“Ying Chris”,“year”:《2019》,“journal title”:《arXiv预印本arXiv:1902.09635》},“key“bib50”,“unstructured”:“Xiaojin Zhu.2005。用图形进行半监督学习。博士论文。“},{”key“:”bib51“,”volume-title“:”第20届国际机器学习会议(ICML-03)“,”author“:”朱晓津“,”year“:”2003“}“,{“key”:”bib22“,”volume-tittle“:“国际自然并行问题解决大会”,”auther“:”Zitzler Eckart“,”“year”:“1998”},”{“key”:“bib53”,“author”:“Zoph Barret”,”year:“2016”,“journal-title“:”arXiv-print arXiv:1611.01578“}],“container-title”:[“计算语言学协会的事务”],“original-title:[],“language”:“en”,“link”:[{“URL”:“https:\/\/www.mitpressjournals.org\/doi\/pdf\/10.1162\/tacl_a_00322”,“content-type”:“unspecified”,“内容-版本”:“vor”,“intended-application”:“”相似性检查“}”,“存放”:{“日期部分”:[[2021,3,12]],“日期时间”:“2021-03-12T21:39:40Z”,“时间戳”:1615585180000},“分数”:1,“资源”:{“主要”:}“URL”:“https:\/\/direct.mit.edu\/tacl\/article\/96458”},”副标题“[],”短标题“:[],“已发布”:{-“日期部分“:[2020,12]]},nces-count“:53,”alternative-id“:[”10.1162\/tacl_a_00322“],”URL“:”https:\/\/doi.org\/10.1162\/tacl_a_00322“,”relationship“:{},”ISSN“:[”2307-387X“],”ISSN-type“:[{”value“:”2307-38.7X“,”type“:”electronic“}],”subject“:【】,”published“:{”date-parts“:[2020,12]}}}}