×

跨越对话鸿沟:面向多语言任务的对话系统的自然语言处理入门。 (英语) Zbl 07566013号

摘要:在面向任务的对话(ToD)中,用户与人工代理进行对话,目的是完成具体的任务。尽管这项技术代表了人工智能的中心目标之一,并且一直是更为密集的研究和开发工作的重点,但目前它仅限于几个狭窄的领域(例如,点菜、订票)和少数语言(例如,英语、汉语)。这项工作提供了对多语言ToD中现有方法和资源的广泛概述,作为这一激动人心的新兴领域的切入点。我们发现,阻碍创建真正多语言ToD系统的最关键因素是缺乏用于培训和评估的大多数语言的数据集。事实上,为模块化系统的每个组件或需要数据的端到端系统获取注释或人工反馈是昂贵且乏味的。因此,最先进的多语言ToD方法主要依赖于资源丰富的语言(几乎完全是英语)通过(i)机器翻译或(ii)多语言表示进行的(零或少量)跨语言传输。这些方法目前仅适用于类型相似的语言和具有并行/单语语料库的语言。另一方面,由于缺乏语言多样性基准(尤其是自然语言生成和端到端评估),它们在这些边界之外的有效性值得怀疑或难以评估。为了克服这一限制,我们将ToD管道的组件与其他NLP任务进行了比较,这可以为低资源场景中的学习提供解决方案。最后,我们列出了多语种对相关领域带来的额外挑战(如语音、生成文本的流利性和以人为中心的评估),并指出了未来的发展方向,有望进一步扩大当前ToD系统的语言覆盖范围和对话能力。

MSC公司:

68泰克 人工智能
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adiwardana,D.,Luong,M.-T.,So,D.R.,Hall,J.,Fiedel,N.,Thoppilan,R.,Yang,Z.,Kulshreshtha,A.,Nemade,G.,Lu,Y.等人(2020年)。走向人性化的开放域聊天机器人。arXiv预印本arXiv:2001.09977。
[2] Agarwal,S.、Bui,T.、Lee,J.-Y.、Konstas,I.和Rieser,V.(2020年)。视觉对话的历史:我们真的需要它吗?。《ACL 2020会议录》,第8182-8197页。
[3] Ahn,E.、Jimenez,C.、Tsvetkov,Y.和Black,A.W.(2020年)。对话系统中哪些代码切换策略有效?。《SCIL 2020会议录》,第254-264页。
[4] AlAmri,H.、Cartillier,V.、Das,A.、Wang,J.、Cherian,A.、Essa,I.、Batra,D.、Marks,T.K.、Hori,C.、Anderson,P.、Lee,S.和Parikh,D.(2019)。视听场景感知对话框。《2019年CVPR会议记录》,第7558-7567页。
[5] Alt,C.,Hübner,M.,&Hennig,L.(2019年)。将预训练的变压器语言模型微调为远程监督关系提取。2019年ACL会议记录,pp。
[6] Altinok,D.(2018)。基于本体论的银行和金融对话系统的对话管理系统。第一届财务叙述处理研讨会会议记录
[7] Ansell,A.、Ponti,E.M.、Pfeiffer,J.、Ruder,S.、Glavaš,G.、Vulić,I.和Korhonen,A.(2021)。MAD-G:高效跨语言传输的多语言适配器生成。InFindings公司
[8] Arivazhagan,N.、Bapna,A.、Firat,O.、Lepikhin,D.、Johnson,M.、Krikun,M.,Chen,M.X.、Cao,Y.、Foster,G.F.、Cherry,C.、Macherey,W.、Chen,Z.和Wu,Y.(2019年)。大规模多语言神经机器翻译:发现和挑战。CoRR公司,
[9] Arora,A.、Shrivastava,A.,Mohit,M.、Lecanda,L.S.-M.和Aly,A.(2020年)。用于检测Covid-19言语意图的跨语言迁移学习。OpenReview。
[10] Artetxe,M.、Labaka,G.和Agirer,E.(2018年)。一种用于单词嵌入的完全无监督跨语言映射的鲁棒自学习方法。《2018年ACL会议记录》,第789-798页。
[11] Artetxe,M.、Labaka,G.和Agirer,E.(2020年)。跨语言迁移学习中的翻译假象。《2020年EMNLP会议记录》,第7674-7684页。
[12] Baevski,A.、Hsu,W.N.、Conneau,A.和Auli,M.(2021)。无监督语音识别。神经信息处理系统研究进展2021年,第34卷。
[13] Banea,C.、Mihalcea,R.、Wiebe,J.和Hassan,S.(2008年)。使用机器翻译进行多语言主观性分析。2008年经验方法会议记录
[14] Banerjee,S.和Khapra,M.M.(2019年)。面向目标对话系统的具有顺序注意力的图卷积网络。TACL公司,7485-500。
[15] Bastianelli,E.、Vanzo,A.、Swietojanski,P.和Rieser,V.(2020年)。SLURP:一个口语理解资源包。《EMNLP 2020会议录》,第7252-7262页。
[16] 贝特曼,J.A.(1997)。支持多语言自然语言生成的技术:kpml开发环境。自然语言工程,3(1),15-55。
[17] Bellomaria,V.、Castellucci,G.、Favalli,A.和Romagnoli,R.(2019年)。Almawave-SLU:意大利语SLU的新数据集。CoRR,abs/1907.07526。
[18] Beltagy,I.、Peters,M.E.和Cohan,A.(2020年)。Longformer:长文档转换器。CORR,2004.05150。
[19] Bhattacharjee,K.、Ballesteros,M.、Anubhai,R.、Muresan,S.、Ma,J.、Ladhak,F.和AlOnaizan,Y.(2020年)。BERT与否:比较特定任务和不确定任务的半监督序列标记方法。EMNLP程序
[20] Bohus,D.和Rudnicky,A.I.(2009年)。ravenclaw对话框管理框架:架构和系统。计算机语音与语言,23(3),332-361。
[21] Bollmann,M.(2011)。将simpleng改为德语。《第13届欧洲自然语言生成研讨会论文集》,第133-138页。
[22] Bonneau-Maynard,H.、Rosset,S.、Ayache,C.、Kuhn,A.和Mostefa,D.(2005年)。法语媒体对话语料库的语义注释。第九届欧洲会议记录
[23] Budzianowski,P.和Vulić,I.(2019年)。你好,我是GPT-2。我能帮你什么吗?面向任务的对话系统中预处理语言模型的使用。诉讼中
[24] Budzianowski,P.、Wen,T.-H.、Tseng,B.-H.、Casanueva,I.、Ultes,S.、Ramadan,O.和Gasic,M.(2018)。MultiWOZ-用于面向任务的对话建模的大规模多域Wizard-of-Oz数据集。《EMNLP 2018年诉讼汇编》,第5016-5026页。
[25] Bunk,T.、Varshneya,D.、Vlasov,V.和Nichol,A.(2020年)。饮食:对对话系统的轻量级语言理解。CORR,2004.09936。
[26] Byrne,B.、Krishnamoorthi,K.、Sankar,C.、Neelakantan,A.、Goodrich,B.、Duckworth,D.、Yavuz,S.、Dubey,A.、Kim,K.-Y.和Cedilnik,A.(2019年)。Taskmaster-1:走向
[27] Cao,S.、Kitaev,N.和Klein,D.(2020a)。上下文词表示的多语言对齐。《2020年ICLR会议记录》。
[28] 曹毅、卢坤、陈旭和张旭(2020b)。通过事后观察和用户建模进行自适应对话策略学习。《SIGDIAL 2020会议记录》,第329-338页。
[29] 曹毅、胡志军、蔡天胜、刘志军和纪浩(2019)。使用弱标记数据学习的低资源名称标记。《2019年EMNLP-IJCNLP会议记录》,第261-270页。
[30] Casanueva,I.、Temčinas,T.、Gerz,D.、Henderson,M.和Vulić,I..(2020年)。使用双句子编码器进行高效的意图检测。第二届自然科学研讨会论文集
[31] Cascallar-Funtes,A.、Ramos-Soto,A.和Bugarin Diz,A.(2018年)。将SimpleNLG改编为加利西亚语。第十一届自然科学国际会议记录
[32] Castellucci,G.、Bellomaria,V.、Favalli,A.和Romagnoli,R.(2019年)。基于BERT的联合模型中的多语言意图检测和时隙填充。arXiv预打印arXiv:1907.02884。
[33] Chen,D.L.、Kim,J.和Mooney,R.J.(2010)。训练多语种体育播音员:利用感知语境学习语言。《人工智能研究杂志》,37,397-435·Zbl 1210.68079号
[34] Chen,H.、Liu,X.、Yin,D.和Tang,J.(2017)。对话系统调查:最新进展和新领域。SIGKDD探索,19(2),25-35。
[35] Chen,Q.,Zhuo,Z.,&Wang,W.(2019年)。BERT用于联合意图分类和插槽填充。arXiv预打印arXiv:1902.10909。
[36] Chen,W.、Chen,J.、Su,Y.、Wang,X.、Yu,D.、Yan,X.和Wang,W.Y.(2018)。Xl-nbt:一个跨语言神经信念跟踪框架。《2018年EMNLP会议记录》,pp。
[37] Cheng,J.、Agrawal,D.、Martínez Alonso,H.、Bhargava,S.、Driesen,J.,Flego,F.、Kaplan,D.、Kartsaklis,D.、Li,L.、Piraviperumal,D.、Williams,J.D.、Yu,H.,Oz Séaghdha,D.和Johansen,A.(2020年)。对话状态跟踪的对话语义分析。
[38] Cheyer,A.和Guzzoni,D.(2006年)。用于构建智能自动助理的方法和设备。EPFL技术代表。
[39] Chi,Z.、Dong,L.、Wei,F.、Wang,W.、Mao,X.-L.和Huang,H.(2020年)。通过预培训生成跨语言自然语言。AAAI会议记录
[40] Clark,J.H.、Choi,E.、Collins,M.、Garrette,D.、Kwiatkowski,T.、Nikolaev,V.和Palomaki,J.(2020)。TyDi QA:信息搜索问题回答的基准
[41] Conneau,A.、Baevski,A.、Collobert,R.、Mohamed,A.和Auli,M.(2021)。语音识别的无监督跨语言表征学习。INTERSPEECH会议记录
[42] Conneau,A.,Khandelwal,K.,Goyal,N.,Chaudhary,V.,Wenzek,G.,GuzmáN,F.,Grave,E.,Ott,M.,Zettlemoyer,L.,&Stoyanov,V.(2020年)。无监督的跨语言表征学习量表。《2020年ACL诉讼汇编》,第8440-8451页。
[43] Conneau,A.、Rinott,R.、Lample,G.、Williams,A.、Bowman,S.、Schwenk,H.和Stoyanov,V.(2018)。XNLI:评估跨语言句子表达。2018年EMNLP会议记录,第2475-2485页。
[44] Conneau,A.、Wu,S.、Li,H.、Zettlemoyer,L.和Stoyanov,V.(2020年)。预处理语言模型中出现的跨语言结构。《ACL 2020会议记录》,第6022-6034页。
[45] Coope,S.、Farghly,T.、Gerz,D.、Vulić,I.和Henderson,M.(2020年)。Span-ConveRT:使用经过预处理的会话表示进行对话的少量快照跨度提取。诉讼中
[46] Coucke,A.、Saade,A.、Ball,A.、Bluche,T.、Caulier,A.、Leroy,D.、Doumouro,C.、Gisselbrecht,T.,Caltagirone,F.、Lavril,T.等人(2018年)。SNIPS语音平台:嵌入式
[47] Cuayáhuitl,H.(2017)。简单:一个简单的深度强化学习对话系统。《与社交机器人的对话》,第109-118页。斯普林格。
[48] Dabre,R.、Nakagawa,T.和Kazawa,H.(2017)。神经机器翻译中迁移学习的语言相关性实证研究。第31届太平洋会议记录
[49] Dai,X.和Adel,H.(2020年)。命名实体识别的简单数据增强分析。《2020年COLING会议录》,第3861-3867页。
[50] Daiber,J.、Stanojević,M.和Sima'an,K.(2016年)。通过语言类型学进行普遍的重新排序。《2016年COLING会议记录》,第3167-3176页。
[51] Dao,M.H.,Truong,T.H.和Nguyen,D.Q.(2021)。越南人的意图检测和插槽填充。2011年国际演讲会会议记录,第4698-4702页。
[52] De Oliveira,R.和Sripada,S.(2014)。调整simpleng以实现巴西葡萄牙语。第八届国际自然语言生成会议(INLG)论文集,第93-94页。
[53] de Vries,H.、Strub,F.、Chandar,S.、Pietquin,O.、Larochelle,H.和Courville,A.C.(2017)。客人什么?!通过多模态对话发现视觉对象。在的诉讼中
[54] Denecke,K.、Tschanz,M.、Dorner,T.L.和May,R.(2019年)。医疗保健领域的智能对话代理:炒作或希望。Stud Health Technol Inform,259,77-84。
[55] Deriu,J.、Rodrigo,A.、Otegi,A.和Echegoyen,G.、Rosset,S.、Agire,E.和Cieliebak,M.(2021年)。对话系统评价方法调查。人工智能
[56] Devlin,J.、Chang,M.-W.、Lee,K.和Toutanova,K.(2019年)。BERT:深度双向变换器的预训练,用于语言理解。NAACL-HLT诉讼
[57] Dinan,E.,Logacheva,V.,Malykh,V..,Miller,A.,Shuster,K.,Urbanek,J.,Kiela,D.,Szlam,A.,塞尔维亚人,I.,Lowe,R.,Prabhumoye,S.,Black,A.W.,Rudnicky,A.,Williams,J。,
[58] Ding,B.,Hu,J.,Bing,L.,Aljunied,S.M.,Joty,S.,Si,L.和Miao,C.(2022)。GlobalWoZ:全球化MultiWoZ以开发多语言任务导向对话系统。
[59] Dou,Z.-Y.和Neubig,G.(2021)。通过微调并行语料库上的嵌入来进行单词对齐。《EACL 2021会议记录》,第2112-2128页。
[60] Du,J.,Grave,E.,Gunel,B.,Chaudhary,V.,Celebi,O.,Auli,M.,Stoyanov,V.和Conneau,A.(2021)。自我训练改善了自然语言理解的前期训练。。
[61] Duan,X.、Yin,M.、Zhang,M.,Chen,B.和Luo,W.(2019年)。通过教学生成和注意力进行零镜头跨语言抽象句总结。在的诉讼中
[62] Durrett,G.、Pauls,A.和Klein,D.(2012年)。使用双语词典进行句法转换。《2012年自然语言处理和计算自然语言学习实证方法联合会议论文集》,第1-11页,韩国济州岛。计算语言学协会。
[63] Dušek,O.和Jurčick,F.(2019年)。捷克的神经生成:数据和基线。第十二届自然语言生成国际会议,第563-574页。
[64] Dyer,C.、Chahuneau,V.和Smith,N.A.(2013年)。简单、快速、有效地重新参数化ibm模型2。《2013年NAACL-HLT会议记录》,第644-648页。
[65] Edunov,S.、Ott,M.、Auli,M.和Grangier,D.(2018年)。理解大规模的反向翻译。2018年EMNLP会议记录,第489-500页。
[66] El Asri,L.、He,J.和Suleman,K.(2016)。口语对话系统中用户模拟的序列到序列模型。2016年INTERSPEECH会议记录,第1151-1155页。
[67] Elhadad,M.和Robin,J.(1996年)。SURGE概述:一个可重用的综合句法实现组件。第八届国际自然语言生成研讨会
[68] Elliott,D.、Frank,S.、Sima'an,K.和Specia,L.(2016)。Multi30K:多语言英语德语图像描述。《第五届视觉与语言研讨会论文集》,第70-74页。
[69] Eric,M.、Goel,R.、Paul,S.、Sethi,A.、Agarwal,S.和Gao,S.,Kumar,A.、Goyal,A.K.、Ku,P.和Hakkani-TüR,D.(2020年)。Multiwoz 2.1:具有状态校正和状态跟踪基线的整合多域对话数据集。LREC诉讼
[70] Eric,M.、Krishnan,L.、Charette,F.和Manning,C.D.(2017年)。面向任务的对话的键值检索网络。2017年SIGDIAL会议记录,第37-49页。
[71] Fan,A.、Bhosale,S.、Schwenk,H.、Ma,Z.、El-Kishky,A.、Goyal,S.,Baines,M.、Celebi,O.、Wenzek,G.、Chaudhary,V.、Goyall,N.、Birch,T.、Liptchinsky,V、Edunov,S.和Grave,E.、Auli,M.和Joulin,A.(2021年)。超越以英语为中心的多语言机器翻译。机器学习研究杂志,22,1-48·Zbl 07370624号
[72] Farajian,M.A.、Lopes,A.V.、Martins,A.F.T.、Maruf,S.和Haffari,G.(2020年)。WMT 2020的调查结果分享了聊天翻译的任务。第五届会议记录
[73] Filippova,K.和Strube,M.(2007年)。在德语子句中生成组成顺序。在计算语言学协会第45届年会的会议记录中·Zbl 1162.68718号
[74] Finn,C.、Abbeel,P.和Levine,S.(2017年)。用于快速适应深层网络的模型认知元学习。《2017年国际资本市场协会会议记录》,第1126-1135页。
[75] Fitzgerald,J.、Hench,C.、Peris,C.、Mackie,S.、Rottmann,K.、Sanchez,A.、Nash,A.、Urbach,L.、Kakarala,V.、Singh,R.、Ranganath,S.,Christ,L.,Britan,M.、Leeuwis,W.、Tur,G.和Natarajan,P.(2022年)。海量:一个包含51种类型多样语言的100万种示例多语言自然语言理解数据集。科尔,2204.08582。
[76] Gao,F.,Zhu,J.,Wu,L.,Xia,Y.,Qin,T.,Cheng,X.,Zhou,W.,&Liu,T.-Y.(2019)。用于神经机器翻译的软上下文数据增强。ACL诉讼
[77] Gao,G.,Choi,E.,Chio,Y.,&Zettlemoyer,L.(2018年)。上下文中的神经隐喻检测。2018年自然语言实证方法会议记录
[78] Garbacea,C.和Mei,Q.(2020年)。神经语言生成:公式、方法和评估。arXiv预打印arXiv:2007.15780。
[79] Garcia,X.、Siddhant,A.、Firat,O.和Parikh,A.P.(2020年)。在罕见语言的无监督机器翻译中利用多语性。CoRR,abs/2009.11201。
[80] García-Méndez,S.、Fernández-Gavilanes,M.、Costa-Montengore,E.、Juncal-Martínez,J.和Javier González-Castaño,F.(2019)。西班牙语文本的自动自然语言生成库。应用专家系统,120,372-386。
[81] Garg,S.和Ramakrishnan,G.(2020年)。BAE:基于BERT的文本分类对抗示例。《EMNLP 2020年诉讼汇编》,第6174-6181页。
[82] Gatt,A.和Krahmer,E.(2018年)。自然语言生成技术现状综述:核心任务、应用和评估。《人工智能研究杂志》,61,65-170·Zbl 1426.68265号
[83] Gatt,A.和Reiter,E.(2009年)。Simpleng:用于实际应用的实现引擎。《第十二届欧洲自然语言生成研讨会论文集》(ENLG 2009),第90-93页。
[84] Gehrmann,S.、Adewumi,T.、Aggarwal,K.、Ammanamanchi,P.S.、Aremu,A.、Bosselut,A.、Chandu,K.R.、Clinciu,M.-A.、Das,D.、Dhole,K.等人(2021年)。gem基准:自然语言生成、评估和度量。第一届会议记录
[85] Gella,S.、Sennrich,R.、Keller,F.和Lapata,M.(2017年)。用于学习多语言多模式表示的图像旋转。2017年EMNLP会议记录,第2839-2845页。
[86] Gerz,D.、Vulić,I.、Ponti,E.M.、Reichart,R.和Korhonen,A.(2018年)。语言类型学和多语言建模的局限性之间的关系。
[87] Ghoshal,A.、Swietojanski,P.和Renals,S.(2013年)。深度神经网络的多语言训练。2013年ICASSP会议记录,第7319-7323页。
[88] Glavaš,G.、Litschko,R.、Ruder,S.和Vulić,I.(2019年)。如何(正确)评估跨语言单词嵌入:基于强有力的基线、比较分析和一些误解。
[89] Glavaš,G.和Vulić,I.(2018年)。分布词向量的显式更新。《2018年ACL会议记录》,第34-45页。
[90] Glavaš,G.和Vulić,I.(2020年)。非同构嵌入空间的基于非线性实例的跨语言映射。《ACL 2020会议记录》,第7548-7555页。
[91] 龚瑜、罗瑜、朱瑜、欧瑜、李瑜、朱美美、朱克强、段丽莉、陈瑜(2019)。深度级联多任务学习,用于在线购物助手的槽填充。
[92] Goo,C.-W.,Gao,G.,Hsu,Y.-K.,Huo,C.-L.,Chen,T.-C.,Hsu.,K.-W.和Chen,Y.-N.(2018年)。缝隙填充和意图预测的缝隙门建模。诉讼程序
[93] Gritta,M.、Hu,R.和Iacobacci,I.(2022)。CrossAligner&Co:面向任务的跨语言自然语言理解的零镜头传输方法。ACL的调查结果
[94] Gritta,M.和Iacobacci,I.(2021)。XeroAlign:零炮跨语言变压器对齐。ACL-IJCNLP 2021的调查结果,第371-381页。计算语言学协会。
[95] Gunasekara,C.、Kim,S.、D’Haro,L.F.、Rastogi,A.、Chen,Y.-N.、Eric,M.、Hedayatnia,B.、Gopalakrishnan,K.、Liu,Y.、Huang,C.-W等人(2020)。第九届Dialog系统技术挑战概述:DSTC9。arXiv预打印arXiv:2011.06486。
[96] Guo,D.、Tur,G.、Yih,W.-t.和Zweig,G.(2014)。基于递归神经网络的语义话语分类和时隙填充。2014年IEEE口语技术
[97] 郭,J.,何,H.,何T.,劳森,L.,李,M.,林,H.、石,X.,王,C.、谢,J.、查,S.等(2020)。Glouncv和glounnlp:计算机视觉和自然语言的深度学习
[98] Gupta,N.、Tur,G.、Hakkani-Tur,D.、Bangalore,S.、Riccardi,G.和Gilbert,M.(2005)。at&t口语理解系统。IEEE音频、语音、,
[99] Gururangan,S.、Marasović,A.、Swayamdipta,S.,Lo,K.、Beltagy,I.、Downey,D.和Smith,N.A.(2020年)。不要停止预培训:根据领域和任务调整语言模型。
[100] Haihong,E.、Zhang,W.和Song,M.(2019)。Kb-transformer:将知识整合到端到端的面向任务的对话系统中。2019年第15届国际会议
[101] Hakkani-Tür,D.,Tur,G.,Celikyilmaz,A.,Chen,Y.-N.,Gao,J.,Deng,L.,&Wang,Y.-Y.(2016)。使用双向rnn-lstm的多域联合语义框架解析。
[102] Ham,D.、Lee,J.-G.、Jang,Y.和Kim,K.-E.(2020年)。使用GPT-2的目标对话系统的端到端神经管道。《ACL 2020会议记录》,第583-592页。
[103] Hammarström,H.、Forkel,R.和Haspelmath,m.(2017年)。Glottolog 3.0。马克斯·普朗克人类历史科学研究所技术代表。
[104] Hardy,H.、Strzalkowski,T.、Wu,M.、Ursu,C.、Webb,N.、Biermann,A.、Inouye,R.B.和McKenzie,A.(2004)。自动化对话系统的数据驱动策略。计算协会第42届年会会议记录
[105] He,K.,Xu,W.,&Yan,Y.(2020年)。多层次的跨语言迁移学习,共享语言和特定的口语理解知识。IEEE接入,829407-29416。
[106] He,X.,Deng,L.,Hakkani-Tur,D.,&Tur,G.(2013)。多风格自适应训练,增强跨语言口语理解能力。2013年ICASSP会议记录,第8342-8346页。电气与电子工程师协会。
[107] Hedderich,M.A.、Adelani,D.I.、Zhu,D.、Alabi,J.O.、Markus,U.和Klakow,D.(2020年)。多语言Transformer模型的迁移学习和远程监控研究
[108] Hedderich,M.A.、Lange,L.、Adel,H.、Strötgen,J.和Klakow,D.(2021年)。一项关于低资源场景中自然语言处理的最新方法的调查。诉讼程序
[109] Henderson,M.、Casanueva,I.、MrkšIć,N.、Su,P.-H.、Wen,T.-H.和Vulić(2020)。对话:来自变压器的高效准确的对话表示。诉讼中
[110] Henderson,M.、Thomson,B.和Williams,J.D.(2014a)。第二个对话框状态跟踪挑战。SIGDIAL 2014年会议记录,第263-272页。
[111] Henderson,M.、Thomson,B.和Young,S.(2014b)。基于单词的递归神经网络对话状态跟踪。SIGDIAL 2014年会议记录,第292-299页。
[112] Henderson,M.和Vulić,I.(2021)。ConVEx:数据效率高,快照插槽标签少。NAACL-HLT 2021会议记录。
[113] Henderson,M.,Vulić,I.,Casanueva,I..,Budzianowski,P.,Gerz,D.,Coope,S.,Spithourakis,G.,Wen,T.-H.,MrkšIć(N.),&Su,P.-H.(2019a)。多反应:基于等级的任务导向对话方法,应用于餐厅搜索和预订。诉讼中
[114] Henderson,M.,Vulić,I.,Gerz,D.,Casanueva,I..,Budzianowski,P.,Coope,S.,Spithourakis,G.,Wen,T.-H.,MrkšIć(N.),&Su,P.-H.(2019b)。训练神经反应选择
[115] Heracleous,P.、Mohammad,Y.和Yoneyama,A.(2020年)。集成语言和情感特征,用于多语言语音情感识别。国际会议
[116] Hershcovich,D.,Frank,S.,Lent,H.,de Lhoneux,M.,Abdou,M.、Brandl,S.、Bugliarello,E.、Piqueras,L.C.、Chalkidis,I.、Cui,R.等人(2022年)。跨文化自然语言处理的挑战与策略。。
[117] Hinton,G.、Vinyals,O.和Dean,J.(2015)。在神经网络中提取知识。在NeurIPS深度学习研讨会的过程中。
[118] Hori,C.、Perez,J.、Higashinaka,R.、Hori,T.、Boureau,Y.-L.、Inaba,M.、Tsunomori,Y.、Takahashi,T.、Yoshino,K.和Kim,S.(2019)。第六对话框系统概述
[119] Howcroft,D.M.、Belz,A.、Clinciu,M.-A.、Gkatzia,D.、Hasan,S.A.、Mahamood,S.、Mille,S.,Van Miltenburg,E.、Santhanam,S.和Rieser,V.(2020年)。二十年来人类评估的困惑:Nlg需要评估表和标准化定义。
[120] Hu,J.、Ruder,S.、Siddhant,A.、Neubig,G.、Firat,O.和Johnson,M.(2020年)。XTREME:用于评估跨语言泛化的大规模多语言多任务基准。《2020年ICML诉讼汇编》,第4411-4421页。
[121] Hung,C.-C.,Lauscher,A.,Vulić,I.,Ponzetto,S.P.,&Glavaš,G.(2022)。Multi2woz:一个健壮的多语言数据集和面向任务的对话的会话预训练。
[122] Jain,A.、Paranjape,B.和Lipton,Z.C.(2019年)。通过机器翻译进行跨语言NER的实体投影。《2019年EMNLP-IJCNLP会议记录》,第1083-1092页。
[123] Joshi,P.、Santy,S.、Budhiraja,A.、Bali,K.和Choudhury,M.(2020年)。NLP世界中语言多样性和包容性的现状和命运。《ACL 2020会议记录》,第6282-6293页。
[124] Joulin,A.、Bojanowski,P.、Mikolov,T.、Jégou,H.和Grave,E。(2018). 翻译中的失落:根据检索标准学习双语单词映射。EMNLP程序
[125] Kendall,D.E.、Linden,R.和Murray,J.L.(2005)。我们时代的社会学。加利福尼亚州托姆森·沃兹沃斯·贝尔蒙特。
[126] Khanpour,H.、Guntakandla,N.和Nielsen,R.(2016)。使用深度递归神经网络对领域无关对话中的对话行为进行分类
[127] Khanuja,S.、Dandapat,S.,Srinivasan,A.、Sitaram,S.和Choudhury,M.(2020年)。GLUECoS:代码切换NLP的评估基准。《ACL 2020会议记录》,pp。
[128] Khashabi,D.、Stanovsky,G.、Bragg,J.、Lourie,N.、Kasai,J.,Choi,Y.、Smith,N.A.和Weld,D.S.(2021年)。Genie:文本人性化评价排行榜
[129] Kiela,D.、Vulić,I.和Clark,S.(2015)。转换ConvNet特征的可视化双语词典归纳。2015年EMNLP会议记录,第148-158页。
[130] Kim,S.和Banchs,R.E.(2014)。R-cube:餐厅推荐和预订的对话代理。InSignal and Information Processing Association年度峰会
[131] Kim,S.、D’Haro,L.F.、Banchs,R.E.、Williams,J.D.、Henderson,M.和Yoshino,K.(2016)。第五个对话框状态跟踪挑战。2016年IEEE口语技术
[132] Kim,S.,Yang,S.、Kim,G.和Lee,S.-W.(2020年)。通过选择性地重写内存来实现高效的对话状态跟踪。《ACL 2020会议记录》,第567-582页。
[133] Kim,Y.-B.、Kim,D.、Kumar,A.和Sarikaya,R.(2018年)。具有个性化关注的高效大规模神经领域分类。2018年ACL会议记录,第2214-2224页。
[134] Kim,Y.、Graça,M.和Ney,H.(2020年)。无监督神经机器翻译何时以及为什么毫无用处?。EAMT 2020会议记录,第35-44页。
[135] Kingma,D.P.和Ba,J.(2015)。亚当:一种随机优化方法。ICLR会议记录(海报)。
[136] Klemen,M.、Krsnik,L.和Robnik-Šikonja,M..(2020年)。利用形态学信息增强深层神经网络。。
[137] Kobayashi,S.(2018年)。上下文增强:通过具有聚合关系的单词来增强数据。2018年NAACL-HLT会议记录,第452-457页。
[138] Koenecke,A.、Nam,A.、Lake,E.、Nudell,J.、Quartey,M.、Mengesha,Z.、Toups,C.、Rickford,J.R.、Jurafsky,D.和Goel,S.(2020年)。自动语音识别中的种族差异。美国国家科学院院刊,117(14),7684-7689。
[139] Koppel,M.和Ordan,N.(2011年)。翻译腔及其方言。2011年ACL-HLT会议记录,第1318-1326页。
[140] Krishnan,J.、Anastasopoulos,A.、Purohit,H.和Rangwala,H.(2021)。用于零快照跨语言意图预测和时隙填充的多语言代码交换。。
[141] Kulshreshtha,S.、Garcia,J.L.R.和Chang,C.Y.(2020年)。多语伯特的跨语言比对方法:一项比较研究。《EMNLP 2020会议录》,第933-942页。
[142] Kumar,V.、Joshi,N.、Mukherjee,A.、Ramakrishnan,G.和Jyothi,P.(2019年)。用于自动生成问题的跨语言培训。第57届年度会议记录
[143] Kunchukuttan,A.、Mishra,A.、Chatterjee,R.、Shah,R.和Bhattacharyya,P.(2014)。沙塔努瓦达克:处理印度语言的多向翻译。诉讼中
[144] Kurata,G.、Xiang,B.、Zhou,B.和Yu,M.(2016)。利用句子级信息和编码器lstm进行语义槽填充。2016年EMNLP会议记录,第2077-2083页。
[145] Langkilde,I.和Knight,K.(1998年)。n-grams的实际值是生成的。在自然语言生成中。
[146] Laranjo,L.,Dunn,A.G.,Tong,H.L.,Kocaballi,A.B.,Chen,J.,Bashir,R.,Surian,D.,Gallego,B.,Magrabi,F.,Lau,A.Y.等人(2018年)。医疗保健中的会话代理:系统综述。美国医学信息学协会杂志,25(9),
[147] Larson,S.、Mahendran,A.、Peper,J.J.、Clarke,C.、Lee,A.、Hill,P.、Kummerfeld,J.K.、Leach,K.、Laurenzano,M.A.、Tang,L.等人(2019年)。用于意图分类和范围外预测的评估数据集。2019年EMNLP-IJCNLP会议记录,pp。
[148] Lauscher,A.、Ravishankar,V.、Vulić,I.和Glavaš,G.(2020年)。从零到英雄:关于使用多语言转换器进行零快照语言转换的局限性。诉讼中
[149] Le,V.B.和Besacier,L.(2009年)。欠源语言的自动语音识别:越南语的应用。IEEE语音音频处理汇刊,
[150] Lee,H.、Jo,S.、Kim,H.,Jung,S.和Kim,T.-Y.(2021年)。Sumbt+larl:有效的多域端到端神经任务导向对话系统。。第9卷,第116133-116146页。
[151] Lee,Y.(2021)。通过简单的辅助任务改进端到端的面向任务的对话系统。EMNLP 2021的调查结果,第1296-1303页。
[152] Lembersky,G.、Ordan,N.和Wintner,S.(2012年)。机器翻译的语言模型:原文与翻译文本。计算语言学,38(4),799-825。
[153] Li,H.、Arora,A.、Chen,S.、Gupta,A.、Gupto,S.和Mehdad,Y.(2021)。MTOP:一个全面的多语言面向任务的语义解析基准。InProceedings
[154] Li,J.、Galley,M.、Brockett,C.、Gao,J.和Dolan,B.(2016a)。神经对话模型的多样性促进目标函数。2016年会议记录
[155] Li,J.、Monroe,W.、Ritter,A.、Jurafsky,D.、Galley,M.和Gao,J.(2016年b)。针对对话生成的深度强化学习。2016年实证会议记录
[156] Li,X.、Lan,W.、Dong,J.和Liu,H.(2016c)。为图像添加中文字幕。2016年ACM多媒体检索国际会议论文集,pp。
[157] Li,X.,Wang,Y.,Sun,S.,Panda,S.、Liu,J.和Gao,J.(2018)。微软对话挑战:构建端到端的任务完成对话系统。arXiv预打印arXiv:1807.11125。
[158] Liang,Y.,Duan,N.,Gong,Y.、Wu,N.、Guo,F.、Qi,W.、Gong,M.、Shou,L.、Jiang,D.、Cao,G.、Fan,X.、Zhang,R.、Agrawal,R.,Cui,E.,Wei,S.、Bharti,T.、Qiao,Y.和Chen,J。,
[159] Lin,Y.-H.,Chen,C.-Y.,Lee,J.,Li,Z.,Z..,Zhang,Y.,Xia,M.,Rijhwani,S.,He,J.、Zhang、Z.、Ma,X.等人(2019年)。选择迁移语言进行跨语言学习。
[160] Lin,Z.,Pan,X.,Wang,M.,Qiu,X..,Feng,J.,Zhou,H.,&Li,L.(2020a)。利用对齐信息预先训练多语言神经机器翻译。
[161] Lin,Z.,Liu,Z.、Winata,G.I.、Cahyawijaya,S.、Madotto,A.、Bang,Y.、Ishii,E.和Fung,P.(2020b)。XPersona:评估多语言个性化聊天机器人。arXiv预印本arXiv:2003.07568。
[162] Lin,Z.,Madotto,A.,Winata,G.I.,Xu,P.,Jiang,F.,Hu,Y.,Shi,C.,&Fung,P.(2021)。Bitod:面向任务的对话建模的双语多域数据集。第三十五届神经信息处理系统数据集和基准会议
[163] Lison,P.、Barnes,J.、Hubin,A.和Touileb,S.(2020年)。无标签数据的命名实体识别:弱监督方法。《ACL 2020会议记录》,第1518-1533页。
[164] Littell,P.、Mortensen,D.R.、Lin,K.、Kairis,K.,Turner,C.和Levin,L.(2017)。Uriel和lang2vec:将语言表示为类型学、地理和系统发育载体。2017年EACL会议记录,第2卷,第8-14页。
[165] Liu,B.,Tur,G.,Hakkani-Tür,D.,Shah,P.,&Heck,L.(2018年)。在端到端可培训的任务导向对话系统中,对话学习与人的教学和反馈。2018年NAACL-HLT会议记录,第2060-2069页。
[166] Liu,C.-W.,Lowe,R.,Serban,I.V.,Noseworthy,M.,Charlin,L.,&Pineau,J.(2016)。如何不评估你的对话系统:一项针对对话回应生成的无监督评估指标的实证研究。《2016年EMNLP会议记录》,第2122-2132页。
[167] Liu,X.、Eshghi,A.、Swietojanski,P.和Rieser,V.(2019年)。对自然语言理解服务进行基准测试,以构建会话代理。arXiv预打印arXiv:1903.05566。
[168] Liu,Y.,Gu,J.,Goyal,N.,Li,X.,Edunov,S.,Ghazvininejad,M.,Lewis,M.和Zettlemoyer,L.(2020年)。神经机器翻译的多语言去噪预训练。TACL、,
[169] Liu,Z.、Indra Winata,G.、Cahyawijaya,S.、Madotto,A.、Lin,Z.和Fung,P.(2021)。语序信息在跨语言序列标注中的重要性。诉讼中
[170] Liu,Z.、Shin,J.、Xu,Y.、Winata,G.I.、Xo,P.、Madotto,A.和Fung,P.(2019年)。具有可转换潜在变量的零镜头跨语言对话系统。在的诉讼中
[171] Liu,Z.、Winata,G.I.、Lin,Z.、Xu,P.和Fung,P.(2020)。零快照跨语言任务导向对话系统的注意-信息混合语言训练。在的诉讼中
[172] Louvan,S.和Magnini,B.(2020a)。任务导向对话系统中槽填充和意图分类的最新神经方法:综述。冷却过程中
[173] Louvan,S.和Magnini,B.(2020b)。面向任务的对话系统中多语言nlu的简单数据增强。。第250页。
[174] Lowe,R.、Noseworthy,M.、Serban,I.V.、Angelard-Gontier,N.、Bengio,Y.和Pineau,J.(2017a)。走向自动图灵测试:学习评估对话反应。
[175] Lowe,R.,Pow,N.,Serban,I.V.,Charlin,L.,Liu,C.-W.,&Pineau,J.(2017b)。使用Ubuntu对话语料库训练端到端对话系统。对话与对话,
[176] Luo,B.、Feng,Y.、Wang,Z.、Z.、Huang,S.、Yan,R.和Zhao,D.(2017)。噪声学习:使用动态转移矩阵增强远程监督关系提取。《2017年ACL会议录》,第430-439页。
[177] Madotto,A.、Wu,C.-S.和Fung,P.(2018年)。Mem2Seq:有效地将知识库整合到端到端面向任务的对话系统中。2018年ACL会议记录,pp。
[178] Majewska,O.、Razumovskaia,E.、Ponti,E.M.、Vulić,I.和Korhonen,A.(2022)。通过基于大纲的生成创建跨语言对话数据集。InCORR:2201.13405。
[179] Mayhew,S.、Chaturvedi,S.,Tsai,C.-T.和Roth,D.(2019年)。使用部分注释的训练数据进行命名实体识别。《2019年CoNLL会议记录》,第645-655页。
[180] Mazzei,A.、Battaglino,C.和Bosco,C.(2016)。简化:将simpleng改为意大利语。第九届国际自然语言生成会议记录,pp。
[181] McRoy,S.W.、Channarukul,S.和Ali,S.(2003年)。一种基于增强模板的文本实现方法。自然语言工程,9(4),381·Zbl 1113.68564号
[182] Mehri,S.、Eric,M.和Hakkani-Tur,D.(2020年)。DialoGLUE:面向任务的对话的自然语言理解基准。arXiv预打印arXiv:2009.13570。
[183] Meng,C.、Ren,P.、Chen,Z.、Sun,W.、Ren、Z.、Tu,Z.和Rijke,M.d.(2020年)。Dukenet:用于知识型对话的双重知识交互网络。在的诉讼中
[184] Mesnil,G.、Dauphin,Y.、Yao,K.、Bengio,Y.,Deng,L.、Hakkani-Tur,D.、He,X.、Heck,L.,Tur,G.,Yu,D.等人(2014年)。递归神经网络在口语填空中的应用
[185] Mikolov,T.、Le,Q.V.和Sutskever,I.(2013)。利用语言之间的相似性进行机器翻译。arXiv预打印arXiv:1309.4168。
[186] Mirkovic,D.和Cavedon,L.(2011年)。使用脚本进行对话管理。谷歌专利。美国专利8041570。
[187] Morris,J.、Lifland,E.、Yoo,J.Y.、Grigsby,J.,Jin,D.和Qi,Y.(2020年)。文本攻击:NLP中用于对抗性攻击、数据增强和对抗性训练的框架。《EMNLP 2020会议录:系统演示》,第119-126页。
[188] Mrkšić,N.,Séaghdha,D.Oc。,Wen,T.-H.、Thomson,B.和Young,S.(2017年)。神经信念跟踪器:数据驱动的对话状态跟踪。2017年ACL会议记录,第1卷,pp。
[189] Mrkšić,N.和Vulić的i.(2018年)。全统计神经信念跟踪。2018年ACL会议记录,第108-113页。
[190] Mrkšić,N.、Vulić、i.、Séaghdha,D.Oc.、。,Leviant,I.、Reichart,R.、GašIć,M.、Korhonen,A.和Young,S.(2017)。分布式词向量空间的语义特化
[191] Muise,C.、Chakraborti,T.、Agarwal,S.、Bajgar,O.、Chaudhary,A.、Lastras-Montano,L.A.、Ondrej,J.、Vodolan,M.和Wiecha,C.(2019年)。规划面向目标的对话系统。arXiv预打印arXiv:1910.08137。
[192] Namazifar,M.、Papangelis,A.、Tur,G.和Hakkani-Tür,D.(2020年)。语言模型就是你所需要的:自然语言理解作为问题回答。CoRR,abs/2011.03023。
[193] Nekvinda,T.和Dusek,O.(2020)。一种模式,多种语言:多语言文本到语音的元学习。《2020年INTERSPEECH会议记录》,第2972-2976页。
[194] Nema,P.、Shetty,S.、Jain,P.和Laha,A.、Sankaranarayanan,K.和Khapra,M.M.(2018年)。使用双焦点注意机制和门控正交化从结构化数据生成描述。2018年北美会议记录
[195] Ni,J.、Dinu,G.和Florian,R.(2017)。通过有效的注释和表示投影实现弱监督的跨语言命名实体识别。在的诉讼中
[196] Nooralahzadeh,F.、Bekoulis,G.、Bjerva,J.和Augenstein,I.(2020年)。零次跨语言迁移与元学习。《EMNLP 2020会议录》,第4547-4562页。
[197] Ohmura,J.和Eskénazi,M.(2018年)。面向任务的对话框系统的上下文软件对话框重新分类。2018年SLT会议记录,第846-853页。
[198] Onoe,Y.和Durrett,G.(2019年)。学习去噪远距离标记数据以进行实体键入。《NAACL-HLT 2019年会议记录》,第2407-2417页。
[199] Pan,Y.,Li,X.,Yang,Y.和Dong,R.(2020年)。粘合语言机器翻译的多源神经模型。未来互联网,12(6),96。
[200] Pandey,G.,Contractor,D.,Kumar,V.,&Joshi,S.(2018年)。神经对话生成的示例编码器-解码器。年会第56届会议记录
[201] Passban,P.、Liu,Q.和Way,A.(2018)。利用神经机器翻译的目标形态学信息改进基于字符的解码。在的诉讼中
[202] Patra,B.、Moniz,J.R.A.、Garg,S.、Gormley,M.R.和Neubig,G.(2019年)。非等距嵌入空间中半监督双语词汇归纳。在的诉讼中
[203] Peng,B.、Zhu,C.、Li,C.、Li,X.、Li,J.、Zeng,M.和Gao,J.(2020)。面向任务的对话框的自然语言生成很少。《2020年EMNLP调查结果》,第172-182页。
[204] Perez,J.和Liu,F.(2017年)。对话状态跟踪,一种使用内存网络的机器读取方法。《EACL 2017年会议录》,第1卷,第305-314页。
[205] Peskov,D.、Clarke,N.、Krone,J.、Fodor,B.、Zhang,Y.、Youssef,A.和Diab,M.(2019年)。多域面向目标的对话(multidogo):管理和注释大规模对话数据的策略。EMNLP-IJCNLP 2019年会议记录,pp。
[206] Pfeiffer,J.,Goyal,N.,Lin,X.V.,Li,X.,Cross,J.、Riedel,S.和Artetxe,M.(2022年)。通过对模块化变压器进行预培训,消除了多语言的诅咒。在的诉讼中
[207] Pfeiffer,J.、Vulić,I.、Gurevych,I.和Ruder,S.(2020年)。MAD-X:基于适配器的多任务跨语言传输框架。《EMNLP 2020会议录》,第7654-7673页。
[208] Pfeiffer,J.、Vulić,I.、Gurevych,I.和Ruder,S.(2021)。UNKs Everywhere:使多语言模型适应新脚本。EMNLP 2021会议记录,pp。
[209] Pires,T.、Schlinger,E.和Garrette,D.(2019年)。多语种BERT是如何实现的?。《ACL 2019会议记录》,第4996-5001页。
[210] Pittermann,J.、Pitterman,A.和Minker,W.(2010年)。口语对话系统中的情绪识别和适应。国际语音技术杂志,13(1),49-60。
[211] Ponti,E.M.、Glavaš,G.、Majewska,O.、Liu,Q.、Vulić,I.和Korhonen,A.(2020年)。XCOPA:用于因果常识推理的多语言数据集。2020年会议记录
[212] Ponti,E.M.、O'Horan,H.、Berzak,Y.、Vulić,I.、Reichart,R.、Poibeau,T.、Shutova,E.和Korhonen,A.(2019年)。语言变异和共性建模:自然语言处理类型学语言学调查。计算语言学,
[213] Ponti,E.M.、Reichart,R.、Korhonen,A.和Vulić,I.(2018a)。跨语言自然语言处理中句法结构的同构迁移。2018年ACL诉讼程序,第1531-1542页。
[214] Ponti,E.M.、Vulić,I.、Glavaš,G.、MrkšIć、N.和Korhonen,A.(2018b)。词向量专业化的对抗传播和零快照跨语言传输。
[215] Ponti,E.M.、Vulić,I.、Glavaš,G.、Reichart,R.和Korhonen,A.(2019年)。通过词汇关系归纳实现跨语言语义专业化。《2019年EMNLP-IJCNLP会议记录》,第2206-2217页。
[216] Pratap,V.、Sriram,A.、Tomasello,P.、Hannun,A.、Lipthinsky,V.、Synnaeve,G.和Colobert,R.(2020a)。大规模多语言ASR:50种语言,1个模型,10亿个参数。《2020年INTERSPEECH会议记录》,第4751-4755页。
[217] Pratap,V.、Xu,Q.、Sriram,A.、Synnaeve,G.和Collobert,R.(2020b)。MLS:用于语音研究的大规模多语言数据集。《2020年INTERSPEECH会议记录》,第2757-2761页。
[218] Price,P.(1990)。口语系统评估:atis领域。演讲与自然语言:1990年6月24日至27日在宾夕法尼亚州隐谷举行的研讨会论文集。
[219] 秦,L.,倪,M.,张,Y.,&车,W.(2021)。Cosda-ml:用于零快照跨语言nlp的多语言代码切换数据增强。《IJICAI 2021年会议记录》,第3853-3860页。
[220] 秦,L.,徐,X.,车,W.,张,Y.,&刘,T.(2020)。动态融合网络用于多域端到端面向任务的对话。《ACL 2020会议记录》,第6344-6354页。
[221] Quan,J.、Zhang,S.、Cao,Q.、Li,Z.和Xiong,D.(2020年)。RiSAWOZ:一个大规模的多域Wizard-of-Oz数据集,具有丰富的语义注释,用于面向任务的对话建模。《EMNLP 2020会议录》,第930-940页,在线。计算语言学协会。
[222] Raiman,J.和Miller,J.(2017年)。全球标准化读者。2017年EMNLP会议记录,第1059-1069页。
[223] Rajpurkar,P.、Zhang,J.、Lopyrev,K.和Liang,P.(2016)。SkuAD:100000多个问题用于机器理解文本。《2016年EMNLP会议记录》,第2383-2392页。
[224] Ramos-Soto,A.、Janeiro-Gallardo,J.和Diz,A.B.(2017年)。将simpleng改为西班牙语。第十届自然语言生成国际会议论文集,pp。
[225] Ramponi,A.和Plank,B.(2020年)。NLP-A调查中的神经非监督领域适应。《2020年COLING会议录》,第6838-6855页。
[226] Raux,A.、Langner,B.、Bohus,D.、Black,A.W.和Eskenazi,M.(2005)。让我们公开吧!将语音对话系统带入现实世界。INTERSPEECH会议记录
[227] Ravuri,S.和Stolcke,A.(2015)。词汇话语分类的递归神经网络和lstm模型。在第十六届国际演讲年会上的讲话
[228] Razumovskaia,E.、Vulić,I.和Korhonen,A.(2022)。数据扩充和学习层聚合,提高对话中的多语言理解能力。InFindings公司
[229] Reimers,N.和Gurevych,I.(2020年)。利用知识提取技术使单语句子嵌入多语言。《EMNLP 2020会议录》,第4512-4525页。
[230] Reiter,E.和Dale,R.(1997年)。构建应用自然语言生成系统。自然语言工程,3(1),57-87。
[231] Reiter,E.和Dale,R.(2000年)。构建自然语言生成系统。剑桥大学出版社。
[232] Ren,F.,&Xue,S.(2020年)。基于三重态损失siaam神经网络的意图检测。IEEE接入,8,82242-82254。
[233] Ren,L.,Xie,K.,Chen,L..,&Yu,K.(2018年)。实现普遍对话状态跟踪。在2018年自然语言处理实证方法会议记录中,
[234] Rönnqvist,S.、Kanerva,J.、Salakoski,T.和Ginter,F.(2019年)。多语种BERT语言生成是否流畅?。《第一届自然语言处理深度学习NLPL研讨会论文集》,第29-36页。
[235] Rotman,G.、Vulić,I.和Reichart,R.(2018年)。使用深度部分典型相关分析通过图像桥接语言。2018年ACL会议记录,第910-921页。
[236] Rücklé,A.、Pfeiffer,J.和Gurevych,I.(2020年)。MultiCQA:大规模自监督文本匹配模型的零镜头传输。《EMNLP 2020会议录》,第2471-2486页。
[237] Ruder,S.、Constant,N.、Botha,J.、Siddhant,A.、Firat,O.、Fu,J.,Liu,P.、Hu,J..、Garrette,D.、Neubig,G.和Johnson,M.(2021年)。XTREME-R:走向更具挑战性和微妙的多语言评估。《EMNLP 2021会议记录》,第10215-10245页。
[238] Ruder,S.、Vulić,I.和Sögaard,A.(2019年)。跨语言单词嵌入模型综述。《人工智能研究杂志》,65,569-631·兹比尔1493.68365
[239] Ruder,S.、Vulić,I.和Sögaard,A.(2022)。NLP中的平方一偏差:朝向研究流形的多维探索。《ACL 2022会议记录》,第2340-2354页。
[240] Rust,P.、Pfeiffer,J.、Vulić,I.、Ruder,S.和Gurevych,I.(2021年)。你的代币化器有多好?关于多语言模型的单语性能。在的诉讼中
[241] ⑩ahin,G.G.和Steedman,M.(2018年)。通过低资源语言的依赖树变形进行数据增强。2018年EMNLP会议记录,第5004-5009页。
[242] Salesky,E.、Abdullah,B.M.、Mielke,S.、Klyachko,E.、Serikov,O.、Ponti,E.M.、Kumar,R.、Cotterell,R.和Vylomova,E.(2021年)。SIGTYP 2021共享任务:强大的口语识别。第三届计算研讨会论文集
[243] Sankoff,D.和Poplack,S.(1981年)。用于代码切换的正式语法。语言与社会互动研究,14(1),3-45。
[244] Sap,M.、Shwartz,V.、Bosselut,A.、Choi,Y.和Roth,D.(2020年)。自然语言处理的常识推理。《ACL 2020会议录:教程摘要》,第27-33页。
[245] Schuster,S.、Gupta,S.,Shah,R.和Lewis,M.(2019a)。面向多语言任务对话的跨语言迁移学习。NAACL-HLT 2019年会议记录,第1卷,第3795-3805页。
[246] Schuster,T.、Ram,O.、Barzilay,R.和Globerson,A.(2019b)。上下文词嵌入的跨语言对齐,应用于零快照依赖性分析。
[247] 塞尔班,I.、索多尼,A.、本吉奥,Y.、库维尔,A.和皮诺,J.(2016a)。使用生成层次神经网络模型构建端到端对话系统。诉讼中
[248] 塞族,I.V.、加西亚-杜兰,a.、古尔塞雷,C.、安恩,S.、钱达尔,S.,库维尔,a.和班吉奥,Y.(2016b)。用递归神经网络生成类事实问题:30M
[249] Shan,Y.、Li,Z.、Zhang,J.、Meng,F.、Feng,Y.,Niu,C.和Zhou,J.(2020年)。具有自适应目标的上下文层次注意网络用于对话状态跟踪。
[250] Shekhar,R.、Venkatesh,A.、Baumgärtner,T.、Bruni,E.、Plank,B.、Bernardi,R.和Fernández,R.(2019年)。超越任务成功:仔细观察共同学习看、问和猜什么。NAACL-HLT 2019年会议记录,第2578-2587页。
[251] Shen,S.-q.,Chen,Y.,Yang,C.,Liu,Z.-Y.,Sun,M.-S.,et al.(2018)。零镜头跨语言神经标题生成。IEEE/ACM音频、语音和语言汇刊
[252] Siddhant,A.、Bapna,A.、Cao,Y.、Firat,O.、Chen,M.X.、Kudugunta,S.R.、Arivazhagan,N.和Wu,Y.(2020a)。利用单语数据和自我监控进行多语言神经机器翻译。《ACL 2020会议记录》,第2827-2835页。
[253] Siddhant,A.、Johnson,M.、Tsai,H.、Ari,N.、Riesa,J.、Bapna,A.、Firat,O.和Raman,K.(2020b)。评估大规模多语言神经网络的跨语言有效性
[254] Sigurdsson,G.A.、Alayrac,J.、Nematzadeh,A.、Smaira,L.、Malinowski,M.、Carreira,J.,Blunsom,P.和Zisserman,A.(2020年)。无监督单词翻译的视频视觉基础。《CVPR 2020会议录》,第10847-10856页。
[255] Smith,E.M.、Hsu,O.、Qian,R.、Roller,S.、Boureau,Y.和Weston,J.(2022)。人类对对话的评估是一个公开的问题:比较评估对话主体的各种方法的敏感性。CoRR,abs/2201.04723。
[256] Smith,S.L.、Turban,D.H.、Hamblin,S.和Hammerla,纽约(2017)。离线双语单词向量、正交变换和反向softmax。2017年ICLR会议记录。
[257] Solaiman,I.和Dennison,C.(2021)。使用价值目标数据集使语言模型适应社会(棕榈树)的过程。神经信息处理系统进展,34。
[258] Song,Y.、Li,C.-T.、Nie,J.-Y.、Zhang,M.、Zhao,D.和Yan,R.(2018)。基于检索和基于生成的人机对话系统的集成。
[259] Sordoni,A.、Galley,M.、Auli,M.,Brockett,C.、Ji,Y.、Mitchell,M.和Nie,J.-Y.、Gao,J.和Dolan,B.(2015)。一种神经网络方法,用于生成上下文敏感的会话响应。2015年北方会议记录
[260] Stent,A.、Prasad,R.和Walker,M.(2004年)。口语对话系统中复杂信息演示的可训练句子规划。第42届年度会议记录
[261] Su,P.-H.,Mrkšić,N.,Casanueva,i.,&Vulić(2018)。对话人工智能的深度学习。《2018年NAACL会议录:教程摘要》,第27-32页。
[262] Sun,Y.,Tang,D.,Xu,J.,Duan,N.,Feng,X.,Qin,B.,Liu,T.,&Zhou,M.(2019年)。基于web表的知识感知会话语义分析。InCCF国际会议
[263] Susanto,R.H.和Lu,W.(2017)。多语言语义解析的神经体系结构。《2017年ACL会议录》,第2卷,第38-44页。
[264] Upadhyay,S.、Faruqui,M.、Tür,G.、Dilek,H.-T.和Heck,L.(2018年)。(几乎)零度跨语言口语理解。2018年IEEE国际会议
[265] Üstün,A.、Bisazza,A.、Bouma,G.和van Noord,G.(2020)。UDapter:真正的通用依赖解析的语言调整。《EMNLP 2020会议录》,第2302-2315页。
[266] Van,P.N.,Hoang,T.C.,Manh,D.N.,Minh,Q.N.,&Quoc,L.T.(2022)。Viwoz:低资源语言的多域任务导向对话系统数据集。。
[267] van der Goot,R.、Sharaf,I.、Imankulova,A.、Üstün,A.、Stepanović,M.、Ramponi,A.、Khairunnisa,S.O.、Komachi,M.和Plank,B.(2021)。从蒙面语言建模到翻译:非英语辅助任务提高了零速口语理解能力。《NAACL-HLT 2021会议录》,第2479-2497页,在线。计算语言学协会。
[268] van der Heijden,N.、Yannakoudakis,H.、Mishra,P.和Shutova,E.(2021年)。多语言和跨语言文档分类:元学习方法。在的诉讼中
[269] van Miltenburg,E.、Elliott,D.和Vossen,P.(2017)。图像描述中的跨语言差异和相似性。。
[270] 范·米尔滕堡,E.,卡达尔,阿拉斯加。,Koolen,R.和Krahmer,E.(2018年)。DIDEC:荷兰图像描述和令人目不暇接的语料库。2018年COLING会议记录,第3658-3669页。
[271] Vania,C.、Kementchedjieva,Y.、Sögaard,A.和Lopez,A.(2019年)。对真正低资源语言上的低资源依赖性分析方法进行系统比较。《2019年EMNLP-IJCNLP会议记录》,第1105-1116页。
[272] Vaswani,A.、Shazeer,N.、Parmar,N.,Uszkoreit,J.、Jones,L.、Gomez,A.N.、Kaiser,Ł和Polosukhin,I.(2017)。注意力是你所需要的。《2017年NeurIPS会议录》,第6000-6010页。
[273] Vaudry,P.-L.和Lapalme,G.(2013)。为双语英语-法语实现改编simpleng。第十四届欧洲自然语言研讨会论文集
[274] Volansky,V.、Ordan,N.和Wintner,S.(2015)。论翻译腔的特点。人文数字奖学金,30(1),98-118。
[275] Vulić,I.、Glavaš,G.、MrkšIć、N.和Korhonen,A.(2018年)。后特定化:对词汇资源中看不到的单词进行修饰。2018年NAACL-HLT会议记录,pp。
[276] Vulić,I.、Mrksić,N.、Reichart,R.、Ox Séaghdha,D.、Young,S.和Korhonen,A.(2017)。变形拟合:使用简单的特定于语言的规则来微调单词向量空间。
[277] Wan,X.、Li,H.和Xiao,J.(2010)。基于机器翻译质量预测的跨语言文档摘要。《2010年ACL会议录》,第917-926页。
[278] Wang,A.和Cho,K.(2019年)。BERT有一张嘴巴,它必须开口:BERT是一个马尔可夫随机场语言模型。优化方法研讨会论文集
[279] Wei,J.和Zou,K.(2019年)。EDA:简单的数据增强技术,用于提高文本分类任务的性能。《2019年EMNLP-IJCNLP会议记录》,第6382-6388页。
[280] Wen,T.-H.,Su,P.-H.,Budzianowski,P.,Casanueva,I.,&Vulić,I..(2019年)。会话人工智能的数据收集和端到端学习。EMNLP-IJCNLP会议录
[281] Wen,T.-H.,Vandyke,D.,Mrkšić,N.,Gasic,M.,Barahona,L.M.R.,Su,P.-H.,Ultes,S.,&Young,S.(2017年)。基于网络的端到端可培训任务导向对话系统。
[282] Weston,J.、Dinan,E.和Miller,A.(2018年)。检索和优化:改进对话的序列生成模型。2018年EMNLP研讨会SCAI会议记录:第二届
[283] Williams,A.、Nangia,N.和Bowman,S.(2018年)。一个用于通过推理理解句子的广泛挑战语料库。《NAACL-HLT 2018年会议记录》,第1卷,第1112-1122页。
[284] Williams,J.、Raux,A.、Ramachandran,D.和Black,A.(2013)。对话状态跟踪挑战。《2013年SIGDIAL会议记录》,第404-413页,法国梅茨。
[285] Wolf,T.、Sanh,V.、Chaumond,J.和Delangue,C.(2019)。Transfertransfo:基于神经网络的会话代理的迁移学习方法。arXiv预印arXiv:1901.08149。
[286] Wu,C.-S.,Hoi,S.C.,Socher,R.,&Xiong,C.(2020a)。TOD-BERT:针对任务导向对话的预先训练的自然语言理解。《EMNLP 2020年诉讼记录》,第917-929页。
[287] Wu,Q.,Lin,Z.,Karlsson,B.,Jian-Guang,L.,&Huang,B.(2020b)。通过师生学习目标语言中未标记数据的单/多源跨语言网络。
[288] Wu,S.和Dredze,M.(2019年)。贝托,本茨,贝卡斯:伯特令人惊讶的跨语言效果。《EMNLP-IJCNLP 2019年诉讼汇编》,第833-844页。
[289] Wu,S.和Dredze,M.(2020年)。在多语言BERT中创建的所有语言都是平等的吗?。《NLP表征学习第五次研讨会论文集》,第120-130页。
[290] Wu,Y.,Wu,W.,Xing,C.,Zhou,M.,&Li,Z.(2017)。顺序匹配网络:基于检索的聊天机器人中一种新的多回合响应选择架构。诉讼中
[291] Xie,Q.,Dai,Z.,Hovy,E.H.,Luong,T.,&Le,Q.(2020年)。针对一致性培训的无监督数据增强。NeurIPS 2020会议记录。
[292] Xu,P.和Sarikaya,R.(2013)。基于卷积神经网络的三角crf用于联合意图检测和缝隙填充。2013年ieee自动语音识别研讨会
[293] Xu,W.、Haider,B.和Mansour,S.(2020年)。用于跨语言非语言用户的端到端插槽对齐和识别。《EMNLP 2020会议录》,第5052-5063页。
[294] Xue,L.,Constant,N.,Roberts,A.,Kale,M.,Al-Rfou,R.,Siddhant,A.,Barua,A.,&Raffel,C.(2021)。mT5:一个大规模的多语言预训练文本到文本转换器。
[295] Yang,L.,Hu,J.,Qiu,M.,Qu,C.,Gao,J.、Croft,W.B.、Liu,X.、Shen,Y.和Liu,J.(2019)。一种混合检索生成神经会话模型。第28届ACM会议记录
[296] Yang,L.,Qiu,M.,Qu,C.,Guo,J.,Zhang,Y.,Croft,W.B.,Huang,J.和Chen,H.(2018)。深度匹配网络和外部知识的响应排名
[297] Young,S.(2010年)。仍在与机器对话(认知方面)。2010年国际演讲会会议记录,第1-10页。
[298] Young,S.、Gašić,M.、Thomson,B.和Williams,J.D.(2013)。基于POMDP的统计口语对话系统:综述。IEEE会议录,101(5),1160-1179。
[299] Zaheer,M.、Guruganesh,G.、Dubey,K.A.、Ainslie,J.、Alberti,C.、Ontanon,S.、Pham,P.、Ravula,A.、Wang,Q.、Yang,L.等人(2020年)。大鸟:长镜头的变形金刚。神经信息处理系统进展,33,17283-17297。
[300] Zang,X.、Rastogi,A.、Sunkara,S.、Gupta,R.、Zhang,J.和Chen,J.(2020年)。MultiWOZ 2.2:带有附加注释修正和状态跟踪基线的对话数据集。
[301] Zhang,H.和Lin,Y.(2020年)。针对低资源语言的序列到序列文本到语音的无监督学习。《2020年INTERSPEECH会议记录》,第3161-3165页。
[302] Zhang,S.、Dinan,E.、Urbanek,J.、Szlam,A.、Kiela,D.和Weston,J.(2018)。个性化对话代理:我有一只狗,你也有宠物吗?。《2018年ACL会议记录》,第2204-2213页。
[303] Zhang,W.N.,Chen,Z.,Che,W.,Hu,G.,&Liu,T.(2017)。中国人机对话技术第一次评价。arXiv预打印arXiv:1709.10217。
[304] Zhang,Y.、Galley,M.、Gao,J.、Gan,Z.、Li,X.、Brockett,C.和Dolan,B.(2018)。通过对手信息最大化生成信息丰富且多样化的对话响应。《2018年NeurIPS会议录》,第1815-1825页。
[305] Zhang,Y.,Sun,S.,Galley,M.,Chen,Y.-C.,Brockett,C.,Gao,X.,Gao。Dialogpt:用于会话响应的大规模生成性预训练
[306] Zhang,Y.、Weiss,R.J.、Zen,H.、Wu,Y.,Chen,Z.、Skerry-Ryan,R.J、Jia,Y.和Rosenberg,A.及Ramabhadran,B.(2019a)。学习流利地使用外语:
[307] Zhang,Z.、Zhang、Z.、Chen,H.和Zhang(2019b)。与bert共同学习的口语理解框架。IEEE接入,7168849-168858。
[308] Zhang,Z.,Li,J.,Zhu,P.,Zhao,H.,&Liu,G.(2018)。使用深层话语聚合对多话轮对话进行建模。第27届国际会议记录
[309] Zhao,M.、Zhu,Y.、Shareghi,E.、Reichart,R.、Korhonen,A.和Schütze,H.(2020)。近距离观察少量跨语言迁移:差异、基准和基线。CoRR公司,
[310] Zhong,V.、Xiong,C.和Socher,R.(2018)。用于对话状态跟踪的全局自关注编码器。《2018年ACL会议录》,第1卷,第1458-1467页。
[311] 周,H.,郑,C.,黄,K.,黄,M.,&朱,X.(2020)。Kdconv:面向多转向知识驱动对话的中文多域对话数据集。InPro公司
[312] Zhu,C.,Zeng,M.,&Huang,X.(2019)。任务导向对话中自然语言生成的多任务学习。《2019年EMNLP-IJCNLP会议记录》,第1261-1266页。
[313] 朱,Q.,黄,K.,张,Z.,朱,X.,&黄,M.(2020a)。Crosswoz:一个大规模的中国跨领域任务导向对话数据集。TACL,第8页,第281-295页。
[314] Zhu,S.、Cheng,X.和Su,S..(2020b)。通过解耦和分组操作对表进行会话语义解析。基于知识的系统,204106237。
[315] Ziser,Y.和Reichart,R.(2018年)。基于深度枢轴的建模,用于在最小指导下进行跨语言跨领域迁移。2018年EMNLP会议记录,第238-249页。
[316] Zoph,B.、Yuret,D.、May,J.和K.(2016)。低资源神经机器翻译的转移学习。《2016年EMNLP会议记录》,第1568-1575页。
[317] Zuo,L.,Qian,K.,Yang,B.,&Yu,Z.(2021)。AllWOZ:面向所有人的面向任务的多语言对话系统。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。