×

米T5

swMATH ID: 46674
软件作者: 薛琳婷;常量,诺亚;亚当·罗伯茨(Adam Roberts);凯尔,米希尔;拉米·阿尔-罗福;阿迪蒂亚·西德汉特(Aditya Siddhant);阿迪蒂亚·巴鲁阿;科林·拉斐尔
描述: mT5:一个大规模的多语言预训练文本到文本转换器。最近的“文本到文本转换转换器”(T5)利用了统一的文本到文本格式和比例,在各种英语NLP任务上获得了最先进的结果。在本文中,我们介绍了mT5,它是T5的一个多语言变体,在一个新的基于公共爬行的数据集上进行了预训练,该数据集涵盖了101种语言。我们详细介绍了mT5的设计和改进训练,并展示了它在许多多语言基准测试中的最新性能。我们还描述了一种简单的技术,以防止在零快照设置中的“意外翻译”,即生成模型选择(部分)将其预测翻译成错误的语言。这项工作中使用的所有代码和模型检查点都是公开的。
主页: https://arxiv.org/abs/2010.11934
源代码:  https://github.com/google-research/multilingual-t5
依赖项: 蟒蛇
关键词: 文本到文本传输变压器;NLP公司
相关软件: BERT(误码率);张紧器2传感器;小队;拨号GPT;GPT-3级;布尔Q;ReCoRD公司;chrF公司;超级胶水;朗福雷特;MultiWOZ公司;啜食;GluonCV公司;GLUECoS公司;英里;ConveRT公司;ToD-BERT公司;Glottolog公司;XTREME公司;文本攻击
引用于: 4文件

按年份列出的引文