Automatic Label Sequence Generation for Prompting Sequence-to-sequence Models

Yu, Zichun; Gao, Tianyu; Zhang, Zhengyan; Lin, Yankai; Liu, Zhiyuan; Sun, Maosong; Zhou, Jie

计算机科学>计算与语言

arXiv:2209.09401（cs）

【2022年9月20日提交】

职务：用于提示序列到序列模型的自动标签序列生成

作者：于子春,天宇高,张正燕,林彦凯,刘志远,孙茂松,周杰（音译）

查看PDF

摘要：与使用预先训练的模型进行标准微调相比，将下游应用程序转换为语言建模任务的提示已被证明是样本高效的。然而，提示的一个陷阱是需要手动设计模式，其结果可能是不直观的，并且需要大量的验证集进行调整。为了应对这一挑战，我们提出了AutoSeq，一种全自动提示方法：（1）我们在序列到序列模型上采用自然语言提示，实现自由生成和更大的标签搜索空间；（2）我们提出标签序列——用不定长度的短语来描述标签——这样就不需要手动模板，并且比单标签单词更具表达力；（3）我们使用波束搜索自动生成大量候选标签序列，并提出对比重排序以获得最佳组合。AutoSeq明显优于其他非手动设计方法，如软提示调整、适配器调整和单标签词自动搜索；在各种任务中，生成的标签序列甚至比精心策划的手动序列更好。我们的方法揭示了序列到序列模型在少快照学习中的潜力，并为实现通用和自动提示指明了道路。本文的源代码可以从此https URL.

评论：	接受COLING 2022
学科：	计算与语言（cs.CL）; 机器学习（cs.LG）
引用为：	arXiv:2209.09401【cs.CL】
	（或 arXiv:2209.09401v1型【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2209.09401

提交历史记录

发件人：于子春[查看电子邮件]
[第1版]2022年9月20日星期二01:35:04 UTC（96 KB）

计算机科学>计算与语言

职务：用于提示序列到序列模型的自动标签序列生成

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

职务：用于提示序列到序列模型的自动标签序列生成

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目