导航
主页
会议
未来的会议
过去的会议
诉讼
IJCAI 2023会议记录
IJCAI 2022会议记录
所有诉讼
奖品
受托人/管理人员
现任受托人
受托人选举
IJCAI秘书处
IJCAI赞助和宣传官员
IJCAI团队
本地安排主席
在执行委员会任职的前受托人
其他前任官员
人工智能期刊
关于
关于IJCAI
联系信息
基于语言模型概率的遗传即时搜索
利用语言模型概率进行遗传提示搜索
赵江江、王卓然、杨芳春
第三十二届国际人工智能联合会议记录
主要轨道。
第5296-5305页。
https://doi.org/10.24963/ijcai.2023/588
PDF格式
BibTeX公司
大规模预处理语言模型(PLM)的快速调优已经显示出巨大的潜力,特别是在低资源场景中,如少快照学习。
此外,无导数优化(DFO)技术可以调整黑盒PLM的提示,以更好地适应下游任务。
然而,应用现有的基于DFO的提示调整方法通常需要先决条件,例如主干PLM需要提供额外的API,以便可以将隐藏状态(和/或嵌入向量)作为连续提示注入其中,或者需要事先提供精心设计的(离散的)手动提示,
用作调整算法的初始状态。
为了放弃这些前提条件,并使基于DFO的提示调整为通用做好准备,本文引入了一种新的遗传算法(GA),该算法从空提示进化而来,并使用基于(少量)训练集的主干PLM导出的预测概率来指导提示突变期间的标记选择过程。
在不同基准数据集上的实验结果表明,所提出的无预条件方法显著优于需要先决条件的现有DFO风格的方法,包括黑盒调整、遗传提示搜索和无梯度教学提示搜索。
关键词:
自然语言处理:NLP:语言模型
机器学习:ML:Few-shot Learning
自然语言处理:NLP:其他