基于语言模型概率的遗传即时搜索

利用语言模型概率进行遗传提示搜索

赵江江、王卓然、杨芳春

第三十二届国际人工智能联合会议记录
主要轨道。第5296-5305页。https://doi.org/10.24963/ijcai.2023/588

大规模预处理语言模型(PLM)的快速调优已经显示出巨大的潜力,特别是在低资源场景中,如少快照学习。此外,无导数优化(DFO)技术可以调整黑盒PLM的提示,以更好地适应下游任务。然而,应用现有的基于DFO的提示调整方法通常需要先决条件,例如主干PLM需要提供额外的API,以便可以将隐藏状态(和/或嵌入向量)作为连续提示注入其中,或者需要事先提供精心设计的(离散的)手动提示,用作调整算法的初始状态。为了放弃这些前提条件,并使基于DFO的提示调整为通用做好准备,本文引入了一种新的遗传算法(GA),该算法从空提示进化而来,并使用基于(少量)训练集的主干PLM导出的预测概率来指导提示突变期间的标记选择过程。在不同基准数据集上的实验结果表明,所提出的无预条件方法显著优于需要先决条件的现有DFO风格的方法,包括黑盒调整、遗传提示搜索和无梯度教学提示搜索。
关键词:
自然语言处理:NLP:语言模型
机器学习:ML:Few-shot Learning
自然语言处理:NLP:其他