Genetic Prompt Search via Exploiting Language Model Probabilities

Jiangjiang Zhao; Zhuoran Wang; Fangchun Yang

doi:10.24963/ijcai.2023/588

基于语言模型概率的遗传即时搜索

利用语言模型概率进行遗传提示搜索

赵江江、王卓然、杨芳春

第三十二届国际人工智能联合会议记录

主要轨道。第5296-5305页。https://doi.org/10.24963/ijcai.2023/588

PDF格式 BibTeX公司

大规模预处理语言模型（PLM）的快速调优已经显示出巨大的潜力，特别是在低资源场景中，如少快照学习。此外，无导数优化（DFO）技术可以调整黑盒PLM的提示，以更好地适应下游任务。然而，应用现有的基于DFO的提示调整方法通常需要先决条件，例如主干PLM需要提供额外的API，以便可以将隐藏状态（和/或嵌入向量）作为连续提示注入其中，或者需要事先提供精心设计的（离散的）手动提示，用作调整算法的初始状态。为了放弃这些前提条件，并使基于DFO的提示调整为通用做好准备，本文引入了一种新的遗传算法（GA），该算法从空提示进化而来，并使用基于（少量）训练集的主干PLM导出的预测概率来指导提示突变期间的标记选择过程。在不同基准数据集上的实验结果表明，所提出的无预条件方法显著优于需要先决条件的现有DFO风格的方法，包括黑盒调整、遗传提示搜索和无梯度教学提示搜索。

关键词：

自然语言处理：NLP：语言模型

机器学习：ML:Few-shot Learning

自然语言处理：NLP：其他