计算机科学>计算与语言
标题: SemStamp:一种用于文本生成的具有解译鲁棒性的语义水印
摘要: 现有的水印算法由于其标记级设计,容易受到转述攻击。 为了解决这个问题,我们提出了SemStamp,这是一种基于位置敏感散列(LSH)的鲁棒句子级语义水印算法,用于划分句子的语义空间。 该算法对LLM生成的候选句子进行编码和LSH哈希运算,并进行句子级拒绝采样,直到采样的句子落入语义嵌入空间中的水印分区。 使用基于边缘的约束来增强其鲁棒性。 为了显示我们算法的优势,我们提出了一种“二元语法”复述攻击,使用与原始句子重叠最少的复述。 该攻击对现有的标记级水印方法有效。 实验结果表明,我们的新语义水印算法不仅在普通和二元复述攻击上比现有方法更为稳健,而且在保持生成质量方面也更为出色。