Encryption Based Covert Channel for Large Language Models

Yongge Wang

论文2024/586

用于大型语言模型的基于加密的隐蔽通道

王永革

北卡罗来纳大学夏洛特分校

摘要

变压器神经网络自引入以来获得了巨大的吸引力，成为跨不同领域的关键。特别是在像Claude和ChatGPT这样的大型语言模型中，转换器体系结构表现出了显著的效果。本文简要概述了变压器神经网络，并深入研究了它们的安全考虑因素，重点关注隐蔽通道攻击及其对大型语言模型安全性的影响。我们提出了一种利用加密的隐蔽通道，并证明了它在规避Claude.ai的安全措施方面的有效性。我们的实验表明，Claude.ai似乎会记录我们的查询，并在我们首次成功破解后的两天内阻止我们的攻击。这在社区内引发了两个问题：（1）大型语言模型对用户输入的广泛记录可能会给用户带来隐私风险。（2）由于缺乏实验重复性，这可能会阻碍对此类模型安全性的学术研究。

元数据

可用格式: PDF格式
类别: 应用
出版物信息: 预打印。
关键词: 大型语言模型的安全性基于加密的隐蔽信道
联系作者: 永旺@夏洛特·埃杜
历史: 2024-04-24：修订; 2024-04-16：收到; 查看所有版本
短网址: https://ia.cr/2024/586
许可证: 抄送人

BibTeX公司

@misc{cryptoeprint:2024/586，author={Yongge Wang}，title={大型语言模型的基于加密的隐蔽通道}，howpublished＝｛Cryptology ePrint Archive，论文2024/586｝，年份={2024}，注释={\url{https://eprint.iacr.org/2024/586}},url={https://eprint.iacr.org/2024/586}}