论文2024/586

用于大型语言模型的基于加密的隐蔽通道

王永革北卡罗来纳大学夏洛特分校
摘要

变压器神经网络自引入以来获得了巨大的吸引力,成为跨不同领域的关键。特别是在像Claude和ChatGPT这样的大型语言模型中,转换器体系结构表现出了显著的效果。本文简要概述了变压器神经网络,并深入研究了它们的安全考虑因素,重点关注隐蔽通道攻击及其对大型语言模型安全性的影响。我们提出了一种利用加密的隐蔽通道,并证明了它在规避Claude.ai的安全措施方面的有效性。我们的实验表明,Claude.ai似乎会记录我们的查询,并在我们首次成功破解后的两天内阻止我们的攻击。这在社区内引发了两个问题:(1)大型语言模型对用户输入的广泛记录可能会给用户带来隐私风险。(2) 由于缺乏实验重复性,这可能会阻碍对此类模型安全性的学术研究。

元数据
可用格式
PDF格式
类别
应用
出版物信息
预打印。
关键词
大型语言模型的安全性基于加密的隐蔽信道
联系作者
永旺@夏洛特·埃杜
历史
2024-04-24:修订
2024-04-16:收到
查看所有版本
短网址
https://ia.cr/2024/586
许可证
知识共享属性
抄送人

BibTeX公司

@misc{cryptoeprint:2024/586,author={Yongge Wang},title={大型语言模型的基于加密的隐蔽通道},howpublished={Cryptology ePrint Archive,论文2024/586},年份={2024},注释={\url{https://eprint.iacr.org/2024/586}},url={https://eprint.iacr.org/2024/586}}
注:为了保护读者的隐私,eprint.iacr.org不使用cookie或嵌入的第三方内容。