论文2024/586
用于大型语言模型的基于加密的隐蔽通道
王永革北卡罗来纳大学夏洛特分校
摘要
变压器神经网络自引入以来获得了巨大的吸引力,成为跨不同领域的关键。特别是在像Claude和ChatGPT这样的大型语言模型中,转换器体系结构表现出了显著的效果。本文简要概述了变压器神经网络,并深入研究了它们的安全考虑因素,重点关注隐蔽通道攻击及其对大型语言模型安全性的影响。我们提出了一种利用加密的隐蔽通道,并证明了它在规避Claude.ai的安全措施方面的有效性。我们的实验表明,Claude.ai似乎会记录我们的查询,并在我们首次成功破解后的两天内阻止我们的攻击。这在社区内引发了两个问题:(1)大型语言模型对用户输入的广泛记录可能会给用户带来隐私风险。(2) 由于缺乏实验重复性,这可能会阻碍对此类模型安全性的学术研究。
BibTeX公司
@misc{cryptoeprint:2024/586,author={Yongge Wang},title={大型语言模型的基于加密的隐蔽通道},howpublished={Cryptology ePrint Archive,论文2024/586},年份={2024},注释={\url{https://eprint.iacr.org/2024/586}},url={https://eprint.iacr.org/2024/586}}