• 语料库ID:269282669

文件在电脑中:版权、记忆和生成人工智能

@进行中{Cooper2024TheFA,title={文件在计算机中:版权、记忆和生成AI},author={A.Feder Cooper和James Grimmelmann},年份={2024},网址={https://api.semanticscholar.org/CorpusID:269282669}}
针对生成AI公司的版权诉讼中的一个中心问题是生成AI模型在多大程度上“记忆”了它所训练的数据。不幸的是,关于“记忆”是什么的模糊性给辩论蒙上了阴影,导致了法律辩论,参与者之间经常相互回避。在这篇文章中,我们试图通过记忆使对话更加清晰。 

本文中的数字

询问这篇论文
人工智能驱动

窃取产生式语言模型的一部分

这项工作引入了第一个模型密封攻击,该攻击从black-box生产语言模型(如OpenAI的ChatGPT或Google的PaLM-2.0)中提取精确的非平凡信息,并首次确认这些black-bbox模型的隐藏维度分别为1024和2048。

论行为使用条款的标准化及其在人工智能负责任许可中的应用

人们认为,负责任的AI许可证需要标准化,以避免混淆用户或削弱其影响,并提倡“标准化定制”,以满足用户的需求,并可通过工具得到支持。

从(生产)语言模型中可伸缩地提取训练数据

为了攻击对齐的ChatGPT,开发了一种新的发散攻击,使模型偏离其chatbot风格的代,并以比正常行为时高150倍的速率发出训练数据。

第一届生成性人工智能与法律研讨会报告

有必要建立一个共享的知识库,为跨学科的专家提供一种通用的概念语言,以应对法律对生成性人工智能提出的挑战,以及GenerativeAI对法律提出的挑战。

CommonCanvas:一个开放的扩散模型,用创造性的通用图像训练

尽管使用的CC数据集比LAION小得多,并且使用合成字幕进行训练,但最大的模型在人体评估方面的性能与SD2相当。

谈论人工智能时代:版权和Generative-AI供应链

本文介绍了可生成的AI供应链:一组相互关联的阶段,将训练数据转换为多代数据(这是一张从未见过的猫的新照片)。

生成性人工智能满足版权要求

如果原告胜诉,在美国唯一合法的生成人工智能系统将是那些接受过公共领域工作或许可证培训的系统,这将影响到部署生成人工智能、将其集成到产品中并用于科学研究的每个人。

“人工智能供应链”中错位的责任:模块化和开发人员的责任观念

有人认为,目前负责任的人工智能干预措施,如道德检查表和假设对系统拥有全面知识和控制的指导方针,可以通过采取定位问责方法来改进,认识到供应链内外的关系和义务可能相互交织。

快速还是准确?管理高度自治车辆中的冲突目标

了解AV的准确性和速度之间的基本工程权衡对于政策制定者调节AV系统固有的不确定性和风险至关重要,本文讨论了了解权衡将如何帮助创建工具,使政策制定者能够评估权衡是如何实施的。
...