研究论文

DP-UTIL：机器学习中差异隐私的综合效用分析

作者:

伊斯马特杰林,

比尔哈努埃希特作者信息和声明

CODASPY’22：第十二届ACM数据和应用程序安全与隐私会议记录

页41-52

https://doi.org/10.1145/3508398.3511513

出版:2022年4月15日出版历史

获取访问权限

摘要

差异隐私（Differential Privacy，DP）是一种严格的形式主义，用于量化对隐私敏感数据进行操作的算法所提供的隐私保护。在机器学习（ML）中，DP被用来限制训练示例的推断/公开。之前的工作在ML管道中利用了DP，尽管是孤立的，但通常侧重于梯度扰动等机制。

在本文中，我们提出了DP-UTIL，一个跨ML流水线的DP整体效用分析框架，重点关注输入扰动、目标扰动、梯度扰动、输出扰动和预测扰动。假设对隐私敏感数据执行ML任务，DP-UTIL使ML隐私从业者能够对这五个扰动点中DP的影响进行整体比较分析，以模型效用损失、隐私泄漏和真正揭示的训练样本数量来衡量。

我们使用两种针对成员推理攻击的典型学习算法（逻辑回归和深度神经网络）作为案例研究攻击，对DP-UTIL在视觉、医学和金融数据集上的分类任务进行评估。我们结果的一个亮点是，在所有数据集的所有模型上，预测扰动始终实现最低的效用损失。在逻辑回归模型中，与其他扰动技术相比，客观扰动导致最低的隐私泄漏。对于深度神经网络，梯度扰动导致最低的隐私泄漏。此外，我们对真实披露记录的结果表明，随着隐私泄露的增加，不同的私有模型会显示更多的成员样本。总之，我们的研究结果表明，为了对扰动机制的选择做出明智的决定，ML隐私从业者需要检查优化技术（凸与非凸）、类数和隐私预算之间的动态关系。

补充材料

MP4文件（代码ASPY22_coda082.mp4）

作为机器学习隐私实践者，您如何比较差异隐私扰动在机器学习管道中的应用？DP-UTIL提供了一个整体框架，用于权衡分析机器学习中差异隐私的使用，重点关注输入扰动、目标扰动、梯度扰动、输出扰动和预测扰动。DP-UTIL将成员关系推断用作案例研究攻击，可以对这些干扰机制进行比较分析，包括效用损失、隐私泄露和真实的披露记录。使用医疗、财务和图像数据集，我们展示了DP-UTIL如何实现综合权衡分析，并提供新的见解，以指导机器学习隐私从业者对扰动的选择做出明智的决定。

下载
36.37 MB

工具书类

[1]

马丁·阿巴迪（Mart’i n Abadi）、安迪·朱棣文（Andy Chu）、伊恩·古德费罗（Ian J.Goodfellow）、H.布伦丹·麦克马汉（H.Brendan McMahan）、伊利亚·米罗诺夫（Ilya Mironov）、库纳尔·。2016.深度学习与差异隐私。2016年10月24日至28日在奥地利维也纳举行的2016 ACM SIGSAC计算机和通信安全会议记录。美国医学会，308--318。

摘要

补充材料

工具书类

引用人

索引术语

建议

机器学习何时遇到隐私：调查与展望

深度学习中的差异隐私：一项文献综述

一种新兴的隐私保护数据库策略：差异隐私

评论

问询处

发布于

赞助商

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

贡献者

其他指标

文献计量学

文章指标

其他指标

引文

引用人

获取访问权限

登录选项

完全访问权限

查看选项

PDF格式

电子阅读器

数字

其他

份额

共享此出版物链接

在社交媒体上分享

附属机构