×

交互式与非交互式局部差异私人估计:二次函数的两个弯头。 (英语) Zbl 07714168号

摘要:本地差异隐私最近越来越受到统计界的关注,它是一种宝贵的工具,可以在不需要可信第三方的情况下保护个人数据所有者的隐私。与随机响应的经典概念类似,其思想是数据所有者在本地随机化其真实信息,并且只发布受干扰的数据。可以为这种局部扰动过程设计许多不同的协议。然而,在迄今为止文献中研究的大多数估计问题中,可以观察到纯非交互协议和允许单个数据提供者之间进行一定程度交互的协议之间在最小最大风险方面没有显著差异。在本文中,我们证明了在估计密度的积分平方时,顺序交互过程在极大极小估计率方面大大优于最佳可能的非交互过程。
特别是,在非交互场景中,我们确定了最小最大速率为\(s=\frac{3}{4}\)的弯头,而在顺序交互场景中弯头为\(s=\frac{1}{2}\)。这与直接观测的情况明显不同,在直接观测中,肘部已知位于\(s=\frac{1}{4}\),在原始数据中添加拉普拉斯噪声的情况下,肘部位于\(s=\frac{9}{4{\)。
我们还提供了自适应估计器,以达到对数因子的最佳速率,我们将非参数优良性检验与更一般积分泛函的估计联系起来,并进行了一系列数值实验。一种特定的局部差异私有但交互式的机制比简单的非交互式机制有所改进,这一事实对于局部差异隐私的实际实现也非常重要。

MSC公司:

62G07年 密度估算
62C20个 统计决策理论中的Minimax过程
62G10型 非参数假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ACHARYA,J.、CANONNE,C.L.、SUN,Z.和TYAGI,H.(2022)。交互在结构化评估中的作用。预印本。可从arXiv:2203.06870获取。
[2] BERRETT,T.和BUTUCEA,C.(2020年)。使用交互机制,离散分布的局部私有非渐近测试速度更快。NeurIPS公司34
[3] Bickel,P.J.和Ritov,Y.(1988年)。估计积分平方密度导数:夏普最佳收敛阶估计。SankhyāSer语。A类50 381-393. ·Zbl 0676.62037号
[4] Birgé,L.和Massart,P.(1995)。密度积分泛函的估计。安。统计师。23 11-29. ·Zbl 0848.62022号 ·doi:10.1214操作系统/11763324452
[5] 布图西亚(2007)。间接观测的优度检验和二次函数估计。安。统计师。35 1907-1930. ·兹比尔1126.62028 ·doi:10.1214/009053607000000118
[6] BUTUCEA,C.和ISSARTEL,Y.(2021)。离散分布非线性泛函的局部微分私人估计。NeurIPS公司34
[7] BUTUCEA,C.、ROHDE,A.和STEINBERGER,L.(2023年)。补充“交互式与非交互式局部差异私人估计:二次函数的两个弯头”https://doi.org/10.1214/22-AOS2254SUPP网站
[8] Butucea,C.、Dubois,A.、Kroll,M.和Saumard,A.(2020年)。局部差异隐私:贝索夫椭球上最优密度估计和自适应中的肘效应。伯努利26 1727-1764. ·Zbl 1444.62045号
[9] Cai,T.T.和Low,M.G.(2005)。二次函数的非二次估计。安。统计师。33 2930-2956. ·Zbl 1085.62055号 ·doi:10.1214/009053605000000147
[10] CAI,T.T.和LOW,M.G.(2006)。二次函数的最优自适应估计。安。统计师。34 2298-2325. ·Zbl 1110.62048号 ·doi:10.1214/09053606000000849
[11] 蔡东东、王毅和张磊(2021)。隐私成本:具有差异隐私的参数估计的最佳收敛速度。安。统计师。49 2825-2850. ·Zbl 1486.62074号 ·doi:10.1214/21-aos2058
[12] Collier,O.、Comminges,L.和Tsybakov,A.B.(2017年)。稀疏类上线性泛函和二次泛函的极大极小估计。安。统计师。45 923-958. ·Zbl 1368.62191号 ·doi:10.1214/15-AOS1432
[13] DEVORE,R.A.、JAWERTH,B.和POPOV,V.(1992年)。小波分解的压缩。阿默尔。数学杂志。114 737-785. ·Zbl 0764.41024号 ·数字对象标识代码:10.2307/2374796
[14] DE LA PEñA,V.H.和MONTGOMERY-SMITH,S.J.(1995)。多元U统计量尾部概率的解耦不等式。安·普罗巴伯。23 806-816. ·Zbl 0827.60014号
[15] Donoho,D.L.和Nussbaum,M.(1990年)。二次泛函的极小极大二次估计。J.复杂性6 290-323. ·兹比尔0724.62039 ·doi:10.1016/0885-064X(90)90025-9
[16] 杜奇,J.C.、乔丹,M.I.和韦恩赖特,M.J.(2013a)。本地隐私和统计最低费率。2013年电气与电子工程师协会54第届计算机科学基础年会2013 429-438. IEEE计算机协会,加利福尼亚州洛斯阿拉米托斯·doi:10.1009/FOCS.2013.53
[17] DUCHI,J.、JORDAN,M.I.和WAINWRIGHT,M.J.(2013b)。局部隐私和极小极大边界:概率估计的锐利率。高级神经信息处理。系统。1529-1537.
[18] 杜奇,J.C.、乔丹,M.I.和韦恩赖特,M.J.(2014)。局部隐私、数据处理不平等和统计极小极大率。预印。可从arXiv:1302.3203获取。
[19] Duchi,J.C.、Jordan,M.I.和Wainwright,M.J.(2018年)。局部私人估算的Minimax优化程序。J.艾默。统计师。协会。113 182-201. ·Zbl 1398.62021号 ·doi:10.1080/01621459.2017.1389735
[20] DUCHI,J.C.和RUAN,F.(2018年)。本地私人估算中正确的复杂性度量:它不是Fisher信息。预印。arXiv:1806.05756v1提供。
[21] DUCHI,J.C.和RUAN,F.(2020年)。本地私人估算中正确的复杂性度量:它不是Fisher信息。可在https://arxiv.org/abs/1806.05756v3。
[22] DWORK,C.、MCSHERRY,F.、NISSIM,K.和SMITH,A.(2006)。校准私人数据分析中的噪声灵敏度。密码学理论(S.Halevi和T.Rabin编辑)。计算机科学课堂讲稿3876 265-284. 柏林施普林格·Zbl 1112.94027号 ·doi:10.1007/11681878_14
[23] EVFIMIEVSKI,A.、GEHRKE,J.和SRIKANT,R.(2003)。限制隐私保护数据挖掘中的隐私泄露。第二十届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会会议记录211-222. 纽约ACM。
[24] Giné,E.和Nickl,R.(2016)。无限维统计模型的数学基础.剑桥统计与概率数学系列40.剑桥大学出版社,纽约·Zbl 1358.62014号 ·doi:10.1017/CBO9781107337862
[25] Härdle,W.、Kerkyacharian,G.、Picard,D.和Tsybakov,A.(1998年)。小波、近似和统计应用.统计学课堂讲稿129.纽约斯普林格·Zbl 0899.62002号 ·doi:10.1007/978-1-4612-222-4
[26] HOUDRÉ,C.和REYNAUD-BOURET,P.(2003年)。二阶U统计量的带常数的指数不等式。随机不等式及其应用.概率论进展56 55-69. Birkhäuser,巴塞尔·Zbl 1036.60015号
[27] JOSEPH,M.、MAO,J.和ROTH,A.(2020年)。局部差异隐私中的指数分离。会议记录2020ACM-SIAM离散算法研讨会515-527. 宾夕法尼亚州费城SIAM·Zbl 07304054号
[28] JOSEPH,M.、MAO,J.、NEEL,S.和ROTH,A.(2019年)。互动在本地差异隐私中的作用。2019年电气与电子工程师协会60第届计算机科学基础年会94-105. IEEE计算。加利福尼亚州洛斯阿拉米托斯Soc.Press·doi:10.1109/FOCS.2019.00015
[29] Kasiviswanathan,S.P.、Lee,H.K.、Nissim,K.、Raskhodnikova,S.和Smith,A.(2011)。我们可以私下学到什么?SIAM J.计算。40 793-826. ·Zbl 1235.68093号 ·doi:10.1137/090756090
[30] Klemelä,J.(2006)。二次泛函的尖锐自适应估计。普罗巴伯。理论相关领域134 539-564. ·Zbl 1082.62032号 ·doi:10.1007/s00440-005-0447-2
[31] LAM-WEIL,J.、LAURENT,B.和LOUBES,J.-M.(2022年)。局部差异隐私约束下密度和多项式的Minimax最优质量测试。伯努利28 579-600. ·Zbl 07467733号 ·doi:10.3150/21-bej1358
[32] 劳伦特(2005)。通过模型选择自适应估计密度的二次函数。ESAIM概率。斯达。9 1-18. ·Zbl 1136.62333号 ·doi:10.1051/ps:200001
[33] Laurent,B.和Massart,P.(2000年)。通过模型选择对二次函数进行自适应估计。安。统计师。28 1302-1338. ·Zbl 1105.62328号
[34] RITOV,Y.和BICKEL,P.J.(1990年)。在非参数和半参数模型中实现信息边界。安。统计师。18 925-938. ·Zbl 0722.62025号 ·doi:10.1214/aos/1176347633
[35] Rohde,A.和Steinberger,L.(2020年)。局部差异隐私约束下的几何收敛率。安。统计师。48 2646-2670. ·Zbl 1457.62396号 ·doi:10.1214/19-AOS1901
[36] 史密斯(2008)。高效的差异私有点估计器。预打印。可从arXiv:0809.4794获取。
[37] 史密斯(2011)。具有最优收敛速度的保私性统计估计。STOC公司11-会议记录43第三届ACM计算理论研讨会813-821. 纽约ACM·Zbl 1288.62015号 ·doi:10.145/1993636.1993743
[38] 斯坦伯格(2023)。本地差异隐私的效率。预印本。可在arXiv:2301.10600购买。
[39] WARNER,S.L.(1965)。随机反应:一种消除回避回答偏见的调查技术。J.艾默。统计师。协会。60 63-69. ·Zbl 1298.62024号 ·doi:10.1080/01621459.1965.10480775
[40] Wasserman,L.和Zhou,S.(2010年)。差异隐私的统计框架。J.艾默。统计师。协会。105 375-389. ·Zbl 1364.62011年 ·doi:10.1198/jasa.2009.tm08651
[41] YE,M.和BARG,A.(2017年)。均方损失下的渐近最优私人估计。预印本。可从arXiv获取:1708.00059
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。