×

局部差异隐私下固定点密度估计。 (英语) Zbl 1471.62318号

摘要:我们在局部(纯隐私和近似隐私)差异隐私的框架下考虑非参数密度估计。与具有可信管理员的集中式隐私场景不同,在本地设置中,必须确保个人数据所有者已经实现匿名化,因此必须在任何数据挖掘任务之前进行匿名化。因此,公布的匿名数据应与尽可能多的统计程序兼容。我们分别考虑不同的机制来建立纯粹的和近似的差异隐私。对于不动点处的均方误差,我们获得了以平滑参数(s>1/2)为指标的Sobolev类上的极小极大型结果。特别地,我们证明了如果正确指定带宽参数,适当定义的核密度估计可以获得最佳收敛速度。值得注意的是,在纯差异隐私下,样本大小方面的最优收敛速度为(n^{-(2s-1)/(2s+1)}),因此恶化为在无隐私限制和近似差异隐私下都保持的速度。由于带宽参数的最佳选择取决于平滑度,因此在实践中不可访问,因此带宽选择的自适应方法是必要的,并且在本地隐私框架中,必须仅基于匿名数据执行。我们通过针对当前隐私设置定制的Lepski方法的变体来解决这个问题,并获得私有核密度估计器的一般预言不等式。在Sobolev情况下,得到的自适应估计量至少达到对数因子的最佳收敛速度。另一方面,我们讨论了与近似差异隐私概念相关的一些关键问题。

MSC公司:

62G07年 密度估算
第60页 统计学在工程和工业中的应用;控制图
68第25页 数据加密(计算机科学方面)

软件:

私人LR
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] R.F.Barber和J.C.Duchi。隐私和统计风险:形式主义和Minimax界限。arXiv-预印本,网址:https://arxiv.org/abs/1412.4451v1, 2014.
[2] L.D.Brown和M.G.Low。一个约束风险不等式及其在非参数函数估计中的应用。安。统计师。, 24(6):2524-2535, 1996. ISSN 0090-5364。统一资源定位地址https://doi.org/10.1214/aos/103218166。 ·Zbl 0867.62023号
[3] C.布图西亚。Sobolev类密度的精确自适应逐点估计。ESAIM概率。统计师。2001年5月31日。ISSN 1292-8100。统一资源定位地址https://doi.org/10.1051/ps:2001100。 ·Zbl 0990.62032号
[4] C.Butucea、A.Dubois、M.Kroll和A.Saumard。局部差异隐私:贝索夫椭球最优密度估计和自适应中的肘效应。伯努利, 26(3):1727-1764, 2020. ISSN 1350-7265。统一资源定位地址https://doi.org/10.3150/19-BEJ1165。 ·Zbl 1444.62045号
[5] 蔡洪涛。点态风险下Besov空间的收敛速度和自适应。统计师。西尼卡, 13(3):881-902, 2003. ISSN 1017-0405·Zbl 1046.62046号
[6] 蔡T.T.、王Y.和张L。隐私成本:具有差异隐私的参数估计的最佳收敛速度。arXiv-预印本,网址:https://arxiv.org/abs/1902.04495, 2020.
[7] L.骑士。层析成像中的局部自适应估计问题。伯努利,7(1):63-782001。ISSN 1350-7265。统一资源定位地址https://doi.org/10.2307/3318602。 ·Zbl 0966.62021号
[8] Chen M.、C.Gao和Z.Ren。Huber的一般决策理论𝜖-污染模型。电子。J.统计。, 10(2):3752-3774, 2016. 统一资源定位地址https://doi.org/10.1214/16-EJS1216。 ·兹比尔1357.62038
[9] F.孔德。估计非参数矩阵斯巴达克斯,巴黎,2015年·Zbl 1357.62005年
[10] D.L.Donoho和M.G.Low。重整化指数和最佳逐点收敛速度。安。统计师。, 20(2):944-970, 1992. ISSN 0090-5364。统一资源定位地址https://doi.org/10.1214/aos/1176348665。 ·Zbl 0797.62032号
[11] J.C.Duchi、M.I.Jordan和M.J.Wainwright。局部私人估算的Minimax优化程序。J.Amer。统计师。协会。, 113(521):182-201, 2018. ISSN 0162-1459。统一资源定位地址https://doi.org/10.1080/01621459.2017.1389735。 ·Zbl 1398.62021号
[12] C.住所。不同的隐私。自动化、语言和编程。第二部分,第4052卷,共计算机课堂讲稿。科学。,第1-12页。施普林格,柏林,2006年。统一资源定位地址https://doi.org/10.1007/11787006_1。 ·Zbl 1133.68330号
[13] C.德沃克。差异隐私:结果调查。计算模型的理论与应用,第4978卷,共计算机课堂讲稿。科学。,第1-19页。施普林格,柏林,2008年。统一资源定位地址https://doi.org/10.1007/978-3-540-79228-4_1。 ·Zbl 1139.68339号
[14] C.Dwork、F.McSherry、K.Nissim和A.Smith。校准私人数据分析中的噪声灵敏度。密码学理论,第3876卷,共页计算机课堂讲稿。科学。,第265-284页。施普林格,柏林,2006年。统一资源定位地址https://doi.org/10.1007/11681878_14。 ·Zbl 1112.94027号
[15] A.Goldenshluger和S.V.Pereverzev。间接白噪声观测中希尔伯特尺度线性泛函的自适应估计。普罗巴伯。理论相关领域, 118(2):169-186, 2000. ISSN 0178-8051。统一资源定位地址https://doi.org/10.1007/s440-000-8013-3。 ·Zbl 1055.62523号
[16] R.Hall、A.Rinaldo和L.Wasserman。随机差异隐私。arXiv-预印本,网址:https://arxiv.org/abs/1112.2680,2011年。
[17] R.Hall、A.Rinaldo和L.Wasserman。功能和功能数据的不同隐私。机器学习研究杂志, 14:703-727, 2013. ISSN 1532-4435·Zbl 1319.68081号
[18] N.Holohan、D.J.Leith和O.Mason。公制空间中的差异隐私:数字、分类和功能数据在同一屋檐下。通知。科学。, 305:256-268, 2015. ISSN 0020-0255。统一资源定位地址https://doi.org/10.1016/j.ins.2015.01.021。 ·Zbl 1360.68431号
[19] O.V.Lepski公司。高斯白噪声中的自适应估计问题。特奥。Veroyatnost公司。i Primenen公司。, 35(3):459-470, 1990. 编号0040-361X。统一资源定位地址https://doi.org/10.1137/1135065。 ·Zbl 0725.62075号
[20] O.V.Lepski和V.G.Spokoiny。非参数估计中的最优逐点自适应方法。安。统计师。, 25(6):2512-2546, 1997. ISSN 0090-5364。统一资源定位地址https://doi.org/10.1214/aos/1030741083。 ·兹伯利0894.62041
[21] A.Rohde和L.Steinberger。局部差异隐私约束下的几何收敛率。安。统计师。, 48(5):2646-2670, 2020. ISSN 0090-5364。统一资源定位地址https://doi.org/10.1214/19-AOS1901。 ·兹比尔1457.62396
[22] A.B.茨巴科夫。Sobolev类上函数的逐点和超形式自适应估计。安。统计师。, 26(6):2420-2469, 1998. ISSN 0090-5364。统一资源定位地址https://doi.org/10.1214/aos/1024691478。 ·Zbl 0933.62028号
[23] A.B.茨巴科夫。非参数估算简介Springer-Verlag出版社,柏林,2004年。国际标准图书编号(ISBN)3-540-40592-5·Zbl 1029.62034号
[24] A.B.茨巴科夫。非参数估计简介《统计学中的斯普林格系列》。施普林格,纽约,2009年。国际标准图书编号978-0-387-79051-0。统一资源定位地址https://doi.org/10.1007/b13794。对2004年法文原版进行修订和扩充,弗拉基米尔·扎亚茨翻译·兹比尔1176.62032
[25] L.Wasserman和S.Zhou。差异隐私的统计框架。J.Amer。统计师。协会。, 105(489):375-389, 2010. ISSN 0162-1459。统一资源定位地址https://doi.org/10.1198/jasa.2009.tm08651。 ·Zbl 1364.62011年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。