×

局部差分隐私模型中的主成分分析。 (英语) Zbl 1436.68100号

摘要:本文研究了(分布式)非交互局部差异隐私模型下的主成分分析(PCA)问题。对于低维情况(即,(p\lln)),我们使用平方子空间距离作为度量,显示了(k)维PCA私有极小极大风险的最佳比率(Theta(\frac{kp}{n\epsilon^2}),其中(n)是样本大小,(varepsilon)是隐私参数。对于高维(即,(p\ggn))行稀疏情况,我们首先给出私有极大极小风险的(Omega(\frac{ks\log p}{n\epsilon^2})的下界,其中(s)是潜在的稀疏性参数。然后我们提供了一个有效的算法来实现\(O(\ frac{s^2\logp}{n\epsilon^2})\的上界。在合成数据集和现实世界数据集上的实验都证实了我们的理论保证。

MSC公司:

68第27页 数据隐私
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 王,D。;Xu,J.,局部差异隐私模型中的主成分分析,(第二十届国际人工智能联合会议论文集(2019)),4795-4801
[2] 科斯特洛,A.B。;Osborne,J.W.,《探索性因子分析的最佳实践:从分析中获得最大收益的四条建议》,Pract。评估。,研究评估。,10, 7, 1-9 (2005)
[3] 阿伊特萨赫利亚,Y。;Xiu,D.,使用主成分分析估计高频数据的高维因子模型,J.Econom。,201, 2, 384-399 (2017) ·Zbl 1377.62148号
[4] 巴伯,D。;Howlett,P。;Smart,R.,《医学研究中的主成分分析》,J.Appl。《统计》,第2、1、39-43页(1975年)
[5] 卢·D。;Xu,S.,主成分分析显示,1000基因组项目没有充分覆盖亚洲的人类遗传多样性,Front。遗传学。,4, 127 (2013)
[6] 俄勒冈州埃尔林森。;Pihur,V。;Korolova,A.,Rappor:随机化可聚合隐私保护有序反应(CCS(2014),ACM),1054-1067
[7] Near,J.,《规模上的差异隐私:优步和伯克利合作》(Enigma 2018(Enigma2018)(2018),USENIX协会:美国加利福尼亚州圣克拉拉市
[8] A.史密斯。;Thakurta,A。;Upadhyay,J.,分布式私人学习需要交互吗?,(安全与隐私(SP),2017年IEEE研讨会(2017年),IEEE),58-77
[9] Vu、V.Q.等人。;Lei,J.,高维Minimax稀疏主子空间估计,Ann.Stat.,41,6,2905-2947(2013)·Zbl 1288.62103号
[10] Cai,T.T。;Ma,Z。;Wu,Y.,《稀疏主成分分析:最优速率和自适应估计》,《Ann.Stat.》,41,6,3074-3110(2013)·Zbl 1288.62099号
[11] Vu,V.Q。;Cho,J。;Lei,J。;Rohe,K.,Fantope投影与选择:稀疏pca的近最优凸松弛,(神经信息处理系统进展(2013)),2670-2678
[12] Blum,A。;德沃克,C。;McSherry,F。;Nissim,K.,《实用隐私:sulq框架》,(第二十四届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2005),ACM),128-138
[13] 德沃克,C。;塔尔瓦尔,K。;Thakurta,A。;Zhang,L.,Analyze gauss:privacy keepending princy component analysis的最优界,(第四十六届ACM计算理论研讨会论文集(2014),ACM),11-20·Zbl 1315.94115号
[14] 乔杜里,K。;萨尔瓦特,医学博士。;Sinha,K.,《差分-私有主成分的近最优算法》,J.Mach。学习。第14号、第1号、第2905-2943号决议(2013年)·Zbl 1318.62202号
[15] 蒋伟(Jiang,W.)。;谢,C。;Zhang,Wishart差异私人主成分分析机制,(AAAI(2016)),1730-1736
[16] Gonem,A。;Gilad Bachrach,R.,基于平滑灵敏度的差异私有主成分分析方法,(算法学习理论(2018)),438-450·Zbl 1405.68109号
[17] Ge,J。;王,Z。;王,M。;Liu,H.,分布式系统中的Minimax-optimal privacy-保持稀疏pca,(国际人工智能与统计会议(2018)),1589-1598
[18] 巴尔坎,M.-F。;杜,S.S。;王,Y。;Yu,A.W.,噪声功率法的改进间隙依赖性分析,(学习理论会议(2016)),284-309
[19] 杜奇,J.C。;M.I.乔丹。;Wainwright,M.J.,《当地私人估算的Minimax最优程序》,J.Am.Stat.Assoc.,113,521,182-201(2018)·Zbl 1398.62021号
[20] 杜奇,J.C。;M.I.乔丹。;Wainwright,M.J.,《局部隐私和统计最小最大速率》,(计算机科学基础(FOCS),2013年IEEE第54届年会(2013年),IEEE),429-438
[21] 卡普拉洛夫,M。;Talwar,K.,《差分私有低秩近似》,(第二十四届ACM-SIAM离散算法年会论文集(2013),SIAM),1395-1414·Zbl 1423.68595号
[22] Stewart,G.W.,矩阵摄动理论(1990)·Zbl 0722.15002号
[23] Bhatia,R.,《矩阵分析》,第169卷(2013),施普林格科学与商业媒体
[24] Lei,J。;Vu,V.Q.,稀疏主成分分析中的稀疏性和不可知论推理,《美国统计年鉴》,43,1,299-322(2015)·Zbl 1308.62125号
[25] 赵,P。;Yu,B.,关于套索的模型选择一致性,J.Mach。学习。第72541-2563号决议(2006年11月)·Zbl 1222.62008年
[26] Dheeru,D。;Karra Taniskidou,E.(2017),UCI机器学习库
[27] Li,J.等人。;Cheng,K。;王,S。;Morstatter,F。;特雷维诺,R.P。;Tang,J。;Liu,H.,特征选择:数据透视,ACM Compute。调查。,50, 6, 94 (2017)
[28] 王,Z。;Lu,H.等人。;Liu,H.,《松弛后的紧致:多项式时间内的最小最优稀疏主成分分析》(Advances in Neural Information Processing Systems,2014),3383-3391
[29] Szarek,S.J.,grassmann流形和正交群的网,(巴拿赫空间理论研究研讨会论文集,第169卷。巴纳赫空间理论研究研讨会论文集,第169卷,爱荷华州爱荷华城,1981(1982)),185·Zbl 0526.53047号
[30] Laurent,B。;Massart,P.,通过模型选择对二次函数的自适应估计,《Ann.Stat.》,1302-1338(2000)·Zbl 1105.62328号
[31] 科尔钦斯基,V。;Lounici,K.,《样本协方差双线性形式谱投影的渐近性和浓度界》,《Ann.Inst.Henri PoincaréProbab》。统计,52,1976-2013(2016)·Zbl 1353.62053号
[32] 范,J。;王,D。;王凯。;Zhu,Z.,主特征空间的分布式估计,arXiv预印本·Zbl 1450.62067号
[33] Davis,C。;Kahan,W.M.,特征向量的扰动旋转。iii,SIAM J.数字。分析。,7, 1, 1-46 (1970) ·Zbl 0198.47201号
[34] Yu,Y。;Wang,T。;Samworth,R.J.,统计学家戴维斯-卡汉定理的一个有用变体,《生物统计学》,102,2,315-323(2014)·Zbl 1452.15010号
[35] Tao,T.,随机矩阵理论专题,研究生。数学研究生。,132,46-47(2012年)·Zbl 1256.15020号
[36] P.Massart,集中度不等式和模型选择·Zbl 1170.60006号
[37] Pajor,A.,格拉斯曼流形的度量熵,凸几何。分析。,34, 181-188 (1998) ·Zbl 0942.46013号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。