王迪;徐金辉 局部差分隐私模型中的主成分分析。 (英语) Zbl 1436.68100号 西奥。计算。科学。 809, 296-312 (2020). 摘要:本文研究了(分布式)非交互局部差异隐私模型下的主成分分析(PCA)问题。对于低维情况(即,(p\lln)),我们使用平方子空间距离作为度量,显示了(k)维PCA私有极小极大风险的最佳比率(Theta(\frac{kp}{n\epsilon^2}),其中(n)是样本大小,(varepsilon)是隐私参数。对于高维(即,(p\ggn))行稀疏情况,我们首先给出私有极大极小风险的(Omega(\frac{ks\log p}{n\epsilon^2})的下界,其中(s)是潜在的稀疏性参数。然后我们提供了一个有效的算法来实现\(O(\ frac{s^2\logp}{n\epsilon^2})\的上界。在合成数据集和现实世界数据集上的实验都证实了我们的理论保证。 引用于1文件 MSC公司: 68第27页 数据隐私 62H25个 因子分析和主成分;对应分析 关键词:本地差异隐私;主成分分析;稀疏PCA 软件:RAPPOR公司;UCI-毫升;SuLQ公司 PDF格式BibTeX公司 XML格式引用 \textit{D.Wang}和\textit{J.Xu},Theor。计算。科学。809296-312(2020年;Zbl 1436.68100) 全文: 内政部 参考文献: [1] 王,D。;Xu,J.,局部差异隐私模型中的主成分分析,(第二十届国际人工智能联合会议论文集(2019)),4795-4801 [2] 科斯特洛,A.B。;Osborne,J.W.,《探索性因子分析的最佳实践:从分析中获得最大收益的四条建议》,Pract。评估。,研究评估。,10, 7, 1-9 (2005) [3] 阿伊特萨赫利亚,Y。;Xiu,D.,使用主成分分析估计高频数据的高维因子模型,J.Econom。,201, 2, 384-399 (2017) ·Zbl 1377.62148号 [4] 巴伯,D。;Howlett,P。;Smart,R.,《医学研究中的主成分分析》,J.Appl。《统计》,第2、1、39-43页(1975年) [5] 卢·D。;Xu,S.,主成分分析显示,1000基因组项目没有充分覆盖亚洲的人类遗传多样性,Front。遗传学。,4, 127 (2013) [6] 俄勒冈州埃尔林森。;Pihur,V。;Korolova,A.,Rappor:随机化可聚合隐私保护有序反应(CCS(2014),ACM),1054-1067 [7] Near,J.,《规模上的差异隐私:优步和伯克利合作》(Enigma 2018(Enigma2018)(2018),USENIX协会:美国加利福尼亚州圣克拉拉市 [8] A.史密斯。;Thakurta,A。;Upadhyay,J.,分布式私人学习需要交互吗?,(安全与隐私(SP),2017年IEEE研讨会(2017年),IEEE),58-77 [9] Vu、V.Q.等人。;Lei,J.,高维Minimax稀疏主子空间估计,Ann.Stat.,41,6,2905-2947(2013)·Zbl 1288.62103号 [10] Cai,T.T。;Ma,Z。;Wu,Y.,《稀疏主成分分析:最优速率和自适应估计》,《Ann.Stat.》,41,6,3074-3110(2013)·Zbl 1288.62099号 [11] Vu,V.Q。;Cho,J。;Lei,J。;Rohe,K.,Fantope投影与选择:稀疏pca的近最优凸松弛,(神经信息处理系统进展(2013)),2670-2678 [12] Blum,A。;德沃克,C。;McSherry,F。;Nissim,K.,《实用隐私:sulq框架》,(第二十四届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2005),ACM),128-138 [13] 德沃克,C。;塔尔瓦尔,K。;Thakurta,A。;Zhang,L.,Analyze gauss:privacy keepending princy component analysis的最优界,(第四十六届ACM计算理论研讨会论文集(2014),ACM),11-20·Zbl 1315.94115号 [14] 乔杜里,K。;萨尔瓦特,医学博士。;Sinha,K.,《差分-私有主成分的近最优算法》,J.Mach。学习。第14号、第1号、第2905-2943号决议(2013年)·Zbl 1318.62202号 [15] 蒋伟(Jiang,W.)。;谢,C。;Zhang,Wishart差异私人主成分分析机制,(AAAI(2016)),1730-1736 [16] Gonem,A。;Gilad Bachrach,R.,基于平滑灵敏度的差异私有主成分分析方法,(算法学习理论(2018)),438-450·Zbl 1405.68109号 [17] Ge,J。;王,Z。;王,M。;Liu,H.,分布式系统中的Minimax-optimal privacy-保持稀疏pca,(国际人工智能与统计会议(2018)),1589-1598 [18] 巴尔坎,M.-F。;杜,S.S。;王,Y。;Yu,A.W.,噪声功率法的改进间隙依赖性分析,(学习理论会议(2016)),284-309 [19] 杜奇,J.C。;M.I.乔丹。;Wainwright,M.J.,《当地私人估算的Minimax最优程序》,J.Am.Stat.Assoc.,113,521,182-201(2018)·Zbl 1398.62021号 [20] 杜奇,J.C。;M.I.乔丹。;Wainwright,M.J.,《局部隐私和统计最小最大速率》,(计算机科学基础(FOCS),2013年IEEE第54届年会(2013年),IEEE),429-438 [21] 卡普拉洛夫,M。;Talwar,K.,《差分私有低秩近似》,(第二十四届ACM-SIAM离散算法年会论文集(2013),SIAM),1395-1414·Zbl 1423.68595号 [22] Stewart,G.W.,矩阵摄动理论(1990)·Zbl 0722.15002号 [23] Bhatia,R.,《矩阵分析》,第169卷(2013),施普林格科学与商业媒体 [24] Lei,J。;Vu,V.Q.,稀疏主成分分析中的稀疏性和不可知论推理,《美国统计年鉴》,43,1,299-322(2015)·Zbl 1308.62125号 [25] 赵,P。;Yu,B.,关于套索的模型选择一致性,J.Mach。学习。第72541-2563号决议(2006年11月)·Zbl 1222.62008年 [26] Dheeru,D。;Karra Taniskidou,E.(2017),UCI机器学习库 [27] Li,J.等人。;Cheng,K。;王,S。;Morstatter,F。;特雷维诺,R.P。;Tang,J。;Liu,H.,特征选择:数据透视,ACM Compute。调查。,50, 6, 94 (2017) [28] 王,Z。;Lu,H.等人。;Liu,H.,《松弛后的紧致:多项式时间内的最小最优稀疏主成分分析》(Advances in Neural Information Processing Systems,2014),3383-3391 [29] Szarek,S.J.,grassmann流形和正交群的网,(巴拿赫空间理论研究研讨会论文集,第169卷。巴纳赫空间理论研究研讨会论文集,第169卷,爱荷华州爱荷华城,1981(1982)),185·Zbl 0526.53047号 [30] Laurent,B。;Massart,P.,通过模型选择对二次函数的自适应估计,《Ann.Stat.》,1302-1338(2000)·Zbl 1105.62328号 [31] 科尔钦斯基,V。;Lounici,K.,《样本协方差双线性形式谱投影的渐近性和浓度界》,《Ann.Inst.Henri PoincaréProbab》。统计,52,1976-2013(2016)·Zbl 1353.62053号 [32] 范,J。;王,D。;王凯。;Zhu,Z.,主特征空间的分布式估计,arXiv预印本·Zbl 1450.62067号 [33] Davis,C。;Kahan,W.M.,特征向量的扰动旋转。iii,SIAM J.数字。分析。,7, 1, 1-46 (1970) ·Zbl 0198.47201号 [34] Yu,Y。;Wang,T。;Samworth,R.J.,统计学家戴维斯-卡汉定理的一个有用变体,《生物统计学》,102,2,315-323(2014)·Zbl 1452.15010号 [35] Tao,T.,随机矩阵理论专题,研究生。数学研究生。,132,46-47(2012年)·Zbl 1256.15020号 [36] P.Massart,集中度不等式和模型选择·Zbl 1170.60006号 [37] Pajor,A.,格拉斯曼流形的度量熵,凸几何。分析。,34, 181-188 (1998) ·Zbl 0942.46013号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。