×

具有局部差异隐私的多维网格聚类。 (英文) Zbl 07838255号

摘要:隐私保护聚类近年来受到越来越多的研究关注。局部差异隐私(LDP)是一种不依赖可信第三方的隐私模型。它在分布式隐私保护聚类中起着至关重要的作用。以前的大多数方法都侧重于基于分区的聚类(例如,k均值),这需要许多迭代交互。大规模迭代会导致隐私预算的划分,并增加单个噪声的数量,从而影响聚类效用。为了解决这个问题,我们转向基于网格的聚类,并设计GC-LDP算法来平衡隐私和聚类效用,只需三轮交互。在GC-LDP中,我们的核心贡献是通过变异系数(CV)开发了一种非均匀网格划分方法,该方法可以在两轮交互中生成近似全球数据分布的网格结构。此外,我们设计了一种新的扰动机制来减少单个噪声注入量。此外,通过探索网格之间的相对密度差异,开发了一种细胞聚集方法,以实现多密度聚类。理论分析和实际数据集的实验表明,GC-LDP可以在满足局部差异隐私的同时获得高质量的聚类结果。

MSC公司:

62至XX 统计
68倍 计算机科学

软件:

RAPPOR公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] J.C.Duchi、M.I.Jordan、M.J.Wainwright,《局部隐私和统计最小最大速率》,摘自:2013年IEEE第54届计算机科学基础年度研讨会,IEEE,2013年,第429-438页。
[2] Ú. Erlingsson,V.Pihur,A.Korolova,Rappor:随机化可聚合隐私保护有序响应,摘自:2014年ACM SIGSAC计算机和通信安全会议论文集,2014年,第1054-1067页。
[3] 郭,T。;罗,J。;Dong,K。;Yang,M.,基于本地差异私有项目的协同过滤,信息科学。,502, 229-246 (2019) ·Zbl 1453.68071号
[4] 郑,X。;陈,A。;罗,G。;田,L。;Cai,Z.,Privacy-在人工辅助的普适计算系统中保留了不同的内容集合,Inf.Sci。,493, 91-104 (2019) ·兹比尔1451.68100
[5] C.计算机科学中的Dwork、Differential privacy、课堂讲稿。
[6] 李,X。;李,H。;朱,H。;Huang,M.,差异隐私下laplace机制查询次数的最优上界,Inf.Sci。,503, 219-237 (2019) ·Zbl 1453.68072号
[7] 王,R。;冯,B.C。;Zhu,Y。;Peng,Q.,任意分区数据的差异私有数据发布,Inf.Sci。,553, 247-265 (2021) ·兹比尔1483.68101
[8] Wang,H。;Wang,H.,通过差异隐私发布相关元组数据,Inf.Sci。,560, 347-369 (2021) ·Zbl 1484.68061号
[9] K.Nissim,U.Stemmer,《集中式和局部模型的聚类算法》,载于:算法学习理论,PMLR,2018年,第619-653页·Zbl 1405.68111号
[10] 斯特默,美国。;Kaplan,H.,《具有恒定乘法误差的差分私有k均值》,高级神经信息。过程。系统。,31, 5431-5441 (2018)
[11] 夏,C。;Hua,J。;Tong,W。;Zhong,S.,Distributed k-means集群,保证本地差异隐私,计算。安全。,90,第101699条pp.(2020)
[12] Z.Qin,Y.Yang,T.Yu,I.Khalil,X.Xiao,K.Ren,局部差异隐私下集值数据的重击估计,载于:ACM SIGSAC计算机与通信安全会议,2016年,第192-203页。
[13] T.Wang,N.Li,S.Jha,本地差异私人重击手识别,IEEE Trans。可靠的安全计算。
[14] T.Wang,N.Li,S.Jha,局部差异私有频繁项集挖掘,摘自:2018年IEEE安全与隐私研讨会,IEEE,2018年,第127-143页。
[15] 王,S。;黄,L。;聂,Y。;王,P。;Xu,H。;Yang,W.,Privset:具有地区差异隐私的集值数据分析,(IEEE INFOCOM 2018-IEEE计算机通信会议(2018),IEEE),1088-1096
[16] 刘,Z。;Xu,H。;黄,L。;杨伟,估计具有局部差异隐私的多重图的聚类系数,(无线算法、系统和应用国际会议(2021),施普林格),390-398
[17] T.T.Nguyñn、X.Xiao、Y.Yang、S.C.Hui、H.Shin、J.Shin,从具有本地差异隐私的智能设备用户收集和分析数据,arXiv预印本arXiv:1606.05053。
[18] B.Ding,J.Kulkarni,S.Yekhanin,《私下收集遥测数据》,arXiv预印本arXiv:1712.01524。
[19] B.Ding,H.Nori,P.Li,J.Allen,《比较局部差异隐私下的人口平均数:意义和权力》,载《AAAI人工智能会议论文集》,2018年第32卷。
[20] Wang,N。;Xiao,X。;Yang,Y。;赵,J。;慧,S.C。;Shin,H。;Shin,J。;Yu,G.,收集和分析具有本地差异隐私的多维数据,(2019年IEEE第35届国际数据工程会议(ICDE)(2019),IEEE),638-649
[21] U.Stemmer,局部私有k-means聚类,摘自:第十四届ACM-SIAM离散算法年会论文集,SIAM,2020年,第548-559页·Zbl 07304056号
[22] L.Sun,J.Zhao,X.Ye,具有局部差异隐私的匿名空间中的分布式聚类,arXiv预印本arXiv:1906.11441。
[23] 吕,Z。;Wang,L。;关,Z。;吴杰。;杜,X。;赵,H。;Guizani,M.,基于sdn的智能电网中混合数据的优化和差异私有聚类算法,IEEE Access,745773-45782(2019)
[24] W.Li,H.Chen,R.Zhao,C.Hu,基于本地差异隐私聚类的联合推荐系统,收录于:2021年IEEE SmartWorld,无处不在的智能与计算,高级与可信计算,可扩展计算与通信,互联网与智慧城市创新,IEEE,2021年,第364-369页。
[25] H.Sun,X.Xiao,I.Khalil,Y.Yang,Z.Qin,H.Wang,T.Yu,从分散的差异隐私的扩展局部视图分析子图统计,载于:2019年ACM SIGSAC计算机和通信安全会议论文集,2019年,第703-717页。
[26] 叶,Q。;胡,H。;金,M.H。;X孟。;Xiao,X.,走向局部差异私有通用图度量估计,(2020 IEEE第36届国际数据工程会议(ICDE)(2020),IEEE),1922-1925
[27] F.D.McSherry,《隐私集成查询:隐私保护数据分析的可扩展平台》,载于《2009年ACM SIGMOD数据管理国际会议论文集》,2009年,第19-30页。
[28] Wang,T。;布洛克,J。;李,N。;Jha,S.,频率估计的局部差异私有协议,729-745(2017),USENIX安全研讨会:USENIX-安全研讨会
[29] Warner,S.L.,《随机反应:消除回避回答偏见的调查技术》,《美国统计协会期刊》,第60、309、63-69页(1965年)·Zbl 1298.62024号
[30] 黄,H.-W。;Huang,T.-M.,基于相对网格密度差的可拓聚类算法,应用。Res.计算。,6, 1702-1705 (2014)
[31] Wilks,S.S.,《检验复合假设的似然比的大样本分布》,《数学年鉴》。Stat.,9,1,60-62(1938年)·Zbl 0018.3203号
[32] Knops,Z.F。;Maintz,J.A。;Viergever,医学硕士。;Pluim,J.P.,使用基于k-means聚类的直方图binning进行基于规范化互信息的注册,(医学成像2003:图像处理,第5032卷(2003),SPIE),1072-1080
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。