摘要:大数据时代信息技术不断发展,隐私问题越来越受到人们的关注。尤其是随着移动端的普及,如何在数据发布的同时保护用户个人的隐私信息是当前面临的重大挑战。此前学术界曾提出依赖于可信第三方的中心化差分隐私技术,但在实际应用中可信第三方的条件通常不成立;随后,在中心化差分隐私的基础上进一步提出了本地化差分隐私,它能够防止来自不可信第三方的隐私攻击,并且面对具有任意知识背景的隐私攻击者依然具有很强的防御效果。但是,市场通常不仅要迎合用户的需求,也要满足运营商的要求。为了对两者进行平衡,如何解决运营商的分析任务是亟待解决的问题。RAPPOR(随机化可聚合隐私保护有序响应)算法能够很好地完成这个任务,它通过使用两次随机响应机制对用户数据进行加密,保证了隐私保护的力度,并使用 拉索回归模型对加密数据进行解密,保证了频率特征提取的准确度。文中的贡献在于将RAPPOR公司算法应用于疫情信息采集,在保护受访者隐私信息的同时能获取真实的疫情资料,以美国各地新冠确诊人数的数据集进行实验,实验结果表明,所提方法较高程度地拟合了真实结果,完成了频率特征提取的分析任务。RAPPOR公司算法实现了本地化差分隐私技术从理论走向应用,切实保障了个人的隐私问题。
中图分类号:
黄觉, 周春来.基于本地化差分隐私的频率特征提取[J] ●●●●。计算机科学, 2022, 49(7): 350-356. https://doi.org/10.11896/jsjkx.210900229
黄珏、周春来。基于局部差异隐私的频率特征提取[J] ●●●●。计算机科学,2022,49(7):350-356。https://doi.org/10.11896/jsjkx.210900229