{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期部分”:[[2024,6,29]],“日期时间”:“2024-06-29T07:58:17Z”,“时间戳”:1719647897032},“引用计数”:35,“发布者”:“计算机协会(ACM)”,“问题”:“10”,“内容域”:{“域”:[],“交叉标记限制”:false},短集装箱舱位”:[“Proc.VLDB Endow.”],“published-print”:{“date-parts”:[[2018,6]]},“abstract”:“\n隐私是我们社会的一个重要问题,与合作伙伴共享数据或向公众发布数据是经常发生的事情。用于实现隐私的一些技术是删除标识符、更改准标识符和扰动值。不幸的是,这些方法有两个局限性。首先,已经证明,如果攻击者拥有一些背景知识或其他信息源,私人信息仍然可能泄漏。其次,他们没有考虑到这些方法对发布数据的效用产生的不利影响。在本文中,我们提出了一种满足这两个要求的方法。我们的方法,称为\ntable-GAN<\/jats:italic>\n使用生成性对抗网络(GAN)合成在统计上与原始表相似但不会导致信息泄漏的假表。我们表明,使用我们的合成表训练的机器学习模型表现出的性能与使用原始表训练的未知测试用例模型的性能相似。我们将此属性称为\n模型兼容性<\/jats:italic>\n。我们认为,没有模型兼容性的匿名化扰动综合方法没有什么价值。我们使用来自四个不同领域的四个真实世界数据集进行实验,并使用最先进的匿名化、扰动和生成技术进行了深入的比较。在我们的实验中,只有我们的方法始终显示出隐私级别和模型兼容性之间的平衡。\n<\/jats:p>“,”DOI“:”10.14778\/3231751.3231757“,”type“:”journal-article“,”created“:{”date-parts“:[[2018,7,27]],”date-time“:”2018-07-27T12:21:07Z“,”timestamp“:1532694067000}“,”page“:“1071-1083”,“source”:“Crossref”,“is-referenced-by-count”:220,“title”:[“基于生成性对抗网络的数据合成”],“前缀”:“10.1 4778“,”卷“:”11”,“作者”:[{“给定”:“Noseong”,“家族”:“Park”,“序列”:“first”,“附属关系”:[{“name”:“北卡罗来纳大学”}]},{“给定”:“Mahmoud”,“家族”:“Mohammadi”,“序列”:“additional”,“附属关系”:[{“name”:“北卡罗来纳大学”}]},{“给定”:“Kshitij”,“家族”:“Gorde”,“序列”:“additional”,“附属关系”:[{“name”:“北卡罗来纳大学“}]},{”given“:”Sushil“,”family“:”Jajodia“,”sequence“:”additional“,”affiliation“:[{”name“:”George Mason University“}]{”fixed“:”Hongkyu“,”家人“:”Park“,”序列“:”additional“、”affidiation“:”ETRI,Daejeon,South Korea“}]neneneep,{“given”:“Youngmin”,“family”:“Kim”,“sequence”:“additional”,“affiliance”:[{“名称”:“ETRI,韩国大田“}]}],“成员”:“320”,“在线发布”:{“日期部分”:[[2018,6]]},“参考”:[{“key”:“e_1_1__1_1”,“非结构化”:“成人数据集.https:\\/archive.ics.uci.edu\/ml\/machine-learning-databases\/active.Adult.Dataset.https:\\/archile.ics.edu\/ml\/machine-learning-databases\/Active.”},{“密钥”:“e_1_2_1_2-1”,“非结构化“:”航空数据集。https:\/\/www.transtats.bts.gov\/DataIndex.asp。航空公司数据集。https:\/\/www.transtats.bts.gov\/DataIndex.asp。“},{”key“:”e_1_2_1_3_1“,”unstructured“:”ARX-数据匿名工具.http:\\//ARX.deidentifier.org.ARX-数字匿名工具.htmp:\\/\/ARX.deideentifier.org.“}”,{“key”:“e_1_i_1_4_1”,“unstructure”:“Health Dataset.https:\\/wwwwn.cdc.gov\/Nchs\/Nhanes\/Default.aspx.Health Data set.https:\\/wwn.cdc.gov\/Nchs \/Nhanes\/Default.aspx.“},{”key“:”e_1_2_1_5_1“,”unstructured“:”洛杉矶市政府雇员工资数据集。https:\/\/controllerdata.lacity.org\/Payroll\/City-Employee-Payroll\/pazn-qyym。洛杉矶市政府雇员工资数据集。https:\/\/controllerdata.lacity.org\/Payroll\/City-Employee-Payroll\/pazn-qyym。“},{”key“:”e_1_2_1_6_1“,”unstructured“:”Scikit-learn:Python中的机器学习。http://\\/Scikit-learn.org。Scikit-learn:在Pythons中的机器学。http://\\/Scikit-learn.org.“}sdcMicro:微观数据匿名化和风险评估的统计披露控制方法。https:\/\/cran.r-project.org\/web\/packages\/sdcMicro\/index.html。sdcMicro:微观数据匿名化和风险评估的统计披露控制方法。https:\/\/cran.r-project.org\/web\/packages\/sdcMicro\/index.html。“},{”key“:”e_1_1_8_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1007\/978-3-540-24741-8_12”},“key”:“e_1_i_1_9_1”,“doi-assert-by”:“publisher”,”doi“:”10.1145\/375551.375602“}”,{“key”:“e_1_2_1_11_1”,“volume-title”:“Sensegen:合成传感器数据生成的深度学习架构。CoRR,abs \/1701.08886“,“author”:“Alzantot M.”,“year”:“2017”,“unstructured”:“M.Alzantot.,S.Chakraborty,and M.B.Srivastava”。Sensegen:用于合成传感器数据生成的深度学习架构。CoRR,abs \/1701.088862017年。M.Alzantot、S.Chakraborty和M.B.Srivastava。Sensegen:合成传感器数据生成的深度学习架构。CoRR,abs\/1701.08886,2017.“},{“key”:“e_1_2_1_12_1”,“volume-title”:“训练生成性对抗网络的原则方法。CoRR。博图。面向生成性对抗网络训练的原则方法。CoRR,abs \/1701.048622017年。M.Arjovsky和L.Bottou。面向生成性对抗网络训练的原则方法。CoRR,abs\/1701.04862,2017。“},{“key”:“e_1_2_1_13_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1561\/220000016”},“key“:”e_1_i_14_1“,”doi-assert-by“:”publisher“使用生成对抗性网络生成多标签离散电子健康记录。CoRR,abs \/1703.06490“,“作者”:“Choi E.”,“年份”:“2017年”,“非结构化”:“E.Choi,S.Biswal,B.Malin,J.Duke,W.F.Stewart,and J.Sun。使用生成性对抗网络生成多标签离散电子健康记录。CoRR,abs \/1703.064902017年。E.Choi、S.Biswal、B.Malin、J.Duke、W.F.Stewart和J.Sun。使用生成性对抗网络生成多标签离散电子健康记录。CoRR,abs \/1703.06490,2017.“},{“key”:“e_1_2_1_16_1”,“首页”:“286”,“volume-title”:“第二届医疗保健机器学习会议论文集”,“作者”:“Choi e.”,“年份”:“2017”,“非结构化”:“e.Choi,S.Biswal,B.Malin,J.Duke,W.F.Stewart,and J。太阳。使用生成性对抗网络生成多标签离散患者记录。编辑F.Doshi-Velez、J.Fackler、D.Kale、R.Ranganath、B.Wallace和J.Wiens,《第二届医疗保健机器学习会议论文集》,第286-305页,2017年。E.Choi、S.Biswal、B.Malin、J.Duke、W.F.Stewart和J.Sun。使用生成性对抗网络生成多标签离散患者记录。F.Doshi-Velez、J.Fackler、D.Kale、R.Ranganath、B.Wallace和J.Wiens编辑,《第二届医疗保健机器学习会议论文集》,第286-305页,2017年10.1007\/978-0-387-70992-5_3“},{“key”:“e_1_2_1_19_1”,“首页”:“2672”,“volume-title”:“神经信息处理系统的进展”,“author”:“Goodfellow I”,“year”:“2014”,“unstructured”:“I.Goodfelow,J.Pouget-Abadie,M.Mirza,B.Xu,D.Warde-Farley,S.Ozair,A.Courville,and Y。本吉奥。生成性对抗网络。《神经信息处理系统的进展》,第2672-2680页,2014年。I.Goodfellow、J.Pouget-Abadie、M.Mirza、B.Xu、D.Warde-Farley、S.Ozair、A.Courville和Y.Bengio。生成性对抗网络。《神经信息处理系统进展》,第2672-2680页,2014年。塞格迪。批量规范化:通过减少内部协变量偏移来加速深层网络培训。《第32届机器学习国际会议论文集》,第448-4562015页。S.Ioffe和C.Szegedy。批量规范化:通过减少内部协变量偏移来加速深层网络培训。《第32届国际机器学习会议论文集》,第448-4562015页。“},{“key”:“e_1_2_1_21_1”,“volume-title”:“为了提高质量、稳定性和变异性,组织的逐步增长。CoRR,abs \/1710.10196”,“author”:“Karras T.”,《年份》:“2017”,“非结构化”:“T.Karras,T.Aila,S.Laine,and J。莱赫蒂宁。羊毛衫的渐进式生长,以提高质量、稳定性和变异性。CoRR,abs \/1710.101962017年。T.Karras、T.Aila、S.Laine和J.Lehtinen。逐步生长甘草,以提高质量、稳定性和变异性。CoRR,abs \/1710.101962017。“},{“key”:“e_1_2_1_22_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1109\/ICDE.2007.367856”},“key“:”e_1_i_1_23_1“,”volume-title“:”ICML音频、语音和语言处理深度学习研讨会“,”作者“:”Maas A.L.“,“year”:“2013”,“unstructured”:“A.L.Maas,A.Y.Hannun,and A.Y。Ng.(女)。整流器非线性改善了神经网络声学模型。2013年,ICML音频、语音和语言处理深度学习研讨会。A.L.Maas、A.Y.Hannun和A.Y.Ng。整流器非线性改进了神经网络声学模型。在2013年ICML音频、语音和语言处理深度学习研讨会上。我“:”10.1145\/2020408.2020487“},{“key”:“e_1_1_27_1”,“doi-asserted-by”:“publisher”,”doi“:”10.5555\/31044322.3104425“},{”key“:”e_1_i_1_28_1“,”doi-assert-by“:”publisher“,“doi”:“10.5555\/3305890.3305954”},“key“:”e_2_1_29_1“:“e_1_2_1_30_1”,“卷时间”:“深度卷积生成对抗性网络的无监督表示学习。CoRR,abs\/15101106434”,“作者”:“Radford A.”,“年份”:“2015”,“非结构化”:“A.Radford,L.Metz和S.Chintala。深度卷积生成对抗性网络的无监督表示学习。CoRR,abs\/151011064342015.A。Radford、L.Metz和S.Chintala。深度卷积生成对抗网络的无监督表示学习。CoRR,abs\/1511.06434,2015.“},{”key“:”e_1_2_1_31_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1162\/089976604773135104”},“key”:“e_1_i_1_32_1”,“volume-title”:“IEEE安全与隐私研究研讨会论文集”,“author”:“Samarati P.”,“year”:“1998”,“unstructured”:“P.Samariti and L。斯威尼。披露信息时保护隐私:k-匿名及其通过泛化和抑制的实施。1998年IEEE安全与隐私研究研讨会论文集。P.Samarati和L.Sweeney。披露信息时保护隐私:k-匿名及其通过泛化和抑制的实施。在1998年IEEE安全与隐私研究研讨会论文集中用于深度学习的分布式随机优化。CoRR,abs \/1605.02216“,“作者”:“Zhang S.”,“年份”:“2016年”,“非结构化”:“S.Zhang。用于深度学习的分布式随机优化。CoRR,abs \/1605.02216,2016年。S.Zhang。用于深度学习的分布式随机优化。CoRR,abs\/1605.02216,2016.“}],“container-title”:[“VLDB捐赠会议记录”],“原始标题”:[],“language”:“en”,“link”:[{“URL”:“https:\/\/dl.acm.org\/doi\/pdf\/10.14778\/3231751.3231757”,“content-type”:“unspecified”,“内容-版本”:“vor”,“intended-application”:“相似性检查”},“存放”:{“日期-部件”“:[2022,12,28]],”date-time“:”2022-12-28T10:40:56Z“,”timestamp“:1672224056000},”score“:1,”resource“:{主要”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.14778\/3231751.3231757”}},“副标题”:[],“短标题”:[],“已发布”:{“date-parts”:[[2018,6]]},‘references-count’:35,‘日志发布’:{‘发布’:“10”,“published-print“:{“date-parts”:[[2018,6]]}},“alternative-id”:[“10.14778\/3231751.3231757“],“URL”:“http://\/dx.doi.org\/10.14778\/23231751.3231756”,“关系”:{},“ISSN”:[“2150-8097”],“ISSN-type”:[{“value”:“2150-9097”,“type”:“print”}],“主题”:[],“发布”:{“日期-部分”:[[2018,6]]}}}}