×

反事实公平的对抗性学习。 (英语) 兹伯利07702684

摘要:近年来,公平已经成为机器学习研究领域的一个重要课题。特别是,反事实公平旨在建立预测模型,以确保最个别层面的公平。与其在全球范围内考虑整个人口的公平性,不如想象一个人在特定兴趣属性的变化下会是什么样子,例如不同的性别或种族。现有的方法依赖于个体的变分自动编码,使用最大平均差(MMD)惩罚来限制推断表征与其相应敏感属性的统计相关性。这使得可以模拟用于训练目标公平模型的反事实样本,目的是为任何个人的每个替代版本产生类似的结果。在这项工作中,我们建议依赖对抗性神经学习方法,该方法能够比MMD惩罚更强大的推理,并且特别适合于连续设置,其中敏感属性的值无法穷举。实验表明,无论是离散设置还是连续设置,在反事实公平性方面都有显著改善。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿德尔,T。;瓦莱拉,I。;加赫拉马尼,Z。;Weller,A.,One-network对抗性公平,AAAI’19,33,2412-2420(2019)
[2] Angwin,J.、Larson,J.,Mattu,S.和Kirchner,L.(2016)。机器偏差。ProPublica,2016年5月23日。
[3] Bellamy,R.K.,Dey,K.,Hind,M.,Hoffman,S.C.,Houde,S.,Kannan,K.、Lohia,P.,Martino,J.,Mehta,S.、Mojsilovic,A.等人(2018年)。Ai fairence 360:一个可扩展的工具包,用于检测、理解和减少不必要的算法偏差。arXiv预打印arXiv:1810.01943。
[4] Bowman,S.R.、Vilnis,L.、Vinyals,O.、Dai,A.M.、Jozefowicz,R.和Bengio,S.(2015)。从连续空间生成句子。arXiv:1511.06349。
[5] Calmon,F.P.、Wei,D.、Ramamurthy,K.N.和Varshney,K.R.(2017)。优化数据预处理以防止歧视。arXiv预打印arXiv:1704.03354。
[6] Celis,L.E.、Huang,L.、Keswani,V.和Vishnoi,N.K.(2019年)。公平约束分类:具有可证明保证的元算法。摘自:《公平、问责制和透明度会议记录》,第319-328页。
[7] Chen,J.、Kallus,N.、Mao,X.、Svacha,G.和Udell,M.(2019年)。无意识下的公平:在未观察到受保护阶级的情况下评估差异。摘自:《公平、问责制和透明度会议记录》,第339-348页。
[8] Chen,X.、Kingma,D.P.、Salimans,T.、Duan,Y.、Dhariwal,P.、Schulman,J.、Sutskever,I.和Abbeel,P.(2016)。可变有损自动编码器。arXiv预打印arXiv:1611.02731。
[9] Chiappa,S.(2019年)。特定路径的反事实公平。摘自:《AAAI人工智能会议记录》,337801-7808。
[10] Dua,D.和Graff,C.(2017年)。UCI ML存储库。http://archive.ics.uci.edu/ml。
[11] Dwork,C.、Hardt,M.、Pitassi,T.、Reingold,O.和Zemel,R.(2012)。通过意识实现公平。参见:ITCS’12,第214-226页·兹比尔1348.91230
[12] Goodfellow,I.J.、Pouget-Abadie,J.、Mirza,M.、Xu,B.、Warde-Farley,D.、Ozair,S.、Courville,A.和Bengio,Y.(2014)。生成性对抗网络,1-9 arXiv:1406.2661。
[13] Grari,V.、Ruf,B.、Lamprier,S.和Detyniecki,M.(2019年)。公平的对抗性梯度树增强。收录于:ICDM’19,第1060-1065页。
[14] Grari,V.、Ruf,B.、Lamprier,S.和Detyniecki,M.(2019年)。连续特征的公平软件神经网络最小化。arXiv:1911.04929。
[15] 格雷顿,A。;博格沃德,KM;拉什,MJ;Schölkopf,B。;Smola,A.,《内核双样本测试》,《机器学习研究杂志》,13,1,723-773(2012)·Zbl 1283.62095号
[16] Hardt,M.、Price,E.和Srebro,N.(2016年)。监督学习中的机会均等。摘自:《神经信息处理系统进展》,第3315-3323页。
[17] Hinnefeld,J.H.、Cooman,P.、Mammo,N.和Deese,R.(2018年)。在存在数据集偏差的情况下评估公平性度量。arXiv预打印arXiv:1809.09245
[18] 卡米兰,F。;Calders,T.,《无差别分类的数据预处理技术》,《知识与信息系统》,33,1,1-33(2012)·doi:10.1007/s10115-011-0463-8
[19] Kearns,M.、Neel,S.、Roth,A.和Wu,Z.S.(2017年)。防止公平的再分配:为小组公平进行审计和学习。arXiv预打印arXiv:1711.05144。
[20] Kilbertus,N.、Ball,P.J.、Kusner,M.J.、Weller,A.和Silva,R.(2020年)。反事实公平对未测量混淆的敏感性。摘自:《人工智能中的不确定性》,第616-626页。PMLR。
[21] Kim,H.、Shin,S.、Jang,J.、Song,K.、Joo,W.、Kang,W.和Moon,I.-C.(2021年)。非纠缠因果变分自动编码器的反事实公平。载:AAAI人工智能会议记录,第35卷,第8128-8136页。
[22] Kingma,D.P.和Welling,M.(2013年)。自动编码变分贝叶斯。arXiv预打印arXiv:1312.6114。
[23] Kocaoglu,M.、Snyder,C.、Dimakis,A.G.和Vishwanath,S.(2017年)。Causalgan:通过对抗训练学习因果内隐生成模型。arXiv预打印arXiv:1709.02023。
[24] Kusner,M.J.、Loftus,J.、Russell,C.和Silva,R.(2017)。反事实公平。摘自:《神经信息处理系统进展》,第4066-4076页。
[25] Louizos,C.、Shalit,U.、Mooij,J.M.、Sontag,D.、Zemel,R.和Welling,M.(2017)。深层潜在变量模型的因果推理。《神经信息处理系统进展》,第6446-6456页。
[26] Louppe,G.、Kagan,M.和Cranmer,K.(2017年)。学习以对抗性网络为中心。摘自:《神经信息处理系统进展》,第981-990页。
[27] Madras,D.、Creager,E.、Pitassi,T.和Zemel,R.(2019年)。通过因果意识实现公平:学习有偏见数据的因果潜在变量模型。摘自:《公平、问责制和透明度会议记录》,第349-358页。
[28] Makhzani,A.、Shlens,J.、Jaitly,N.和Goodfellow,I.J.(2015)。对手自动编码器。CoRR abs/1511.05644arXiv:1511.05644。
[29] Mary,J.、Calauzènes,C.和Karoui,N.E.(2019年)。公平软件学习持续属性和治疗。摘自:ICML'19,第4382-4391页。
[30] 莫罗,S。;科尔特斯,P。;Rita,P.,《预测银行电话营销成功的数据驱动方法》,《决策支持系统》,62,22-31(2014)·doi:10.1016/j.dss.2014.03.001
[31] Pearl,J.,《统计中的因果推断:概述》,《统计调查》,第396-146页(2009年)·Zbl 1300.62013年 ·doi:10.1214/09-SS057
[32] Pfohl,S.、Duan,T.、Ding,D.Y.和Shah,N.H.(2019年)。公平临床风险预测的反事实推理。arXiv预印arXiv:1907.06260。
[33] Russell,C.、Kusner,M.J.、Loftus,J.和Silva,R.(2017)。当世界发生冲突时:在公平中整合不同的反事实假设。摘自:《神经信息处理系统进展》,第6414-6423页。
[34] Shalit,U.、Johansson,F.D.和Sontag,D.(2017年)。估计个体治疗效果:泛化界限和算法。载于:ICML’17,第3076-3085页。
[35] Sönderby,C.K.,Raiko,T.,Maalöe,L.,Sönderby,S.K.,&Winther,O.(2016)。梯形变分自动编码器。收录于:NIPS’16,第3738-3746页。
[36] SD团队;Rstan团队:与stan的r接口,r包版本,2,1,522(2016)
[37] 法国精算师协会:2015年定价游戏。https://freaknomometrics.axuresses.org/20191。在线;2019年8月14日(2015年)访问。
[38] 美国人口普查局(2019)。美国人口普查人口数据。https://data.comsus.gov/cdsci/。在线;2019年4月3日访问。
[39] Wadsworth,C.、Vera,F.和Piech,C.(2018年)。通过对抗学习实现公平:累犯预测的应用。arXiv:1807.00199。
[40] Xu,D.,Wu,Y.,Yuan,S.,Zhang,L.,&Wu,X.(2019)。通过生成性对抗网络实现因果公平。摘自:第二十八届国际人工智能联合会议记录。
[41] Zafar,M.B.、Valera,I.、Rodriguez,M.G.和Gummadi,K.P.(2015)。公平约束:公平分类的机制。arXiv预印arXiv:1507.05259·Zbl 1489.68263号
[42] Zhang,B.H.、Lemoine,B.和Mitchell,M.(2018)。通过对抗性学习减少不必要的偏见。收录于:AAAI’18,第335-340页。
[43] Zhao,S.、Song,J.和Ermon,S.(2017)。信息最大化变分自动编码器。arXiv预打印arXiv:1706.02262。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。