×

保留分位数的公平数据调整。 (英语) Zbl 07306921号

摘要:分类和回归的公平性最近受到了广泛关注,并提出了各种部分不相容的标准。公平性标准可以对给定的分类器强制执行,或者,可以对数据进行调整,以确保在数据上训练的每个分类器都符合所需的公平性标准。我们提出了一种基于因果结构方程模型中分位数保存的实用数据调整方法。数据改编基于数据的假定反事实模型。虽然反事实模型本身无法通过实验进行验证,但我们表明,即使反事实模型被错误指定,某些人口公平观念仍然得到保证。满足的观测非因果公平概念(如人口均等、分离或充分性)的性质取决于潜在因果模型的结构和解决变量的选择。我们描述了基于随机森林的拟议数据调整程序的实现,并演示了其在模拟和真实数据上的实际应用。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62A01型 统计学基础和哲学主题
62D20型 观察性研究的因果推断
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 阿列克·阿加瓦尔(Alekh Agarwal)、阿利娜·贝格尔齐默(Alina Beygelzimer)、米罗斯拉夫·杜德(Miroslav Dud´nand k)、约翰·朗福德(John Langford)和汉娜·瓦拉赫(Hanna Wallach)。公平分类的缩减方法。arXiv预印本arXiv:1803.024532018。
[2] Rachel KE Bellamy、Kuntal Dey、Michael Hind、Samuel C Hoffman、Stephanie Houde、Kalapriya Kannan、Pranay Lohia、Jacquelyn Martino、Sameep Mehta、Aleksandra Mojsilovic等。Ai fairence 360:用于检测、理解和缓解不必要的算法偏差的可扩展工具包。arXiv预印本arXiv:1810.019432018。
[3] Peter J Bickel、Eugene A Hammel和J William O’Connell。研究生招生中的性别偏见:来自伯克利的数据。科学,187(4175):398-4041975。
[4] 弗朗西娜·布劳(Francine D Blau)和劳伦斯·卡恩(Lawrence M Kahn)。了解性别工资差距的国际差异。《劳动经济学杂志》,21(1):106-1442003。
[5] 利奥·布雷曼(Leo Breiman)。随机森林。机器学习,45(1):5-32001·Zbl 1007.68152号
[6] 弗拉维奥·卡尔蒙(Flavio Calmon)、丹尼斯·韦(Dennis Wei)、巴努基兰·文扎穆里(Bhanukiran Vinzamuri)、卡尔蒂基安·内特桑·拉马穆尔西(Karthikeyan Natesan Ramamurthy)和库什·瓦什尼。优化预处理以防止歧视。神经信息处理系统进展,第3992-4001页,2017年。
[7] 亚历克斯·J·坎农。单调复合分位数回归神经网络的非交叉非线性回归分位数,应用于极端降雨量。随机环境研究与风险评估,32(11):3207-32252018。
[8] Guillaume Carlier、Victor Chernozhukov、Alfred Galichon等,向量分位数回归:最优运输方法。《统计年鉴》,44(3):1165-1192,2016年·Zbl 1381.62239号
[9] 西尔维娅·齐阿帕。特定路径的反事实公平。《AAAI人工智能会议论文集》,第33卷,第7801-7808页,2019年。
[10] Alexandra Chouldechova。具有不同影响的公平预测:累犯预测工具中偏见的研究。大数据,5(2):153-1632017。
[11] 萨姆·科贝特·戴维斯和莎拉·戈尔。公平的衡量与误判:公平机器学习的批判性回顾。arXiv预印本arXiv:1808.000232018。
[12] Juan A Cuesta-Albertos、L Ruschendorf和Araceli Tueroiaz。多元分布与随机过程的最佳耦合。多元分析杂志,46(2):335-3611993·Zbl 0788.60025号
[13] 理查德·达林顿(Richard B Darlington)。再看“文化公平”1.《教育测量杂志》,8(2):71-821971。
[14] 菲利普·达维德。没有反事实的因果推理。《美国统计协会杂志》,95(450):407-4242000·Zbl 0999.62003号
[15] 米歇尔·多尼尼(Michele Donini)、卢卡·奥内托(Luca Oneto)、谢·本·达维德(Shai Ben-David)、约翰·沙韦·泰勒(John S Shawe-Taylor)和马西米利亚诺·蓬蒂尔(Massimiliano Pontil)。公平约束下的经验风险最小化。《神经信息处理系统进展》,第2791-2801页,2018年。
[16] 本杰明·费什(Benjamin Fish)、杰里米·昆(Jeremy Kun)和德勒克斯(D Lelkes)。平衡公平性和准确性的基于信任的方法。2016年SIAM国际数据挖掘会议记录,第144-152页。SIAM,2016年。
[17] Moritz Hardt、Eric Price、Nati Srebro等,《监督学习中的机会均等》。《神经信息处理系统进展》,第3315-3323页,2016年。
[18] 胡莉莉和陈一玲。对劳动力市场长期公平的短期干预。2018年万维网会议记录,第1389-1398页,2018年。
[19] 费萨尔·卡米兰(Faisal Kamiran)和图恩·卡尔德斯(Toon Calders)。无差别分类的数据预处理技术。知识与信息系统,33(1):1-332012。
[20] Sampath Kannan、Aaron Roth和Juba Ziani。平权行动的下游影响。《公平、问责制和透明度会议记录》,第240-248页,2019年。
[21] 迈克尔·卡恩斯(Michael Kearns)、赛斯·内尔(Seth Neel)、亚伦·罗斯(Aaron Roth)和吴志伟(Zhiwei Steven Wu)。防止公平再分配:子群公平性的审计和学习。arXiv预印本arXiv:1711.051442017。
[22] Niki Kilbertus、Mateo Rojas Carulla、Giambattista Parascandolo、Moritz Hardt、Dominik Janzing和Bernhard Sch¨olkopf。通过因果推理避免歧视。《神经信息处理系统进展》,第656-666页,2017年。
[23] Roger Koenker.quantreg:分位数回归。r软件包5.05版。r统计计算基金会:维也纳)网址:网址://CRAN。R项目。org/package=quantreg,2013年。
[24] 马特·库斯纳(Matt J Kusner)、约书亚·洛夫特斯(Joshua Loftus)、克里斯·罗素(Chris Russell)和里卡多·席尔瓦(Ricardo Silva)。反事实公平。《神经信息处理系统进展》,第4066-4076页,2017年。
[25] 杰夫·拉尔森(Jeff Larson)、苏里亚·马图(Surya Mattu)、劳伦·基什内尔(Lauren Kirchner)和朱莉娅·安格温(Julia Angwin)。我们如何分析比较累犯算法。ProPublica(2016年5月),2016年9月。
[26] Moshe Lichman等人。Uci机器学习库。https://archive.ics.uci.edu/ml, 2013.
[27] Lydia T Liu、Sarah Dean、Esther Rolf、Max Simchowitz和Moritz Hardt。公平机器学习的延迟影响。arXiv预打印arXiv:1803.043832018。
[28] 詹姆斯·D·马利、乔森·克鲁帕、阿比吉特·达斯古普塔、凯伦·G·马利和安德烈亚斯·齐格勒。概率机器。医学信息方法,51(01):74-812012。
[29] 尼古拉·迈恩豪森。分位数回归森林。机器学习研究杂志,7(6月):983-9992006·Zbl 1222.68262号
[30] Smitha Milli、John Miller、Anca D Dragan和Moritz Hardt。战略分类的社会成本。《公平、问责制和透明度会议记录》,第230-239页,2019年。
[31] 拉齐耶·纳比和伊利亚·施皮策。对结果的公正推断。2018年第三十二届AAAI人工智能会议。
[32] Mahdi Pakdaman Naeini、Gregory Cooper和Milos Hauskrecht。使用贝叶斯binning获得校准好的概率。2015年第二十届AAAI人工智能会议。
[33] 朱迪娅·珀尔。因果推理中反事实的逻辑。《美国统计协会杂志》,95(450):428-4352000年。
[34] 朱迪娅·珀尔。因果关系。剑桥大学出版社,2009年·Zbl 1188.68291号
[35] 杰夫·普莱斯(Geoff Pleiss)、曼尼什·拉格万(Manish Raghavan)、费利克斯·吴(Felix Wu)、乔恩·克莱恩伯格(Jon Kleinberg)和基利安·温伯格(Kilian Q Weinberger)。关于公平性和校准。《神经信息处理系统进展》,第5680-5689页,2017年。
[36] 托马斯·理查森和詹姆斯·罗宾斯。单一世界干预图(swigs):对因果关系的反事实和图形方法的统一。华盛顿大学统计与社会科学中心系列。工作文件,128(30):2013,2013。
[37] 菲利波·桑坦布罗吉奥(Filippo Santambrogio)。应用数学家的最佳传输。纽约州伯克·奥斯,55:58-632015·Zbl 1401.49002号
[38] 伊利亚·施皮策。纵向中介分析的反事实图形模型与未观察到的混淆。认知科学,37(6):1011-10352013。
[39] 伊利亚·施皮策和朱迪亚·珀尔。因果层次的完整识别方法。机器学习研究杂志,9(9月):1941-19792008·Zbl 1225.68216号
[40] 金田和朱迪亚·珀尔。因果关系的一般识别条件。InAaai/iaai,第567-573页,2002年。
[41] 马文·赖特和安德烈亚斯·齐格勒。ranger:在c++和r.arXiv预印本arXiv:1508.044092015中快速实现高维数据的随机森林。
[42] 穆罕默德·比拉尔·扎法尔(Muhammad Bilal Zafar)、伊莎贝尔·瓦莱拉(Isabel Valera)、曼努埃尔·戈麦斯·罗德里格斯(Manuel Gomez Rodriguez)和克里希纳·普·古马迪(Krishna P Gummadi)。超越不同对待和不同影响的公平性:学习分类而不受不同虐待。第26届万维网国际会议论文集,第1171-1180页。国际万维网会议指导委员会,2017年。
[43] Rich Zemel、Yu Wu、Kevin Swersky、Toni Pitassi和Cynthia Dwork。学习公平陈述。2013年国际机器学习会议,第325-333页。
[44] 张俊哲(Junzhe Zhang)和埃利亚斯·巴雷因博伊姆(Elias Bareinboim)。分类中的机会均等:因果方法。神经信息处理系统进展,第3675-3685页,2018a。
[45] 张俊哲(Junzhe Zhang)和埃利亚斯·巴雷因博伊姆(Elias Bareinboim)。决策的公平性——因果解释公式。第三十二届AAAI人工智能会议,2018b。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。