×

通过简单的脊线惩罚实现公平。 (英语) Zbl 1497.62014年

摘要:在本文中,我们提出了一个通用框架,用于根据用户定义的公平程度估计回归模型。我们将公平性作为一个模型选择步骤,在该步骤中我们选择脊惩罚的值来控制敏感属性的效果。然后,我们根据选择的惩罚值估计模型的参数。我们的建议在数学上很简单,其解决方案部分采用封闭形式,并产生回归系数的估计值,这些估计值直观地解释为公平水平的函数。此外,它很容易扩展到广义线性模型、核化回归模型和其他惩罚,并且它可以适应公平的多种定义。我们将我们的方法与以下回归模型进行了比较小宫山一郎等[“具有公平约束的回归的非凸优化”,Proc.Mach.Learn.Res.(PMLR)80,2737–2746(2018)],其实现了一个可证明最优的线性回归模型,并使用来自M.B.扎法尔等[J.Mach.Learn.Res.20,第75号论文,42页(2019年;Zbl 1489.68263号)]. 我们在六个不同的数据集上对这些方法进行了实证评估,我们发现我们的建议在同等公平水平下提供了更好的拟合优度和更好的预测准确性。此外,我们在[Komiyama等人,loc.cit.]中强调了原始实验评估中的偏差来源。

MSC公司:

62-08 统计问题的计算方法
62J07型 岭回归;收缩估计器(拉索)
62J05型 线性回归;混合模型
62J12型 广义线性模型(逻辑模型)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agarwal,A.、Beygelzimer,A.、Dudik,M.、Langford,J.、Wallach,H.:公平分类的简化方法。收录:机器学习研究论文集。第35届国际机器学习会议(ICML),第80卷,第60-69页(2018)
[2] Agarwal,A.,Dudik,M.,Wu,Z.S.:公平回归:定量定义和基于约简的算法。收录:机器学习研究论文集。第36届国际机器学习会议(ICML),第97卷,第120-129页(2019年)
[3] Berk,R.、Heidari,H.、Jabbari,S.、Joseph,M.、Kearns,M.,Morgenstern,J.、Neel,S.和Roth,A.:公平回归的凸框架。In:机器学习中的公平、责任和透明度(FATML)(2017)
[4] 伯克,R。;Heidari,H。;贾巴里,S。;卡恩斯,M。;Roth,A.,《刑事司法风险评估中的公平:最新技术》,社会学。方法研究,50,1,3-44(2021)·doi:10.1177/0049124118782533
[5] Bird,S.、Dudík,M.、Edgar,R.、Horn,B.、Lutz,R.,Milan,V.、Sameki,M.,Wallach,H.、Walker,k.:公平学习:评估和改善人工智能公平性的工具包。技术代表MSR-TR-2020-32,微软(2020)
[6] Calders,T.、Karim,A.、Kamiran,F.、Ali,W.、Zhang,X.:线性回归中的控制属性效应。摘自:第13届IEEE数据挖掘国际会议记录,第71-80页(2013)
[7] Cath,C。;Wachter,S。;米特尔斯塔德,B。;Taddeo,M。;Floridi,L.,《人工智能与“良好社会”:美国、欧盟和英国的方法》,科学。《工程伦理学》,24,2,505-528(2018)
[8] Chora-shi,M.、Pawlicki,M.,Puchalski,D.、Kozik,R.:机器学习——结果并不是唯一重要的事情!安全性、可解释性和公平性如何?摘自:《国际计算科学会议论文集》,第615-628页(2020年)
[9] Chzhen,E。;丹尼斯,C。;希比里,M。;Oneto,L。;Pontil,M.,《通过插入式估计器的公平回归和统计保证的重新校准》,《高级神经信息处理》。系统。,33, 19137-19148 (2020)
[10] Cox,DR,回归模型和生命表,J.R.Stat.Soc.Ser。B、 34、2、187-220(1972)·Zbl 0243.62041号
[11] Del Barrio,E.,Gordaliza,P.,Loubes,J.M.:机器学习中公平性的数学框架综述。arXiv:2005.13755(2020)
[12] Dua,D.,Graff,C.:UCI机器学习库。http://archive.ics.uci.edu/ml (2017)
[13] 欧洲委员会:关于制定人工智能协调规则的法规提案(2021年)
[14] 弗伦德,Y。;Schapire,RE,《在线学习的决策理论推广及其在助推中的应用》,J.Compute。系统。科学。,55, 1, 119-139 (1997) ·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[15] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,J.Stat.Soft。,33,1,1-22(2010年)·doi:10.18637/jss.v033.i01
[16] Fukuchi,K.,Sakuma,J.,Kamishima,T.:基于模型的中立性预测。在:数据库中的机器学习和知识发现欧洲联合会议论文集(ECML PKDD),第499-514页。施普林格(2013)
[17] Fuster,A.,Goldsmith-Pinkham,P.,Ramadorai,T.,Walther,A.:可预测的不平等?机器学习对信贷市场的影响。https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3072038 (2020)
[18] Grgić-Hlaća,N.,Zafar,M.B.,Gummadi,K.P.,Weller,a.:超越算法决策中的分配公平:程序公平学习的特征选择。附:第32届AAAI人工智能会议(2018年)会议记录
[19] 哈斯蒂,T。;蒂布希拉尼,R。;Friedman,J.,《统计学习的要素:数据挖掘、推断和预测》(2009),施普林格出版社·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[20] 霍尔,AE;Kennard,RW,Ridge回归:非正交问题的有偏估计,技术计量学,12,1,55-67(1970)·Zbl 0202.17205号 ·网址:10.1080/00401706.1970.10488634
[21] Kanagawa,M.,Hennig,P.,Sejdinovic,D.,Sriperumbudur,B.K.:高斯过程和核方法:联系和等价性综述。arXiv:1807.02582(2018)
[22] Kazemi,E.,Zadimoghaddam,M.,Karbasi,A.:可扩展删除-半透明子模块最大化:具有隐私和公平约束的数据汇总。收录:机器学习研究论文集。第35届国际机器学习会议(ICML),第80卷,第2544-2553页(2018)
[23] Khodadian,S.,Nafea,M.,Ghassami,A.,Kiyavash,N.:公平软件特征选择的信息理论度量。arXiv:2106.00772(2021)
[24] Kivinen,J。;Warmuth,MK,线性预测因子指数梯度与梯度下降,Inform。计算。,132, 1, 1-63 (1997) ·Zbl 0872.68158号 ·doi:10.1006/inco.1996.2612
[25] Komiyama,J.、Takeda,A.、Honda,J.和Shimao,H.:公平约束回归的非凸优化。收录:机器学习研究论文集。第35届国际机器学习会议(ICML),第80卷,第2737-2746页(2018)
[26] Lipovetsky,S.,二参数岭回归及其收敛到最终成对模型,数学。计算。型号1。,44, 3-4, 204-318 (2006) ·Zbl 1133.62340号
[27] Mary,J.,Calauzenes,C.,El Karoui,N.:公平软件学习持续属性和治疗。收录:机器学习研究论文集。第36届国际机器学习会议(ICML),第97卷,第4382-4391页(2019年)
[28] McCullagh,P。;Nelder,JA,广义线性模型(1989),博卡拉顿:CRC出版社,博卡拉顿·Zbl 0588.62104号 ·doi:10.1007/9781-4899-3242-6
[29] 北Mehrabi。;Morstatter,F。;北卡罗来纳州萨克森纳。;Lerman,K。;Galstyan,A.,《机器学习中的偏见和公平调查》,ACM Compute。调查。,54, 6, 115 (2021) ·数字对象标识代码:10.1145/3457607
[30] Mood,C.,Logistic回归:为什么我们不能做我们认为可以做的事情,以及我们可以做什么,欧洲社会学。修订版,26,167-82(2010)·doi:10.1093/esr/jcp006
[31] Nagelkerke,NJD,关于决定系数的一般定义的注释,生物统计学,78,3,691-692(1991)·Zbl 0741.62069号 ·doi:10.1093/biomet/78.3.691
[32] Pérez-Suay,A.,Laparra,V.,Mateo-GarcíA,G.,Muñoz-Marí,J.,Gómez-Chova,L.,Camps-Valls,G.:公平内核学习。摘自:《欧洲数据库机器学习和知识发现联合会议论文集》(ECML PKDD),第339-355页。施普林格(2017)
[33] Pessach,D.,Shmueli,E.:算法公平。arXiv:2001.09784(2020)
[34] Raghavan,M.、Barocas,S.、Kleinberg,J.、Levy,K.:减轻算法雇佣中的偏见:评估索赔和实践。摘自:《第三届公平、问责制和透明度会议记录》,第469-481页(2020年)
[35] 罗素,C。;MJ库斯纳;Loftus,JR;Silva,R.,《当世界碰撞:在公平中整合不同的国家假设》,高级神经信息处理。系统。,30, 6414-6423 (2017)
[36] Saunders,C.,Gammerman,A.,Vovk,V.:双变量岭回归学习算法。摘自:《第十五届国际机器学习会议(ICML)论文集》,第515-521页。摩根考夫曼(1998)
[37] Scutari,M.:fairml:机器学习中的公平模型。R包版本0.7(2021)
[38] 西蒙,N。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降实现Cox比例风险模型的正则化路径,J.Stat.Softw。,39, 5, 1-13 (2011) ·doi:10.18637/jss.v039.i05
[39] Steinberg,D.,Reid,A.,O'Callaghan,S.,Lattimore,F.,McCalman,L.,Caetano,T.:通过有效的相互信息近似实现快速公平回归。arXiv:2002.06200(2020)
[40] Tibshirani,R.,通过套索进行回归收缩和选择,J.R.Stat.Soc.Ser。B、 58、1、267-288(1996)·Zbl 0850.62538号
[41] Tjur,T.,《逻辑回归模型中的决定系数——一项新建议:歧视系数》,《美国统计》,63,4,366-372(2009)·兹比尔1182.62149 ·doi:10.1198/tast.2009.08210
[42] van Wieringen,W.N.:岭回归讲义。arXiv:1509.09169(2018)
[43] Wachter,S。;米特尔斯塔特,B。;Russell,C.,《机器学习中的偏见保留:欧盟非歧视法下公平指标的合法性》,弗吉尼亚州法律评论,123,735(2021)
[44] Woodworth,B.,Gunasekar,S.,Ohannessian,M.I.,Srebro,N.:学习非歧视性预测因子。收录于:《机器学习研究院刊》。学习理论会议(COLT),第65卷,第1920-1953页(2017)
[45] 山田,S。;武田,A.,非凸二次优化的逐次拉格朗日松弛算法,J.Glob。最佳。,71, 2, 313-319 (2018) ·Zbl 1402.90112号 ·doi:10.1007/s10898-018-0617-2
[46] Zafar,M.B.,Valera,I.,Gomez-Rodriguez,M.,Gummadi,K.P.:公平约束:公平分类的灵活方法。J.马赫。学习。第20号决议,1-42(2019年)·Zbl 1489.68263号
[47] 张,Y。;杜奇,J。;Wainwright,M.,《分治核岭回归:具有最小最大最优速率的分布式算法》,J.Mach。学习。研究,16,3299-3340(2015)·Zbl 1351.62142号
[48] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J.R.Stat.Soc.Ser。B、 67、2、301-320(2005)·Zbl 1069.62054号 ·文件编号:10.1111/j.1467-9868.2005.005.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。