×

具有多个受保护属性的公平(k)聚类算法。 (英语) Zbl 1525.68198号

摘要:我们研究了基于公平中心的聚类问题。在一篇有影响力的论文中,F.切里切蒂等[“通过小集市进行公平聚类”,预印本,arXiv:1802.05733号]考虑一下如何找到一个好的聚类,比如女性和男性,这样每个聚类都包含相同数量的女性和男性。对于大多数基于中心的聚类目标,例如(k)-中值、(k)-means和(k)-center,他们能够获得该问题的常数因子近似值。尽管有相当大的兴趣将这一问题扩大到多重受保护属性(例如,有或没有公民身份的男女),但迄今为止,除了特殊情况外,这些问题的恒定因子近似值仍然难以确定。我们通过对一系列基于中心的聚类目标给出第一个常数因子近似值,从而肯定地解决了这个问题。

MSC公司:

68周25 近似算法
62H30型 分类和区分;聚类分析(统计方面)
90B80型 离散位置和分配
90C27型 组合优化

关键词:

群集算法公平性近似
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾哈迈迪安,S。;埃帕斯托,A。;Knittel,M。;库马尔,R。;马赫迪安,M。;莫斯利,B。;Pham,P。;瓦西维茨基,S。;Wang,Y.,Fair hierarchical clustering,(Larochelle,H.;Ranzato,M.;Hadsell,R.;Balcan,M.),《神经信息处理系统进展33:2020年神经信息处理体系年会》。神经信息处理系统进展33:2020年神经信息处理体系年会,NeurIPS 2020年,2020年12月6日至12日(虚拟)(2020年)),6-12
[2] 艾哈迈迪安,S。;埃帕斯托,A。;库马尔,R。;Mahdian,M.,Fair correlation clustering,(Chiappa,S.;Calandra,R.,第23届国际人工智能与统计会议。第23届人工智能与统计学国际会议,AISTATS 2020,意大利西西里岛巴勒莫,2020年8月26-28日(在线)。第23届国际人工智能与统计会议。第23届国际人工智能与统计会议,AISTATS 2020,意大利西西里岛巴勒莫,2020年8月26-28日(在线),机器学习研究论文集,PMLR,第108卷(2020)),4195-4205
[3] Anagnostopoulos,A。;Becchetti,L。;Fazzone,A。;Menghini,C。;Schwiegelshohn,C.,谱松弛和公平稠密子图,(第29届ACM信息和知识管理国际会议。第29届AC M信息与知识管理国际大会,CIKM’20,虚拟事件,爱尔兰,2020年10月19-23日(2020)),35-44
[4] Backurs,A。;Indyk,P。;奥纳克,K。;Schieber,B。;瓦基利安,A。;Wagner,T.,可扩展公平聚类,(第36届机器学习国际会议论文集。第36届国际机器学习会议论文集,2019年6月9日至15日(2019年),美国加利福尼亚州长滩),405-413
[5] Bandyapadhyay,S。;福明,F.V。;Simonov,K.,《度量空间和欧几里德空间中公平聚类的核心集及其应用》,(Bansal,N.;Merelli,E.;Worrell,J.,第48届自动控制、语言和编程国际学术讨论会,ICALP 2021,苏格兰格拉斯哥(虚拟会议),7月12-16日,2021第48届国际自动化、语言和编程学术讨论会。第48届国际自动化、语言和编程学术讨论会,ICALP 2021,苏格兰格拉斯哥(虚拟会议),2021年7月12日至16日,LIPIcs,第198卷(2021),达格斯图尔-莱布尼茨-泽特鲁姆宫,23:1-23:15
[6] 贝拉,S.K。;查克拉巴蒂,D。;弗洛雷斯,N。;Negahbani,M.,Fair algorithms for clustering(神经信息处理系统进展32:2019年神经信息处理体系年会)。神经信息处理系统进展32:2019年神经信息处理体系年会,2019年NeurIPS,加拿大不列颠哥伦比亚省温哥华,2019(2019)年12月8日至14日),4955-4966
[7] I.O.Bercea。;格罗·M·。;库勒,S。;库马尔,A。;Rösner,C。;施密特,D.R。;Schmidt,M.,《关于基本公平聚类的代价》,(近似、随机化和组合优化。算法和技术。近似、随机和组合优化,算法和技术,APPROX/RANDOM 2019,2019年9月20日至22日(2019),马萨诸塞理工学院:马萨诸塞州坎布里奇市麻省理工学院,美国),18:1-18:22·Zbl 07650085号
[8] Chierichetti,F。;库马尔,R。;Lattanzi,S。;Vassilvitskii,S.,《通过fairlets进行公平聚类》(神经信息处理系统(NIPS)第30届年会论文集(2017)),5036-5044
[9] 科恩·阿达德,V。;索尔皮克,D。;Schwiegelshohn,C.,新的聚类核心集框架,(第53届ACM SIGACT年度计算理论研讨会·Zbl 07765162号
[10] Kleindessner,M。;萨马迪,S。;阿瓦西,P。;Morgenstern,J.,《公平约束下谱聚类的保证》,(第36届国际机器学习会议论文集。第36届机器学习国际会议论文集,2019年6月9日至15日,美国加利福尼亚长滩,2019),3458-3467
[11] 库恩,H.W。;Yaw,B.,分配问题的匈牙利方法,Nav。Res.Logist公司。Q.,83-97(1955)·Zbl 0143.41905号
[12] 罗斯纳,C。;Schmidt,M.,《带约束的隐私保护集群》,(第45届国际自动化、语言和编程学术讨论会,第45届自动化、语言与编程国际学术讨论会),2018年7月9日至13日,捷克共和国布拉格,2018(2018),96:1-96:14·Zbl 1499.90117号
[13] 施密特,M。;Schwiegelshohn,C。;Sohler,C.,公平k-means的公平核心集和流算法,(近似和在线算法-第17届国际研讨会。近似和在线运算-第17次国际研讨会,2019年WAOA,德国慕尼黑,2019月12日至13日,修订论文集(2019)),232-251·兹比尔07238570
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。