平衡的数据集还不够:估计和缓解深层图像表征中的性别偏见

@第{王2018BalancedDA,title={平衡的数据集还不够:估计和缓解深层图像表征中的性别偏见},author={王天禄(Tianlu Wang)、赵洁玉(Jieyu Zhao)、马克·亚茨卡(Mark Yatskar)、张开伟(Kai-Wei Chang)和维森特·奥多内兹(Vicente Ordonez)},journal={2019 IEEE/CVF国际计算机视觉会议(ICCV)},年份={2018年},页码={5309-5318},网址={https://api.semanticscholar.org/CorpusID:195847929}}
结果表明,经过训练的模型显著放大了目标标签与性别的关联,超出了人们对有偏见的数据集的预期,并且采用对抗性方法从深度神经网络的中间表示中删除与受保护变量相对应的不需要的特征。

本文图表

具有统计独立性的表征学习以缓解偏差

提出了一种基于对抗训练的模型,该模型具有两个相互竞争的目标,以学习对任务具有最大辨别力和对受保护(偏差)变量具有最小统计平均依赖性的特征。

使用GAN进行匹配样本选择,以减少属性混淆

这项工作提出了一种匹配方法,该方法从完整数据集中选择一个子集图像,并在多个开源面部识别分类器的性别偏见背景下演示了其工作,发现通过匹配消除关键混淆因素后,偏见仍然存在。

使用现有偏置样式生成零快照种族平衡数据集GAN2

这项工作提出了一种方法,该方法利用有偏见的生成模型StyleGAN2来创建合成个体的人口统计学差异图像,以提高人脸识别模型的性能,并最小化在实际数据集上训练的模型中可能存在的偏见。

使用von Mises-Fisher混合模型缓解人脸识别中的性别偏见

这项工作调查了深度人脸识别网络的性别偏见,并引入了两个新的指标,$\mathrm{BFAR}$和$\mathrm{BFRR}$,这两个指标更好地反映了与公平性指标相关的人脸识别系统的固有部署需求。

视觉识别中的公平性:消除偏见的有效策略

一个用于研究偏差缓解的简单但令人惊讶的有效视觉识别基准,以及一个简单但同样有效的替代Zhao等人的推断时间减少偏差放大方法的方法,并设计一种优于所有其他方法的领域相关训练技术。

平衡偏见,保护野生平衡面孔的隐私

这项工作提出了一种新的领域自适应学习方案,该方案使用从最先进的神经网络中提取的面部特征来缓解性能不平衡,并证明子组分类器无法再从使用该方案投影的特征中学习。

基于潜在空间去偏倚的公平属性分类

这项工作使用GAN生成逼真的图像,并在潜在空间中对这些图像进行扰动,以生成针对每个受保护属性平衡的训练数据,并且实证证明,在增强数据集上训练的目标分类器显示出许多定量和定性的优点。

视觉数据集中的性别人工制品

据称,从此类数据集中删除这些伪影的尝试在很大程度上是不可行的,因为某些删除的伪影可能是目标识别下游任务所必需的,研究人员和从业者有责任意识到数据集中图像的分布具有高度的性别差异,并不断发展公平软件方法对这些跨组的分布变化具有鲁棒性。

减轻图像分类中的偏差-对不同数据进行预训练以改进泛化

本文对未进行预处理的模型和在ImageNet数据集上进行预处理后的模型进行了比较分析,发现预处理后模型的偏差较低,精度也较高。

预训练人脸识别学习表征的信息论偏差评估

这项工作提出了一个信息理论的、独立的偏见评估指标,以从经过预处理的面部识别系统的学习表征中识别对受保护的人口统计学属性的偏见程度,并建立了一个基准指标。
...

文本数据中人口统计属性的对抗性删除

研究表明,作者的人口统计信息编码在基于文本的神经分类器学习的中间表示中,并可以从中恢复出来,这意味着基于文本数据训练的分类器的决策对人口统计属性并不是不可知的和可能的条件。

ConvNets和ImageNet超越准确性:解释、偏差检测、反例和模型批评

结果表明,从最终用户的角度来看,解释可以减轻错误分类对手示例的影响,并引入了一种新的工具来揭示模型学习到的不良偏见。

男性也喜欢购物:利用公司层面的约束减少性别偏见放大

本工作提出注入实体级约束来校准现有的结构化预测模型,并设计一种基于拉格朗日松弛的集体推理算法,以减少多标签对象分类和视觉语义角色标记中的偏差放大幅度。

利用种族和性别多样性改进微笑检测

这项研究证明了建模种族和性别对于改进人脸属性检测任务的实用性,使用了双重转移学习框架,该框架允许对目标数据集中的个人进行隐私保护。

消除数据集偏差的损害

总的来说,这项工作发现,在组合多个数据集时明确说明偏差是有益的,并提出了一个在训练期间直接利用数据集偏差的判别框架。

通过对抗性学习缓解不必要的偏见

这项工作提出了一个框架,通过为感兴趣的群体包括一个变量,同时学习一个预测者和一个对手,从而减少对人口统计学群体的偏见,从而实现准确的预测,减少对Z的刻板印象。

深入了解数据集偏差

本文提出在面对数据集偏差问题时验证DeCAF特征的潜力,并对现有数据集之间的差异进行了一系列分析,并验证了现有去噪方法在不同表示下的性能。

女子滑雪板:克服字幕模特的偏见

引入了一种新的均衡器模型,该模型确保了当性别证据被遮挡在场景中时,性别概率相等;当存在性别证据时,可以进行自信的预测;与之前的工作相比,当与人描述图像并提及他们的性别时,错误率更低,更接近句子的基本真实率,包括女性被判刑,包括男性。

通过对抗训练实现隐私保护视觉识别:一项初步研究

本文旨在通过构建一个独特的对抗性训练框架来改进隐私保护视觉识别,这是智能相机应用中日益需要的功能

通过对抗特征学习实现可控不变性

本文表明,该框架引入了一种不变量表示,并通过在三个基准任务上的改进表现出更好的泛化能力。