Generate Your Counterfactuals: Towards Controlled Counterfactual Generation for Text

Nishtha Madaan; Inkit Padhi; Naveen Panwar; Diptikalyan Saha

doi:10.1609/aaai.v35i15.17594

作者

尼什塔·马丹 IBM研究人工智能
Inkit Padhi公司 IBM研究人工智能
纳文·潘瓦尔 IBM研究人工智能
迪普蒂卡利安·萨哈 IBM研究人工智能

DOI（操作界面）：

https://doi.org/10.1609/aaai.v35i15.17594

关键词：

伦理——偏见、公平、透明与隐私、伦理——偏见，公平，透明与隐私，文本分类与情感分析，NLP模型的解释与分析

摘要

最近，机器学习有了巨大的发展，这使得ML系统在教育评估、信用风险、医疗、就业、刑事司法等领域得到了更大的应用。ML和NLP系统的可信性是一个关键方面，需要保证他们做出的决策是公平和稳健的。与此相一致，我们提出了一个新的框架GYC，以生成一组详尽的反事实文本，这对于测试这些ML系统至关重要。我们的主要贡献包括：a）我们引入了GYC，这是一个生成反事实样本的框架，使得生成是合理的、多样的、面向目标的和有效的；b）我们生成了反事实样本，可以将生成指向相应的\texttt{condition}，例如命名实体标签、语义角色标签、，或情绪。我们在不同领域的实验结果表明，GYC生成的反事实文本样本具有上述四个特性。GYC生成反事实，可以作为测试用例来评估模型和任何文本消除算法。

生成反事实：走向受控的文本反事实生成

作者

DOI（操作界面）：

关键词：

摘要

下载

出版

如何引用

问题

章节

问询处

开发人

订阅