生成反事实:走向受控的文本反事实生成

作者

  • 尼什塔·马丹 IBM研究人工智能
  • Inkit Padhi公司 IBM研究人工智能
  • 纳文·潘瓦尔 IBM研究人工智能
  • 迪普蒂卡利安·萨哈 IBM研究人工智能

DOI(操作界面):

https://doi.org/10.1609/aaai.v35i15.17594

关键词:

伦理——偏见、公平、透明与隐私、伦理——偏见,公平,透明与隐私,文本分类与情感分析,NLP模型的解释与分析

摘要

最近,机器学习有了巨大的发展,这使得ML系统在教育评估、信用风险、医疗、就业、刑事司法等领域得到了更大的应用。ML和NLP系统的可信性是一个关键方面,需要保证他们做出的决策是公平和稳健的。与此相一致,我们提出了一个新的框架GYC,以生成一组详尽的反事实文本,这对于测试这些ML系统至关重要。我们的主要贡献包括:a)我们引入了GYC,这是一个生成反事实样本的框架,使得生成是合理的、多样的、面向目标的和有效的;b)我们生成了反事实样本,可以将生成指向相应的\texttt{condition},例如命名实体标签、语义角色标签、,或情绪。我们在不同领域的实验结果表明,GYC生成的反事实文本样本具有上述四个特性。GYC生成反事实,可以作为测试用例来评估模型和任何文本消除算法。

下载

出版

2021-05-18

如何引用

Madaan,N.、Padhi,I.、Panwar,N.和Saha,D.(2021年)。生成反事实:面向受控的文本反事实生成。AAAI人工智能会议记录,35(15), 13516-13524. https://doi.org/10.1609/aaai.v35i15.17594

问题

章节

AAAI语音和自然语言处理技术方向II