@正在进行{fabbri-etal-2022-qafacteval,title=“{QAF}act{E}val:改进的基于{QA}的摘要事实一致性评估”,author=“Fabbri、Alexander和Wu、Chien Sheng和刘文浩和熊才明”,editor=“Carpuat、Marine和德马内夫、玛丽·凯瑟琳和Meza Ruiz,Ivan Vladimir“,booktitle=“计算语言学协会北美分会2022年会议记录:人类语言技术”,月=七月,年=“2022”,address=“美国西雅图”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.naacl-main.187”,doi=“10.18653/v1/2022.naacl-main.187”,pages=“2587--2601”,abstract=“事实一致性是文本摘要模型在实际应用中的一个基本质量。评估这一维度的现有工作可以大致分为两类研究,基于蕴涵的研究和问答(QA)研究-基于度量的方法和不同的实验设置通常会导致关于哪种范式表现最佳的对比结论。在这项工作中,我们对隐含和基于QA的度量进行了广泛的比较,证明了仔细选择基于QA度量的组件,特别是问题生成和可回答性分类,对性能至关重要。基于这些见解,我们提出了一个优化的度量,我们称之为QAFactEval,它在SummaC事实一致性基准上比以前基于QA的度量平均提高了14{\%},也优于性能最好的基于隐含的度量。此外,我们发现基于QA和基于隐含的度量可以提供互补信号,并组合成单个度量以进一步提高性能。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“fabbri-etal-2022-qafacteval”><标题信息>QAFactEval:改进的基于QA的摘要事实一致性评估</titleInfo><name type=“personal”>亚历山大Fabbri(法布里)<角色>作者</角色></name><name type=“personal”>钱胜<namePart type=“given”>吴<角色>作者</角色></name><name type=“personal”>文浩<namePart type=“family”>刘</namePart><角色>作者</角色></name><name type=“personal”>蔡明熊<角色>作者</角色></name><originInfo><日期发布>2022-07</日期发布></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会北美分会2022年会议记录:人类语言技术</titleInfo><name type=“personal”><namePart type=“given”>海洋</namePart>卡普阿特<角色>编辑器</角色></name><name type=“personal”>玛丽·凯瑟琳马内夫<角色>编辑器</角色></name><name type=“personal”>伊凡弗拉基米尔梅扎·鲁伊斯<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>美国西雅图</地点></originInfo>会议出版物</relatedItem>事实一致性是文本摘要模型在实际环境中的一个基本质量。评估这一维度的现有工作大致可分为两类研究,基于内涵和基于问题回答(QA)的指标,不同的实验设置通常会导致对哪种范式表现最佳的对比结论。在这项工作中,我们对隐含和基于QA的度量进行了广泛的比较,证明了仔细选择基于QA度量的组件,特别是问题生成和可回答性分类,对性能至关重要。在这些见解的基础上,我们提出了一个优化的指标,我们称之为QAFactEval,该指标在SummaC事实一致性基准上比以前的基于QA的指标平均提高了14%,也优于性能最好的基于隐含的指标。此外,我们发现基于QA和基于隐含的度量可以提供互补信号,并组合成单个度量以进一步提高性能</摘要>fabbri-etal-2022-qafacteval工厂10.18653/v1/2022.naacl-main.187<位置><网址>https://aclantology.org/2022.naacl-main.187</url></位置><部分>2022-07年<扩展单元=“page”><开始>2587<end>2601</范围></部分></mods></modsCollection>
%0会议记录%T QAFactEval:改进的基于QA的摘要事实一致性评估%亚历山大·法布里%吴建生%刘文浩%阿雄、蔡明%Y Carpuat,海军%Y de Marneffe,玛丽·凯瑟琳%Y Meza Ruiz,伊万·弗拉基米尔%计算语言学协会北美分会2022年会议记录:人类语言技术%D 2022年%7月8日%计算语言学协会%C美国西雅图%F工厂-2022-qafacteval%X事实一致性是文本摘要模型在实际环境中的一个基本质量。评估这一维度的现有工作大致可分为两类研究,基于内涵和基于问题回答(QA)的指标,不同的实验设置通常会导致对哪种范式表现最佳的对比结论。在这项工作中,我们对隐含和基于QA的度量进行了广泛的比较,证明了仔细选择基于QA度量的组件,特别是问题生成和可回答性分类,对性能至关重要。在这些见解的基础上,我们提出了一个优化的指标,我们称之为QAFactEval,该指标在SummaC事实一致性基准上比以前的基于QA的指标平均提高了14%,也优于性能最好的基于隐含的指标。此外,我们发现基于QA和基于隐含的度量可以提供互补信号,并组合成单个度量以进一步提高性能。%R 10.18653/v1/2022.naacl-main.187号%U型https://acl选集.org/2022.naacl-main.187%U型https://doi.org/10.18653/v1/2022.naacl-main.187%电话:2587-2601
降价(非正式)
[QAFactEval:改进的基于QA的事实一致性评估,用于汇总](https://aclantology.org/2022.naacl-main.187)(Fabbri等人,NAACL 2022)
国际计算语言学协会
- 亚历山大·法布里(Alexander Fabbri)、吴建胜(Chien-Sheng Wu)、刘文浩(Wenhao Liu)和熊才明(Caiming Xiong)。2022QAFactEval:用于摘要的改进的基于QA的事实一致性评估.英寸计算语言学协会北美分会2022年会议记录:人类语言技术,第2587–2601页,美国西雅图。计算语言学协会。