@进行中{goyal-etal-2022-hydrasum,title=“{H}ydra{S}um:使用多解码器模型进行文本摘要中的分离样式特征”,author=“Goyal、Tanya和拉贾尼、纳兹涅和刘文浩和沃伊切赫·克里辛斯基”,editor=“Goldberg、Yoav和科扎列娃、佐尔尼察和张悦”,booktitle=“2022年自然语言处理实证方法会议记录”,月=12月,年=“2022”,address=“阿拉伯联合酋长国阿布扎比”,publisher=“计算语言学协会”,url=“https://aclcollectory.org/2022.emnlp-main.30”,doi=“10.18653/v1/2022.emnlp-main.30”,pages=“464--479”,摘要=“摘要系统在推理过程中对摘要属性做出许多决定,例如复制程度、输出的特异性和长度等。然而,这些是在模型参数中隐式编码的,并且无法强制执行特定样式。为了解决这个问题,我们引入了HydraSum,这是一种新的摘要体系结构,它将当前模型的单个解码器框架扩展为具有多个解码器的专家混合版本。我们展示了HydraSum{'}的多个解码器在标准训练目标下训练时,在没有任何额外监督的情况下自动学习对比摘要样式。通过对三个摘要数据集(CNN、Newsroom和XSum)的实验,我们表明HydraSum提供了一种简单的机制,可以通过从单个解码器或其混合物中采样来获得风格相反的摘要,优于基线模型。最后,我们证明,在训练期间对门控策略进行小的修改可以实施更严格的风格划分,例如高抽象性与低抽象性或高特异性与低特异性,允许用户从生成空间的更大区域进行采样,并沿多个维度改变摘要风格。”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“goyal-etal-2022-hydrasum”><标题信息>HydraSum:使用多解码器模型的文本摘要中的分离样式特征</titleInfo><name type=“personal”>Tanya戈亚尔<角色>作者</角色></name><name type=“personal”>纳兹涅语拉贾尼<角色>作者</角色></name><name type=“personal”>文浩<namePart type=“family”>刘</namePart><角色>作者</角色></name><name type=“personal”>沃伊切赫Kryscinski<角色>作者</角色></name><originInfo>2022-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2022年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>Yoav戈德堡<角色>编辑器</角色></name><name type=“personal”>佐尔尼察科扎列娃<角色>编辑器</角色></name><name type=“personal”><namePart type=“given”>岳<namePart type=“family”>张<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>阿拉伯联合酋长国阿布扎比</地点></originInfo>会议出版物</relatedItem><abstract>摘要系统在推理过程中对摘要属性做出许多“决定”,例如复制程度、输出的特异性和长度等。然而,这些都隐含在模型参数中,无法强制执行特定样式。为了解决这个问题,我们引入了HydraSum,这是一种新的摘要体系结构,它将当前模型的单个解码器框架扩展为具有多个解码器的专家混合版本。我们表明,HydraSum的多个解码器在标准训练目标下训练时,会自动学习对比鲜明的摘要风格,而无需任何额外的监督。通过对三个摘要数据集(CNN、Newsroom和XSum)的实验,我们表明HydraSum提供了一种简单的机制,可以通过从单个解码器或其混合物中采样来获得风格相反的摘要,优于基线模型。最后,我们证明,在训练期间对门控策略进行小的修改可以实施更严格的风格划分,例如高抽象性与低抽象性或高特异性与低特异性,允许用户从生成空间的更大区域进行采样,并沿多个维度改变摘要风格</摘要>goyal-etal-2022-hydradsum10.18653/v1/2022.emnlp-main.30<位置><网址>https://aclantology.org/2022.emnlp-main.30</url></位置><部分>2022-12年<扩展单元=“page”><开始>464</开始><end>479</end></范围></部分></mods></modsCollection>
%0会议记录%T HydraSum:多解码器模型下文本摘要的分离风格特征%塔尼亚·戈亚尔%拉贾尼,纳兹尼恩%刘文浩%A Kryscinski,沃伊切赫%Y Goldberg,约夫%佐尔尼察Y Kozareva%Y Zhang,岳%2022年自然语言处理实证方法会议论文集%D 2022年%12月8日%计算语言学协会%C阿拉伯联合酋长国阿布扎比%F goyal-etal-2022-hydrasum公司%X摘要系统在推理过程中对摘要属性做出许多“决定”,例如复制程度、输出的特异性和长度等。然而,这些都隐含在模型参数中,并且不能强制执行特定样式。为了解决这个问题,我们引入了HydraSum,这是一种新的摘要体系结构,它将当前模型的单个解码器框架扩展为具有多个解码器的专家混合版本。我们展示了HydraSum的多个解码器在标准训练目标下训练时,在没有任何额外监督的情况下自动学习对比摘要样式。通过对三个摘要数据集(CNN、Newsroom和XSum)的实验,我们表明HydraSum提供了一种简单的机制,可以通过从单个解码器或其混合物中采样来获得风格相反的摘要,优于基线模型。最后,我们证明,在训练期间对门控策略进行小的修改可以实施更严格的风格划分,例如高抽象性与低抽象性或高特异性与低特异性,允许用户从生成空间的更大区域进行采样,并沿多个维度改变摘要风格。%R10.18653/v1/2022.emnlp-main.30%U型https://aclantology.org/2022.emnlp-main.30%U型https://doi.org/10.18653/v1/2022.emnlp-main.30%电话464-479
降价(非正式)
[HydraSum:使用多解码器模型的文本摘要中的分离样式特征](https://aclantology.org/2022.emnlp-main.30)(Goyal等人,EMNLP 2022)
国际计算语言学协会
- Tanya Goyal、Nazneen Rajani、Wenhao Liu和Wojciech Kryssinski。2022HydraSum:多解码器模型文本摘要中的分离样式特征.英寸2022年自然语言处理实证方法会议记录,第464-479页,阿拉伯联合酋长国阿布扎比。计算语言学协会。