@在过程中{qiu-etal-022-late,title=“后期融合多模态意识形态预测与分析的三重边际目标”,author=“邱长元和Wu、Winston和张新良、弗雷德里克和王璐”,editor=“Goldberg、Yoav和科扎列娃、佐尔尼察和张岳”,booktitle=“2022年自然语言处理实证方法会议记录”,月=12月,年=“2022”,address=“阿拉伯联合酋长国阿布扎比”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.emnlp-main.659",doi=“10.18653/v1/2022.emnlp-main.659”,pages=“9720--9736”,抽象=“之前关于意识形态预测的工作主要集中在单一形式上,即文本或图像。在这项工作中,我们介绍了多模态意识形态预测的任务,其中一个模型预测二元或五点尺度的意识形态倾向,给定一对带政治内容的文本图像。我们首先收集了五个新的大规模数据集,其中包含英语文件和图片以及他们的意识形态倾向,涵盖了美国主流媒体的新闻文章以及Reddit和Twitter的社交媒体帖子。我们对新闻文章进行深入分析,揭示不同政治派别的图像内容和使用差异。此外,我们还进行了广泛的实验和消融研究,证明了针对不同模型组件的目标预处理目标的有效性。我们性能最好的模型是一个后期融合架构,它在多模态内容上预处理了三重目标,比最新的纯文本模型性能好了将近4{\%},并且在没有预处理的情况下,比强大的多模态基线性能好了3{\%{。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“qiu-etal-2022-late”><标题信息>后期融合三重边际目标进行多模态意识形态预测与分析</titleInfo><name type=“personal”>长源<namePart type=“given”>邱<namePart type=“family”><角色>作者</角色></name><name type=“personal”>温斯顿<namePart type=“family”>吴</namePart><角色>作者</角色></name><name type=“personal”>新良弗雷德里克<namePart type=“family”>张<角色>作者</角色></name><name type=“personal”>Lu王<namePart type=“family”><角色>作者</角色></name><originInfo><日期发布>2022-12年</日期发布></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2022年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>Yoav<namePart type=“family”>戈德堡</namePart><角色>编辑器</角色></name><name type=“personal”>佐尔尼察科扎列娃<角色>编辑器</角色></name><name type=“personal”>岳<namePart type=“given”><namePart type=“family”>张<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>阿拉伯联合酋长国阿布扎比</place></originInfo><type-authority=“marcgt”>会议出版物</type></relatedItem>之前关于意识形态预测的工作主要集中在单一形式上,即文本或图像。在这项工作中,我们介绍了多模态意识形态预测的任务,其中一个模型预测二元或五点尺度的意识形态倾向,给定一对带有政治内容的文本图像。我们首先收集了五个新的大型数据集,其中包含英文文档和图像以及它们的意识形态倾向,涵盖了美国主流媒体的新闻文章以及Reddit和Twitter的社交媒体帖子。我们对新闻文章进行了深入分析,揭示了不同政治派别在图像内容和使用方面的差异。此外,我们还进行了广泛的实验和消融研究,证明了针对不同模型组件的目标预处理目标的有效性。我们性能最好的模型是一种基于多模态内容的三重目标预处理的后融合体系结构,它比最先进的纯文本模型性能高出近4%,比无预处理的强多模态基线性能高出3%以上</摘要>qiu-etal-2022年末10.18653/v1/2022.emnlp-main.659<位置><网址>https://aclantology.org/2022.emnlp-main.659</url></位置><部分>2022-12年<扩展单元=“page”><开始>9720<end>9736</范围></部分></mods></modsCollection>
%0会议记录%基于三重余量目标的T后期融合多模态意识形态预测与分析%阿秋,长垣%温斯顿·A Wu%A Zhang,Xinliang Frederick(张新良·弗雷德里克)%A Wang、Lu%Y Goldberg,约夫%佐尔尼察Y Kozareva%Y Zhang,岳%2022年自然语言处理实证方法会议论文集%D 2022年%12月8日%计算语言学协会%C阿拉伯联合酋长国阿布扎比%F qiu-etal-2022晚%X之前关于意识形态预测的工作主要集中于单一形式,即文本或图像。在这项工作中,我们介绍了多模态意识形态预测的任务,其中一个模型预测二元或五点尺度的意识形态倾向,给定一对具有政治内容的文本图像。我们首先收集了五个新的大型数据集,其中包含英文文档和图像以及它们的意识形态倾向,涵盖了美国主流媒体的新闻文章以及Reddit和Twitter的社交媒体帖子。我们对新闻文章进行深入分析,揭示不同政治派别的图像内容和使用差异。此外,我们还进行了广泛的实验和消融研究,证明了针对不同模型组件的目标预处理目标的有效性。我们性能最好的模型是一种基于多模态内容的三重目标预处理的后融合体系结构,它比最先进的纯文本模型性能高出近4%,比无预处理的强多模态基线性能高出3%以上。%R10.18653/v1/2022.emnlp-main.659%U型https://aclantology.org/2022.emnlp-main.659%U型https://doi.org/10.18653/v1/2022.emnlp-main.659%电话:9720-9736
降价(非正式)
【后期融合三重边际目标进行多模态意识形态预测与分析】(https://aclantology.org/2022.emnlp-main.659)(邱等人,EMNLP 2022)
国际计算语言学协会
- 邱长元(Changyuan Qiu)、吴文斯顿(Winston Wu)、张新良(Xinliang Frederick Zhang)和王璐(Lu Wang)。2022多模态意识形态预测与分析的三重边际目标后期融合.英寸2022年自然语言处理实证方法会议记录,第9720–9736页,阿拉伯联合酋长国阿布扎比。计算语言学协会。