新闻文章的文本和图像之间的联系:多媒体分析的新见解

内列克·奥斯蒂克汉斯·范·哈尔特伦尔坎巴阿玛莎·拉尔森


摘要
我们报道了一个文本和图像的案例研究,该研究揭示了关于它们之间的联系和相互作用的简单假设的不足。我们的工作背景是更大的努力来创建自动系统,可以从有关洪水灾害的在线新闻文章中提取事件信息。我们对包含与洪水相关关键字的1000篇文章进行了手动分析。分析表明,我们数据集中的文章分为七类,与洪水的不同主题相关,文章附带的图像分为五类,与它们描述的内容相关。结果表明,与洪水相关的新闻文章并不总是报道当前正在发生的单一洪水事件,我们也不应该假设洪水相关的图像将直接与相应文章中描述的洪水事件相关。特别是,时空距离很重要。我们使用自动分类器验证了手动分析,证明了多媒体分析方法的技术可行性,该方法允许文本和图像之间存在更真实的关系。总之,我们的案例研究证实,更密切地关注文本和图像之间的联系有可能改进从新闻文章中收集多模态信息。
选集ID:
2020.记录-1.535
音量:
第十二届语言资源与评价会议记录
月份:
五月
年份:
2020
地址:
法国马赛
编辑:
尼科莱塔·卡尔佐拉里弗雷德里克·贝歇(Frédéric Béchet)菲利普·布拉切哈立德·乔克里克里斯托弗·西埃里蒂埃里·德克勒克萨拉·戈吉Hitoshi Isahara先生本特·梅加德约瑟夫·马里亚尼赫莱内·马佐亚松森·莫雷诺简·奥迪克Stelios Piperidis公司
地点:
LREC公司
SIG公司:
发布者:
欧洲语言资源协会
注:
页:
4343–4351
语言:
英语
网址:
https://aclantology.org/2020.lrec-1.535
内政部:
比比键:
引用(ACL):
内列克·奥斯蒂克(Nelleke Oostdijk)、汉斯·范·哈尔特伦(Hans van Halteren)、埃尔坎·巴瓦尔(Erkan Bașar)和玛莎·拉尔森(Martha Larson)。2020新闻文章文本与图像的联系:多媒体分析的新视角.英寸第十二届语言资源与评价会议记录,第4343–4351页,法国马赛。欧洲语言资源协会。
引用(非正式):
新闻文章文本与图像的联系:多媒体分析的新视角(Oostdijk等人,LREC 2020)
复制引文:
PDF格式:
https://aclantology.org/2020.lrec-1.535.pdf