希罗纳姆:B类使用辅助信息生成engali新闻标题

阿布·乌拜达·阿卡什,米尔·塔夫西尔·纳耶姆,费萨尔·塔雷奎·绍汉,Tanvir伊斯兰


摘要
自动标题生成系统有可能帮助编辑找到有趣的标题,以吸引访客或读者。然而,由于孟加拉语等低资源语言缺乏足够的并行数据,以及缺乏使用预训练语言模型开发标题生成系统的理想方法,尤其是对于长篇新闻文章,标题生成系统性能仍然具有挑战性。为了应对这些挑战,我们提出了Shironaam,这是一个孟加拉语的大型数据集,包含超过240K条新闻文章标题与辅助数据,如图片标题、主题词和类别信息。与其他标题生成模型不同,本文使用此辅助信息来更好地建模此任务。此外,我们利用语境化语言模型设计孟加拉语新闻标题生成的编码器-解码器模型,并考虑到预训练语言模型的固定长度要求,采用简单但经济高效的粗到细方法,使用主题词检索重要句子。最后,我们对包含13个不同类别的新闻文章的数据集进行了广泛的实验,以证明合并辅助信息的有效性,并根据广泛的指标评估我们的系统。实验结果表明,我们的方法在基线上带来了显著的改进(即所有评估指标都提高了3到10个百分点)。为了说明其实用性和鲁棒性,我们报告了在少数快照和非少数快照设置下的实验结果。
选集ID:
2023.eacl主体4
体积:
计算语言学协会欧洲分会第17届会议记录
月份:
五月
年份:
2023
地址:
克罗地亚杜布罗夫尼克
编辑:
安德烈亚斯·弗拉科斯,伊莎贝尔·奥根斯坦
地点:
EACL公司
SIG公司:
出版商:
计算语言学协会
注:
页:
52–67
语言:
网址:
https://aclantology.org/2023.eacl-main.4
内政部:
10.18653/v1/2023.eacl-main.4
比比键:
引用(ACL):
Abu Ubaida Akash、Mir Tafseer Nayeem、Faisal Tareque Shohan和Tanvir Islam。2023Shironaam:使用辅助信息生成孟加拉语新闻标题.英寸计算语言学协会欧洲分会第17届会议论文集,第52-67页,克罗地亚杜布罗夫尼克。计算语言学协会。
引用(非正式):
Shironaam:使用辅助信息生成孟加拉语新闻标题(Akash等人,EACL 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.eacl-main.4.pdf
视频:
 https://aclantology.org/2023.eacl-main.4.mp4