@正在进行{akash-etal-2023-shironaam,title=“Shironaam:{B}使用辅助信息生成engali新闻标题”,author=“Akash、Abu Ubaida和Nayeem、Mir Tafseer和Shohan、Faisal Tareque和伊斯兰,坦维尔”,editor=“弗拉乔斯、安德烈亚斯和伊莎贝尔·奥根斯坦“,booktitle=“计算语言学协会欧洲分会第17届会议记录”,月=5月,年=“2023”,address=“克罗地亚杜布罗夫尼克”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.eacl-main.4”,doi=“10.18653/v1/2023.eacl-main.4”,pages=“52--67”,抽象=“自动标题生成系统有可能帮助编辑找到有趣的标题以吸引访问者或读者。然而,标题生成系统的性能仍然具有挑战性,因为孟加拉语等低资源语言缺乏足够的并行数据,并且缺乏理想的解译方法开发一个使用预先训练的语言模型生成标题的系统,特别是针对长篇新闻文章。为了应对这些挑战,我们提出了Shironaam,这是一个孟加拉语的大型数据集,包含超过240K条新闻文章标题与辅助数据,如图片标题、主题词和类别信息。与其他标题生成模型不同,本文使用这些辅助信息来更好地建模这项任务。此外,我们利用语境化语言模型设计孟加拉语新闻标题生成的编码器-解码器模型,并考虑到预训练语言模型的固定长度要求,采用简单但经济高效的粗到细方法,使用主题词检索重要句子。最后,我们对包含13个不同类别的新闻文章的数据集进行了广泛的实验,以证明合并辅助信息的有效性,并根据广泛的指标评估我们的系统。实验结果表明,我们的方法比基线有了显著的改进(即,在所有评估指标中有3到10个百分点)。为了说明其实用性和鲁棒性,我们报告了在少数快照和非少数快照设置下的实验结果。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“akash-etal-2023-shironaam”><标题信息>Shironaam:使用辅助信息生成孟加拉语新闻标题</titleInfo><name type=“personal”>阿布Ubaida阿卡什<角色>作者</角色></name><name type=“personal”>和平号塔夫西尔纳耶姆<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>费萨尔塔雷奎(Tareque)Shohan(Shohan)<角色>作者</角色></name><name type=“personal”><namePart type=“given”>Tanvir</namePart>伊斯兰<角色>作者</角色></name><originInfo><日期发布>2023-05</日期发布></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会欧洲分会第17届会议记录</titleInfo><name type=“personal”>安德烈亚斯Vlachos公司<角色>编辑器</角色></name><name type=“personal”>伊莎贝尔奥根斯坦<角色>编辑器</角色></name><originInfo>计算语言学协会<地点>克罗地亚杜布罗夫尼克</place></originInfo>会议出版物</relatedItem><摘要>自动标题生成系统有可能帮助编辑找到有趣的标题,以吸引访客或读者。然而,由于孟加拉语等低资源语言缺乏足够的并行数据,以及缺乏使用预训练语言模型开发标题生成系统的理想方法,尤其是对于长篇新闻文章,标题生成系统性能仍然具有挑战性。为了应对这些挑战,我们提出了Shironaam,这是一个孟加拉语的大型数据集,包含超过240K条新闻文章标题与辅助数据,如图片标题、主题词和类别信息。与其他标题生成模型不同,本文使用此辅助信息来更好地建模此任务。此外,我们利用语境化语言模型设计孟加拉语新闻标题生成的编码器-解码器模型,并考虑到预训练语言模型的固定长度要求,采用简单但经济高效的粗到细方法,使用主题词检索重要句子。最后,我们对包含13个不同类别的新闻文章的数据集进行了广泛的实验,以证明合并辅助信息的有效性,并根据广泛的指标评估我们的系统。实验结果表明,我们的方法在基线上带来了显著的改进(即所有评估指标都提高了3到10个百分点)。为了说明其实用性和鲁棒性,我们报告了在少数快照和非少数快照设置下的实验结果</摘要>akash-etal-2023-shironaam10.18653/v1/2023.eacl-main.4<位置><网址>https://aclantology.org/2023.eacl-main.4</url></位置><部分>2023-05年<扩展单元=“page”><开始>52</开始><end>67</范围></部分></mods></modsCollection>
%0会议记录%T Shironaam:使用辅助信息生成孟加拉语新闻标题%阿卡什,阿布·乌拜达%米尔·塔夫西尔·纳耶姆%费萨尔·塔雷奎·A Shohan%伊斯兰教,坦维尔%安德烈亚斯·瓦拉科斯%伊莎贝尔·Y·奥根斯坦%计算语言学协会欧洲分会第17届会议记录%D 2023年%5月8日%计算语言学协会%C杜布罗夫尼克,克罗地亚%F akash-etal-2023-shironaam公司%X自动标题生成系统有可能帮助编辑找到有趣的标题,以吸引访客或读者。然而,由于孟加拉语等低资源语言缺乏足够的并行数据,以及缺乏使用预训练语言模型开发标题生成系统的理想方法,尤其是对于长篇新闻文章,标题生成系统性能仍然具有挑战性。为了应对这些挑战,我们提出了Shironaam,这是一个孟加拉语的大型数据集,包含超过240K条新闻文章标题与辅助数据,如图片标题、主题词和类别信息。与其他标题生成模型不同,本文使用此辅助信息来更好地建模此任务。此外,我们利用语境化语言模型设计孟加拉语新闻标题生成的编码器-解码器模型,并根据预训练语言模型的固定长度要求,采用简单但经济高效的粗到细方法,使用主题词检索重要句子。最后,我们在包含13个不同类别的新闻文章的数据集上进行了广泛的实验,以证明合并辅助信息的有效性,并在广泛的指标上评估我们的系统。实验结果表明,我们的方法在基线上带来了显著的改进(即所有评估指标都提高了3到10个百分点)。为了说明其实用性和鲁棒性,我们报告了在少数快照和非少数快照设置下的实验结果。%R 10.18653/v1/2023。主管道4%U型https://aclantology.org/2023.eacl-main.4%U型https://doi.org/10.18653/v1/2023.eacl-main.4%电话:52-67
降价(非正式)
[Shironaam:使用辅助信息生成孟加拉语新闻标题](https://aclantology.org/2023.eacl-main.4)(Akash等人,EACL 2023)
国际计算语言学协会
- Abu Ubaida Akash、Mir Tafseer Nayeem、Faisal Tareque Shohan和Tanvir Islam。2023Shironaam:使用辅助信息生成孟加拉语新闻标题.英寸计算语言学协会欧洲分会第17届会议记录,第52-67页,克罗地亚杜布罗夫尼克。计算语言学协会。