@正在进行{koto-etal-2020-liputan6,title=“Liputan6:文本摘要的大尺度{I}印尼数据集”,author=“Koto、Fajri和Lau、Jey Han和蒂莫西·鲍德温“,editor=“Wong、Kam-Fai和奈特、凯文和吴华“,booktitle=“计算语言学协会亚太分会第一届会议暨第十届国际自然语言处理联合会议论文集”,月=12月,年=“2020”,address=“中国苏州”,publisher=“计算语言学协会”,url=“https://aclantology.org/2020.aacl-main.60”,pages=“598--608”,abstract=“在本文中,我们引入了一个大规模的印尼摘要数据集。我们从在线新闻门户Liputan6.com获取文章,并获得215827个文档{--}摘要对。我们利用预先训练的语言模型,利用基于多语言和单语BERT的模型,在数据集上开发基准提取和抽象摘要方法。我们通过检查低ROUGE分数的机器生成的摘要来进行彻底的错误分析,并暴露ROUGE本身以及提取和抽象摘要模型的两个问题。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“koto-etal-2020-liputan6”><标题信息>Liputan6:用于文本摘要的大型印尼数据集</titleInfo><name type=“personal”>Fajri传真Koto公司<角色>作者</角色></name><name type=“personal”>Jey(Jey)韩语<namePart type=“family”>Lau<角色>作者</角色></name><name type=“personal”>蒂莫西鲍德温<角色>作者</角色></name><originInfo><发布日期>2020-12</发布日期></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会亚太分会第一届会议记录和第十届国际自然语言处理联合会议记录</titleInfo><name type=“personal”><namePart type=“given”>Kam-Fai</namePart>黄<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>凯文骑士<角色>编辑器</角色></name><name type=“personal”>华<namePart type=“given”>吴<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>中国苏州</place></originInfo>会议出版物</relatedItem>在本文中,我们介绍了一个大规模的印尼摘要数据集。我们从在线新闻门户Liputan6.com获取文章,并获得215827个文档-摘要对。我们利用预先训练的语言模型,利用基于多语言和单语BERT的模型,在数据集上开发基准提取和抽象摘要方法。我们通过检查低ROUGE分数的机器生成的摘要来进行彻底的错误分析,并暴露ROUGE本身以及提取和抽象摘要模型的两个问题</摘要>koto-etal-2020-liputan6<位置><网址>https://aclantology.org/2020.aacl-main.60</url></位置><部分>2020-12年<日期><扩展单元=“page”><开始>598</开始><end>608</范围></部分></mods></modsCollection>
%0会议记录%T Liputan6:一个用于文本摘要的大规模印尼数据集%法杰里·阿库托%刘杰翰%蒂莫西·鲍德温%黄,金飞%凯文·奈特%吴Y,华%计算语言学协会亚太分会第一届会议和第十届国际自然语言处理联合会议记录%D 2020年%12月8日%计算语言学协会%C中国苏州%F koto-etal-2020-脂6%在本文中,我们介绍了一个大规模的印尼摘要数据集。我们从在线新闻门户Liputan6.com获取文章,并获得215827个文档-摘要对。我们利用预训练语言模型在基于多语言和单语BERT模型的数据集上开发基准提取和抽象摘要方法。我们通过检查低ROUGE分数的机器生成的摘要来进行彻底的错误分析,并暴露ROUGE本身以及提取和抽象摘要模型的两个问题。%U型https://aclantology.org/2020.aacl-main.60%电话598-608
降价(非正式)
[Liputan6:用于文本摘要的大型印尼数据集](https://aclantology.org/2020.aacl-main.60)(Koto等人,AACL 2020)
国际计算语言学协会
- Fajri Koto、Jey Han Lau和Timothy Baldwin。2020Liputan6:用于文本摘要的大型印尼数据集.英寸计算语言学协会亚太分会第一届会议记录和第十届国际自然语言处理联合会议记录,第598-608页,中国苏州。计算语言学协会。