@在过程中{μbarak-etal-200-结构,title=“构建平行推文双语语料库”,author=“穆巴拉克、哈姆迪和哈桑、萨比特和艾哈迈德·阿卜杜拉利“,editor=“拉普、莱因哈德和Zweigenbaum、Pierre和谢尔盖·沙洛夫”,booktitle=“第十三届构建和使用可比语料库研讨会论文集”,月=5月,年=“2020”,address=“法国马赛”,publisher=“欧洲语言资源协会”,url=“https://aclantology.org/2020.bucc-1.3”,pages=“14--21”,abstract=“为了吸引更多、更多样化的受众,推特用户经常发布包含相同内容但用不同语言编写的平行推特。平行推特是开发机器翻译(MT)系统和其他自然语言处理(NLP)系统的重要资源任务。在本文中,我们介绍了一种收集并行推文的通用方法。使用这种方法,我们收集了英语-阿拉伯语平行推文的双语语料库和定期发布英语-阿拉伯语推文的推特账户列表。由于我们的方法是通用的,它还可以用于收集包含资源较少的语言(如塞尔维亚语和乌尔都语)的并行推文。此外,我们还为推特账户的一个子集添加了原籍国和感兴趣的主题注释,以了解发布并行推特的人群。后面的信息对于作者分析任务也很有用。",language=“英语”,国际标准图书编号=“979-10-95546-42-9”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“穆巴拉克-2020-建设”><标题信息>构建双语平行推文语料库</titleInfo><name type=“personal”>哈姆迪穆巴拉克<角色>作者</角色></name><name type=“personal”>Sabit(萨比特)哈桑<角色>作者</角色></name><name type=“personal”>艾哈迈德阿卜杜拉利<角色>作者</角色></name><originInfo>发布日期:2020-05发布日期:</originInfo><typeOfResource>文本<语言>英语<languageTerm type=“code”authority=“iso639-2b”>eng英语</语言><relatedItem type=“主机”><标题信息>第十三届构建和使用可比语料库研讨会论文集</titleInfo><name type=“personal”>莱因哈德<namePart type=“family”>说唱</namePart><角色>编辑器</角色></name><name type=“personal”><namePart type=“给定”>Pierre</namePart>Zweigenbaum公司<角色>编辑器</角色></name><name type=“personal”>谢尔盖Sharoff<角色>编辑器</角色></name><originInfo>欧洲语言资源协会<位置>法国马赛</place></originInfo>会议出版物979-10-95546-42-9</relatedItem><abstract>为了吸引更多、更多样化的受众,推特用户经常发布并行推文,即包含相同内容但使用不同语言编写的推文。在其他自然语言处理(NLP)任务中,并行推文可以成为开发机器翻译(MT)系统的重要资源。在本文中,我们介绍了一种收集并行推文的通用方法。使用这种方法,我们收集了英语-阿拉伯语平行推文的双语语料库和定期发布英语-阿拉伯语推文的推特账户列表。由于我们的方法是通用的,它也可以用于收集平行推文,这些推文涵盖了资源较少的语言,如塞尔维亚语和乌尔都语。此外,我们还为推特账户的一个子集添加了原籍国和感兴趣的主题注释,以了解发布并行推特的人群。后面的信息对于作者分析任务也很有用</摘要>穆巴拉克-埃塔尔-2020年建筑<位置><网址>https://aclantology.org/2020.bucc-1.3</url></位置><部分><日期>2020-05</日期><扩展单元=“page”><开始>14</开始><end>21</范围></部分></mods></modsCollection>
%0会议记录%构建双语平行推文语料库%穆巴拉克、哈姆迪%萨比特·哈桑%阿卜杜拉利,艾哈迈德%莱因哈德·拉普%Y Zweigenbaum,皮埃尔%谢尔盖·Y·沙洛夫%第十三届构建和使用可比语料库研讨会论文集%D 2020年%5月8日%I欧洲语言资源协会%C马赛,法国%@ 979-10-95546-42-9%G英语%F mubarak-etal-2020施工%X为了吸引更多、更多样化的受众,推特用户经常发布并行推特,即包含相同内容但使用不同语言编写的推特。在其他自然语言处理(NLP)任务中,并行推文可以成为开发机器翻译(MT)系统的重要资源。在本文中,我们介绍了一种收集并行推文的通用方法。使用这种方法,我们收集了英语-阿拉伯语平行推文的双语语料库和定期发布英语-阿拉伯语推文的推特账户列表。由于我们的方法是通用的,它还可以用于收集包含资源较少的语言(如塞尔维亚语和乌尔都语)的并行推文。此外,我们在推特账户的一个子集上标注了他们的原籍国和感兴趣的话题,这提供了关于发布平行推特的人群的见解。后一种信息对于作者评测任务也很有用。%U型https://aclantology.org/2020.bucc-1.3%第14-21页
降价(非正式)
[构建双语平行推文语料库](https://aclantology.org/2020.bucc-1.3)(穆巴拉克等人,BUCC 2020)
国际计算语言学协会
- 哈米德·穆巴拉克(Hamdy Mubarak)、萨比特·哈桑(Sabit Hassan)和艾哈迈德·阿卜杜拉利(Ahmed Abdelali)。2020构建双语平行推文语料库.英寸构建和使用可比语料库第13次研讨会会议记录,第14-21页,法国马赛。欧洲语言资源协会。