×

欧罗巴

swMATH ID: 39472
软件作者: 菲利普·科恩
描述: Europarl:统计机器翻译的并行语料库。我们从欧洲议会会议记录中收集了11种语言的平行文本语料库,并在网上发布。该语料库在NLP社区中得到了广泛使用。在这里,我们重点讨论它的获取及其作为统计机器翻译(SMT)训练数据的应用。我们为110个语言对训练了SMT系统,这揭示了未来挑战的有趣线索。
主页: https://homepages.inf.ed.ac.uk/pkoehn/publications/europarl-mtsummit05.pdf
相关软件: BLEU公司摩西Scikit公司WordNet(文字网)项目管理局亚当BabelNet公司斯里姆伊斯兰解放军UMAP公司ParaCrawl公司github彗星TensorFlow公司CCNet公司网格张力流BLEURT公司GShard公司火炬管G管道
引用于: 11文件

按年份列出的引文