OntoNotes 5.0

Pradhan等人于年介绍使用OntoNotes进行稳健的语言分析

OntoNotes 5.0是一个大型语料库,包含三种语言(英语、汉语和阿拉伯语)的各种类型的文本(新闻、对话式电话演讲、网络日志、usenet新闻组、广播、脱口秀),具有结构信息(语法和谓词-论元结构)和浅层语义(与本体和共指关联的词义)。

OntoNotes 5.0版包含早期版本的内容,并添加了来自新闻专线、广播新闻、广播对话、电话对话和中英文网络数据以及阿拉伯语新闻专线数据的源数据和/或附加注释。

资料来源:https://catalog.ldc.upenn.edu/LDC2013T19

论文


纸张 代码 结果 日期 星星

任务


类似数据集


许可证


  • 未知

模式


语言文字