链接

下载CoreNLP 4.5.6 GitHub上的CoreNLP 启用CoreNLP🤗

Maven上的CoreNLP

新增功能:v4.5.3版本增加了一个外科医生界面

关于

CoreNLP是Java自然语言处理的一站式服务!CoreNLP使用户能够导出文本的语言注释,包括标记和句子边界、词类、命名实体、数值和时间值、依赖关系和选区分析、共同引用、情感、引用属性和关系。CoreNLP目前支持8种语言:阿拉伯语、中文、英语、法语、德语、匈牙利语、意大利语和西班牙语。

管道

CoreNLP的核心是管道。管道接收原始文本,对文本运行一系列NLP注释器,并生成最终的注释集。

核心文档

管道生成CoreDocuments,即包含所有注释信息的数据对象,可通过简单的API访问,并可序列化到Google协议缓冲区。

注释

CoreNLP生成各种语言注释,包括:

词类

命名实体

依赖关系分析

核心参考

快速启动

  • 下载并解压缩核心NLP 4.5.6 (高频集线器)

  • 下载您想要使用的语言的模型jar,并将jar移动到分发目录。我们、Maven和Hugging Face都可以直接提供罐子。

谢谢你拥抱的脸感谢您帮助我们主持!

百万伏特/路径/to/standford-corenlp-4.5.6模型-french.jar/path/to/stanford-corenelp-4.5.5
  • 在CLASSPATH中包含分发目录。
出口课程路径=$类路径:/path/to/standford-corenlp-4.5.6/*:
  • 你准备好出发了!有许多方法可以运行CoreNLP管道。例如,下面是如何在文本文件上运行管道。输出将在名为输入.txt.out.
java edu.stanford.nlp.pipline。斯坦福大学核心NLP-文件输入文件

编程语言和操作系统

Stanford CoreNLP编写于Java语言; 最新版本需要Java 8语言+。您需要安装Java才能运行CoreNLP。然而,您可以通过命令行或其web服务与CoreNLP交互;许多人在用Javascript、Python或其他语言编写自己的代码时使用CoreNLP。

您可以从命令行,通过其原始Java编程API,通过面向对象简单API,通过第三方API对于大多数主要的现代编程语言,或通过web服务。它适用于Linux、macOS和Windows。

许可证

完整的斯坦福CoreNLP根据通用公共许可证v3或更高版本。更准确地说,所有Stanford NLP代码都是GPL v2+,但CoreNLP使用了一些Apache授权的库,因此我们的理解是,组合正确地授权为v3+。您可以在GPL v2下运行几乎所有的CoreNLP;您只需要省略与时间相关的库,然后就失去了SUTime的功能。请注意,许可证是满的GPL,它允许许多免费使用,但在专有软件分发给其他人。对于分销商专有软件,CoreNLP也可从斯坦福大学获得商业许可您可以联系我们java-nlp-support@lists.stanford.edu。如果您不需要商业许可证,但希望支持这些工具的维护,我们欢迎礼品资助:使用这个表格并在特别说明中编写“Stanford NLP Group开源软件”。

论文引用斯坦福大学核心NLP

如果您只是在运行CoreNLP管道,请引用此CoreNLP论文:

曼宁、克里斯托弗·D·曼宁、米海·苏尔迪努、约翰·鲍尔、詹妮·芬克尔、史蒂文·贝瑟德和大卫·麦克洛斯基。2014斯坦福CoreNLP自然语言处理工具包计算语言学协会第52届年会会议记录:系统演示第55-60页。[pdf格式] [围兜]

如果你正在深入研究特定的注释者,也鼓励你引用涵盖单个组件的论文:词性标注选区分析依赖项分析共指消解情绪,或信息抽取。您可以在斯坦福NLP上找到更多信息软件页面和/或出版物页面.


©2020斯坦福NLP集团版权所有。