公司工具:管理、查询和分析标记文本

在R中提供文本分析,重点是标记化文本格式的使用。在这种格式中,标记的位置被维护,每个标记都可以被注释(例如,部分对话标记、依赖关系)。突出的功能包括高级Lucene类查询特定标记或上下文(例如文档、句子),单词和文档的相似性统计,导出到DTM以与许多文本分析包兼容,以及从标记重建原始文本以便于解释的可能性。

版本: 0.5.1
取决于: R(≥3.5.0)
进口: 方法,文字云(≥ 2.5),斯特林吉,卢比(≥ 0.12.12),R6级,udpipe(udpipe)(≥ 0.8.3),消化,数据表(≥1.10.4),夸特达(≥1.5.1),记录仪,标记浏览器(≥ 0.1.5),R新闻流(≥ 1.2.1),矩阵(≥1.2),平行,pbapply(应用程序)(≥ 1.4),r语法(≥ 0.1.1)
链接到: 卢比,接收进度
建议: 测试那个,tm(tm)(≥ 0.6),主题模型,针织物,rmarkdown公司
出版: 2023-05-08
作者: 卡斯珀·韦尔伯斯(Kasper Welbers)和沃特·范·阿特维尔特(Wouter van Atteveldt)
维护人员: 卡斯珀·韦尔伯斯
许可证: GPL-3公司
网址: https://github.com/kasperwelbers/corpustools网站
需要编译:
材料: 自述文件 新闻
CRAN检查: corpustools结果

文档:

参考手册: 公司工具.pdf
渐晕图: 企业工具简介

下载:

程序包来源: 公司工具0.5.1.tar.gz
Windows二进制文件: r-预发布:corpustools_0.5.1.zip公司,r版本:corpustools_0.5.1.zip公司,r-oldrel:corpustools_0.5.1.zip公司
macOS二进制文件: r-prerel(arm64):公司工具0.5.1.tgz,r-release(arm64):公司工具0.5.1.tgz,r-oldrel(arm64):公司工具0.5.1.tgz,r-prerel(x86_64):公司工具0.5.1.tgz,r-release(x86_64):公司工具0.5.1.tgz
旧来源: corpustools存档

反向依赖关系:

反向进口: 文本2sdg
反向建议: LexisNexis工具

链接:

请使用规范形式https://CRAN.R-project.org/package=corpustools公司链接到此页面。