textTinyR:小型或大型数据文件的文本处理

它提供了拆分、解析、标记化和创建大文本数据文件词汇表的功能。此外,它还包括构建文档-术语矩阵和从中提取信息的功能(术语关联,最常见的术语)。它还包含用于计算令牌统计的函数(搭配、查找表、字符串相异性)和用于处理稀疏矩阵的函数。最后,它包括用于单词向量表示的函数(即“Globe”、“fasttext”),并包含用于计算(成对)文本文档差异的函数。源代码基于“C++11”,并通过“Rcpp”、“RcppArmadillo”和“BH”包以R格式导出。

版本: 1.1.8
取决于: R(≥3.2.3),矩阵
进口: 卢比(≥ 0.12.10),R6级,数据表,实用程序
链接到: 卢比,RcppArmadillo公司(≥ 0.7.8),伯克希尔哈撒韦
建议: 测试那个,覆盖(covr),针织物,rmarkdown公司
出版: 2023-12-04
内政部: 10.32614/CRAN.包装.textTinyR
作者: 兰普洛斯·穆塞利米斯ORCID标识[aut,cre]
维护人员: Lampros Mouselimis在gmail.com>
错误报告: https://github.com/mlampros/textTinyR/问题
许可证: GPL-3公司
版权: 指令/版权
textTinyR版权详细信息
网址: https://github.com/mlampros/textTinyR
需要编译:
系统要求: libarmadillo:apt-get安装-y libarmadilo-dev(债务)
引用: textTinyR引用信息
材料: 自述文件 新闻
CRAN检查: text TinyR结果

文档:

参考手册: 文本TinyR.pdf
渐晕图: textTinyR包的功能
单词向量-doc2vec-文本聚类

下载内容:

包源: text微小R_1.1.8.tar.gz
Windows二进制文件: r-devel公司:text微型R_1.1.8.zip,r版本:text微型R_1.1.8.zip,r-oldrel:text微型R_1.1.8.zip
macOS二进制文件: r释放(arm64):text微小R_1.1.8.tgz,r-oldrel(arm64):text微小R_1.1.8.tgz,r-release(x86_64):text微小R_1.1.8.tgz,r-oldrel(x86_64):text微小R_1.1.8.tgz
旧来源: text TinyR存档

反向依赖关系:

反向进口: tsrobprep公司

链接:

请使用规范形式https://CRAN.R-project.org/package=textTinyR链接到此页面。