text2vec:R的现代文本挖掘框架

快速且内存友好的文本矢量化工具,主题建模(LDA,LSA),单词嵌入(Globe),相似性。这个包裹提供了一个源识别流API,允许研究人员执行分析大于可用RAM的文档集合。所有核心功能被并行化,以从多核机器中受益。

版本: 0.6.4
取决于: R(≥3.6.0),方法
进口: 矩阵(≥ 1.5-2),卢比(≥ 1.0.3),R6级(≥ 2.3.0),数据表(≥ 1.9.6),rsparse(rsparse)(≥ 0.3.3.4),条纹(≥ 1.1.5),mlapi公司(≥ 0.1.0),液化天然气(≥ 0.2),消化(≥ 0.6.8)
链接到: 卢比,消化(≥ 0.6.8)
建议: 马格里特,udpipe(udpipe)(≥ 0.6),格尔姆奈特,测试那个,冠状病毒,针织物,rmarkdown公司,代理
出版: 2023-11-09
内政部: 10.32614/CRAN.包装.text2vec
作者: 德米特里·塞利瓦诺夫[aut,cre,cph],Manuel Bickel[aut,cph](主题模型的一致性度量),Qing Wang[aut,cph](WaprLDA C++代码的作者)
维护人员: 德米特里·塞利瓦诺夫
错误报告: https://github.com/dselivanov/text2vec/issues网站
许可证: GPL-2基因|GPL-3公司|文件许可证[扩展自:GPL(≥2)|文件许可证]
网址: http://text2vec.org
需要编译:
材料: 自述 新闻
在视图中: 自然语言处理
CRAN检查: text2vec结果

文档:

参考手册: 文本2vec.pdf
渐晕图: GloVe单词嵌入
使用text2vec包分析文本

下载内容:

包源: 文本2vec_0.6.4.tar.gz
Windows二进制文件: r-devel公司:文本2vec_0.6.4.zip,r版本:文本2vec_0.6.4.zip,r-oldrel:文本2vec_0.6.4.zip
macOS二进制文件: r释放(arm64):文本2vec_0.6.4.tgz,r-oldrel(arm64):文本2vec_0.6.4.tgz,r-release(x86_64):文本2vec_0.6.4.tgz,r-oldrel(x86_64):文本2vec_0.6.4.tgz
旧来源: text2vec存档

反向依赖关系:

反向进口: conText(conText),千克描记器,新加坡国立大学,占用率测量,心灵文字Vec,调整工具,文本2地图,文本管理器,ttgsea公司,摇摆器,单词沙拉
反向建议: 空军教育,fdm2id公司,石灰,乌龙,测谎仪,情感.ai,文本食谱
反向增强: 夸特达

链接:

请使用规范形式https://CRAN.R-project.org/package=text2vec链接到此页面。