tidytext:使用“dplyr”、“ggplot2”和其他Tidy工具进行文本挖掘

使用整齐的数据原则可以完成许多文本挖掘任务更简单、更有效,并且与已经广泛使用的工具保持一致。使用整洁的数据进行文本挖掘所需的许多基础设施帧已经存在于诸如“dplyr”、“broom”、“tidyr”和“ggplot2”。在这个包中,我们提供了功能和支持数据设置以允许文本与整洁格式之间的转换,以及与在整洁工具和现有文本挖掘之间无缝切换包装。

版本: 0.4.2
取决于: R(≥2.10)
进口: 克莱,数字播放器(≥ 1.1.1),泛型,珍妮乌斯特恩,生命周期,矩阵、方法、,呜呜声(≥ 0.1.1),爱尔兰航空公司(≥ 0.4.10),字符串,易怒的,标记化器,压控变压器
建议: 扫帚,覆盖(covr),数据表,ggplot2,饥饿,针织物,木槌,自然语言处理,量子地,阅读器,重塑2,rmarkdown公司,规模,stm公司,关键词,测试那个(≥ 2.1.0),语句列,第三年,tm(tm),主题模型,vdiffr公司,文字云
出版: 2024-04-10
作者: 加布里埃拉·德奎罗斯,科林·费伊ORCID标识【ctb】,埃米尔·赫维特费尔特,Os Keyes公司ORCID标识【ctb】,卡尼什卡·米斯拉[ctb],蒂姆·马斯特尼,Jeff Erickson[ctb],大卫·罗宾逊[aut],朱莉娅·希尔奇ORCID标识[自动,创建]
维护人员: 朱莉娅·希尔格(Julia Silge)<Julia.Silge at gmail.com>
错误报告: https://github.com/juliasilge/tidytext/issues
许可证: 麻省理工学院+文件许可证
网址: https://juliasilge.github.io/tidytext网站/,https://github.com/juliasilge/tidytext
需要编译:
引用: tidytext引文信息
材料: 自述文件 新闻
在视图中: 自然语言处理
CRAN检查: tidytext结果

文档:

参考手册: 泰迪文本.pdf
渐晕图: 整齐项频率和反向文档频率(tf-idf)
转换文档-术语矩阵和语料库对象
tidytext简介

下载内容:

包源: tidytext_0.4.2.目标.gz
Windows二进制文件: r-预发布:tidytext_0.4.2.zip文件,r版本:tidytext_0.4.2.zip文件,r-oldrel:tidytext_0.4.2.zip文件
macOS二进制文件: r-prerel(臂64):tidytext_0.4.2.tgz,r-release(arm64):tidytext_0.4.2.tgz,r-oldrel(arm64):tidytext_0.4.2.tgz,r-prerel(x86_64):tidytext_0.4.2.tgz,r-release(x86_64):tidytext_0.4.2.tgz
旧来源: tidytext存档

反向依赖关系:

反向进口: akc公司,可获得的,河坝的,文献计量学,CINE公司,crsra公司,日程表,DistatisR公司,DOPE公司,外延层,费德雷格斯,ggpage(ggpage),GSEA采矿,iheiddown公司,LDA希尼,MadanText公司,MadanText网络,madshapR公司,玛格丽特,mi检索,穆德勒,自然学家,尼日利亚,阿片类药物,俄罗斯人,萨奥特,scicomtools软件,夏洛克,统计引号,发短信的人,文本预测,文本最小化GUI,潮间带,特森提姆,推特自动交易,暴发户,游览景点,杂草,维迪尔,水渍险
反向建议: 空军教育,cwb工具,欧莱克斯,葬礼,古腾堡,ibawds公司,LexisNexis工具,mvr平方,新闻主播,开放式介绍,波兰共和国,射频雷达,施鲁特,间隔(spacyr),spRingsteen公司,文本管理器,蒂迪罗,潮间带,特威特莫,vosonSML公司
反向增强: 量子地

链接:

请使用规范形式https://CRAN.R-project.org/package=tidytext链接到此页面。