sparkwarc:将WARC文件加载到Apache Spark中

使用“sparkyr”将WARC(Web ARChive)文件加载到Apache Spark中。这个允许从公共爬网项目中读取文件<http://commoncraw.org/>.

版本: 0.1.6
进口: 数据库接口,闪耀之星,卢比
链接到: 卢比
出版: 2022-01-11
作者: 哈维尔·卢拉斯基[aut],李一涛ORCID标识[aut],埃德加·鲁伊斯
维护人员: 埃德加·鲁伊斯(Edgar Ruiz)<Edgar at rstudio.com>
错误报告: https://github.com/r-spark/sparkwarc
许可证: Apache许可证2.0
需要编译: 是的
系统要求: C++11语言
材料: 自述文件
CRAN检查: sparkwarc结果

文档:

参考手册: 斯巴达.pdf

下载内容:

包源: 斯帕克沃尔克_0.1.6.tar.gz
Windows二进制文件: r-devel公司:sparkwarc_0.1.6.zip,r版本:sparkwarc_0.1.6.zip,r-oldrel:sparkwarc_0.1.6.zip
macOS二进制文件: r释放(arm64):斯帕克沃尔克0.1.6.tgz,r-oldrel(arm64):斯帕克沃尔克0.1.6.tgz,r-版本(x86_64):斯帕克沃尔克0.1.6.tgz,r-oldrel(x86_64):斯帕克沃尔克0.1.6.tgz
旧来源: sparkwarc档案

链接:

请使用规范形式https://CRAN.R-project.org/package=sparkwarc链接到此页面。