epubr:读取EPUB文件元数据和文本

提供支持从EPUB文件读取和解析内部电子书内容的功能。“epubr”包提供了支持从EPUB文件读取和解析内部电子书内容的功能。电子书元数据和文本内容被单独解析,并在一个整洁、嵌套的易懂数据框架中连接在一起。电子书的格式并没有在所有文献中完全标准化。在任意的电子书集合中管理经过解析的电子书内容可能是一项挑战以完美且完全通用的形式,生成单一且格式一致的输出。许多EPUB文件甚至在各自的元数据中不包含所有相同的信息。此包中的EPUB文件解析功能用于任意EPUB电子书的相对通用应用程序。然而,格式不佳的电子书或格式极不常见的电子书可能无法使用此软件包。甚至有可能出现EPUB文件具有DRM或其他一些属性,无法使用“epubr”进行读取的情况。大多数情况下,文本按“原样”阅读。唯一的名义变化是小的替换,例如将大引号改为直引号。作为文本分析的一部分,用户随后将进行实质性更改。用户可以自行决定执行其他文本清理,例如使用“tm”或“qdap”等软件包中的功能。

版本: 0.6.5
进口: xml语言2,xslt(xslt),马格里特,易怒的,数字播放器,第三年
建议: 测试那个,针织物,rmarkdown公司,阅读器
出版: 2024-09-11
内政部: 10.32614/CRAN.包装.epubr
作者: 马修·莱昂纳维茨ORCID标识[aut,cre]
维护人员: 马修·莱昂纳维茨(Matthew Leonawicz)<rpkgs at pm.me>
错误报告: https://github.com/ropensci/epubr/issues
许可证: 麻省理工学院+文件许可证
网址: https://docs.ropensci.org/epubr/,https://github.com/ropensci/epubr
需要编译:
材料: 自述文件 新闻
CRAN检查: epubr结果

文档:

参考手册: epubr.pdf格式
守夜人: epubr简介(来源,R代码)

下载内容:

包源: epubr_0.6.5.tar.gz
Windows二进制文件: r-devel公司:电子邮箱0.6.5.zip,r版本:电子邮箱0.6.5.zip,r-oldrel:电子邮箱0.6.5.zip
macOS二进制文件: r释放(arm64):epubr_0.6.5.tgz,r-oldrel(arm64):epubr_0.6.5.tgz,r-release(x86_64):epubr_0.6.5.tgz,r-oldrel(x86_64):epubr_0.6.5.tgz
旧来源: epubr存档

链接:

请使用规范形式https://CRAN.R-project.org/package=epubr链接到此页面。