用于测量文档之间的相似性和检测的工具重复使用的通道。实现瓦状n-gram,跳过n-gram,和其他标记器;相似性/差异性函数;成对地比较;minhash和位置敏感哈希算法;和aSmith-Waterman局部对齐算法的版本适用于自然语言。
请使用规范形式https://CRAN.R-project.org/package=文本重用链接到此页面。