登录 以匿名身份登录/我的BiBiServ/注销
导航
利比亚石油公司
欢迎光临
下载
手动
工具书类
作者:R.Homann
简介

全文索引数据结构库(libfid)是一个便携式软件库,用于通过简单的C接口访问索引数据。它实现了从文件中读取索引数据以及执行诸如快速字符串匹配等常见操作的函数。可打印和二进制字母之间的映射的简单字母表处理是从头开始集成的。目前,增强的后缀数组[2]是唯一支持的全文索引数据结构;稍后可能会添加其他内容。

介绍

随着计算机内存(无论是RAM还是硬盘)成本的降低,以及64位CPU的广泛可用性,这是一种可行的替代方案,或者伴随而来的是,在大型数据集中搜索的解决方案是使用全文索引数据结构,例如增强的后缀数组。在增强后缀数组上运行的搜索算法,相对于数据库大小而言,通常可以在对序列数据进行预处理并将其索引存储在硬盘上的成本。要了解后缀数组的一般介绍,请参阅请看[1],[2]中详细描述了增强后缀数组。

软件库libfid公司提供用于表示增强后缀数组的数据结构(唯一的索引数据当前支持的结构),并实现经常对其执行的许多操作。序列数据通常进行转换使用可自由定义的字母进行二进制表示。库可以处理生成的文件中存储的增强后缀数组通过mkESA公司[3] (与mkvtree从Vmatch公司Stefan Kurtz编写的包)。该库自带增强的后缀数组构造程序,但速度较慢并且仅用于库的测试套件。请考虑下载和使用我们更高级的程序mkESA公司用于处理真实数据。

我们的下载页面上提供了HTML格式的完整库API参考作为tarball。如果愿意,也可以从库源代码使用编程辅助工具.配置并运行make后(一些文件必须在Doxygen完成工作之前生成),只需运行Doxygen来构建HTML和LaTeX文档。

libfid根据GNU通用公共许可证(GPL)版本2或更高版本的条款免费提供。试试我们的下载第页。



建造于2015年3月4日(1:5896e685a83d)