Apache Lucene内核

Apache Lucene™是一个完全用Java编写的高性能、功能齐全的搜索引擎库。它是一种适用于几乎任何需要结构化的应用程序的技术搜索、全文搜索、分面搜索、最近邻居搜索高维向量、拼写更正或查询建议。

Apache Lucene是一个开源项目,可以免费下载。请使用访问Lucene的右侧链接。

Lucene™功能

Lucene通过一个简单的API提供强大的功能:

可扩展、高性能索引

  • 结束现代硬件800GB/小时
  • RAM需求小--只有1MB堆
  • 增量索引与批索引一样快
  • 索引大小约为索引文本大小的20-30%

强大、准确和高效的搜索算法

  • 排名搜索--首先返回最佳结果
  • 许多功能强大的查询类型:短语查询、通配符查询、邻近性查询、范围查询等
  • 现场搜索(例如标题、作者、内容)
  • 高维向量的最近邻搜索
  • 按任何字段排序
  • 具有合并结果的多重index搜索
  • 允许同时更新和搜索
  • 灵活的镶嵌、高亮显示、联接和结果分组
  • 快速、节省内存和容错的建议
  • 可插拔排名模型,包括向量空间模型奥卡皮BM25
  • 可配置存储引擎(编解码器)

在多个地方跟踪Apache Lucene的搜索性能。结账

跨平台解决方案