显示带有标签的帖子服务器.显示所有帖子
显示带有标签的帖子服务器.显示所有帖子

2010年2月19日星期五

挖掘资源-BibSonomy中的全文搜索

背景:
一段时间以来,我们一直在重新设计BibSonomy的全文搜索后端,现在我们认为它已经足够成熟,可以控制BibSonomy的所有搜索请求。

我们的旧后端基于MySQL数据库,使用MyISAM公司存储引擎。但随着你的帖子每天都在扩大搜索索引,我们几乎达到了服务器的容量。为了寻找一种更有效的实现全文搜索的方法,我们偶然发现了Lucene,这是一个高度优化的搜索引擎库,自2001年9月以来,它被Apache Jakarta Project家族合并。

现在,BibSonomy的所有全文搜索查询都由两个冗余的Lucene索引处理,每5分钟更新一次。

对您日常“BibSonomy体验”的影响:
首先,切换到Lucene是准备服务器以处理更多加入BibSonomy社区的用户的一个重要步骤,因为搜索任务现在是分开的,可以分布在多台独立的机器上。其次,我们希望减少BibSonomy已经很小的响应时间。但最后,我们现在支持更复杂的搜索查询,如“协同AND(b*标记OR资源*)".

如果您有任何建议或遇到任何问题,请联系我们.

快乐标签!

热门帖子