显示带有标签的帖子内部构件.显示所有帖子
显示带有标签的帖子内部构件.显示所有帖子

2010年2月19日星期五

挖掘资源-BibSonomy中的全文搜索

背景:
一段时间以来,我们一直在重新设计BibSonomy的全文搜索后端,现在我们认为它已经足够成熟,可以控制BibSonomy的所有搜索请求。

我们的旧后端基于MySQL数据库,使用MyISAM公司存储引擎。但随着你的帖子每天都在扩大搜索索引,我们几乎达到了服务器的容量。为了寻找实现全文搜索的更有效方法,我们偶然发现了Lucene,这是一个高度优化的搜索引擎库,自2001年9月以来由Apache Jakarta Project家族合并。

现在,BibSonomy的所有全文搜索查询都由两个冗余的Lucene索引处理,每5分钟更新一次。

对您日常“BibSonomy体验”的影响:
首先,切换到Lucene是为我们的服务器做好准备的重要一步,以应对更多加入BibEcomy社区的用户,因为搜索任务现在是分离的,可以分布在几个独立的机器之间。其次,我们希望减少BibSonomy已经很小的响应时间。但最后,我们现在支持更复杂的搜索查询,如“协同AND(b*标记OR资源*)".

如果您有任何建议或遇到任何问题,请联系我们.

快乐标签!

2008年3月14日星期五

本周特色:BibEconomic Inside

从本周最后一个功能开始,我们将于本周发布附加信息关于BibSonomy,这将有助于将BibSonomy集成到其他服务中,如图书馆的目录系统。如前所述FOTW公司BibSonomy依靠不同的散列键来查找类似的出版物。描述了计算这些键所需的信息在这里该页面包括一个小演示和一个java示例实现,该实现在BibSonomy中用于计算不同的散列键。此实现可用于计算其他系统中的相同哈希键。以及通过通过BibSonomy的API进行散列出版物的良好集成和社区摘要可以集成到每个系统中。

我们认为这是Bibsonomy与图书馆目录系统或任何其他类似系统更紧密集成的第一步。

热门帖子