2008年11月11日,星期二

元数据擦除服务

正如Robert在上一篇博客文章中提到的那样,我们建立了一个抓取服务,通过从数字图书馆或出版商网站自动提取参考文献来支持用户处理引文。我们在BibSonomy中使用一个非常类似的服务来支持我们的用户,同时发布新的参考。然而,该服务独立于BibSonomy。我们的主要目标是让每个需要书目元数据的用户都能轻松访问其他网站的元数据。因此,我们以BibTeX格式提供提取的信息。大多数工具都允许导入BibTeX,因此每个人都可以很容易地将数据导入到自己的工具中。服务正在以下URL下运行:

http://scrapr.bibsonomy.org/

目前我们支持60多个不同的网站(在这里完整列表),我们正在进行进一步的扩展。在不久的将来,我们将在GPL下公开我们的刮板的源代码,我们希望其他人会发现它很有用,并开始通过实现他们自己的刮板来帮助我们。

这项服务是如何运作的?

原则上有两种使用服务的方式。一个使用so
称为bookmarklet,而另一个仅基于URL。如果您
拥有支持网站的网页,例如ACM数字图书馆
下页:

Logsonomey-使用logdata进行社会信息检索

那么你可以复制这个统一资源定位地址输入服务主页上的表格,服务将向您返回提取的BibTeX信息。由于这不是一种非常方便的访问数据的方式,我们提供了一个ScrapePublication按钮。此按钮是一小段JavaScript,可以复制到浏览器的工具栏。通过在访问数字图书馆网页时按下此按钮,URL将自动复制并发送到刮取服务,并提取元数据。

该服务有三个选项,可用于自定义它,并使其对其他系统有用。显然,其中一个参数是bookmarklet使用的URL本身。接下来是选择参数,它允许向服务发送文本,最后一个参数允许将输出格式从html更改为纯BibTeX。最后一个参数使得与其他系统的集成非常简单。

如果需要,我们也可以提供其他格式的元数据,但目前我们只支持BibTeX。

热门帖子