×

在捕获-再捕获方法下估计互联网缓存目录中的新鲜度演变。 (英语) Zbl 1305.68034号

摘要:我们描述了一种新的网络抽样方案,用于测量搜索引擎中新鲜度的演变。所使用的方法是捕获-再捕获,主要用于估计野生动物生物学研究中的进化速率。经过必要的修改和修正后,我们在谷歌和MSN的缓存上进行了三次不同持续时间的捕获再捕获实验。同时,我们使用了一个典型的抽样方案,与文献中使用的许多其他网络抽样方法类似,来评估我们的建议的稳健性。本文提供了基于web的捕获-再捕获模型的实现细节及其评估。结果表明,通过捕获-再捕获方法,我们不仅能够测量测试的搜索服务的新鲜度,而且能够监测其随时间的演变,所需的采样实例数量大大减少。我们无意比较谷歌和MSN的表现。然而,通过我们的实验,我们观察到,虽然有时一种搜索服务的刷新率比另一种更好,但一般来说,这两种搜索服务在刷新目录和向用户提供新的最新结果方面的能力几乎相同。

MSC公司:

68英里11 互联网主题
PDF格式BibTeX公司 XML格式引用
全文: 内政部