迈拉·斯皮利奥普鲁;巴姆沙德·莫巴希尔;贝蒂娜·贝伦特;Miki中川 网络使用分析中会话重建启发式的评估框架。 (英语) Zbl 1238.68036号 信息J.计算。 15,第2期,171-190(2003)。 摘要:随着人们认识到网络信息挖掘在个性化服务、自适应网站和客户特征分析方面的潜力,它已成为深入研究的主题。然而,Web使用挖掘结果的可靠性在很大程度上取决于输入数据集的正确准备。特别是,会话重建中的错误和对站点中用户活动的不完整跟踪很容易导致无效模式和错误结论。在本研究中,我们评估了用于从服务器日志数据重建会话的启发式算法的性能。这种启发式方法首先由用户调用,然后由用户在站点中的访问来划分活动,其中用户标识机制(如cookie)可能可用,也可能不可用。我们提出了一组对两种重建错误敏感的性能度量,并适用于知识发现(KDD)应用程序中的不同应用程序。我们已经在基于框架的网站的Web服务器数据上测试了我们的框架。第一个实验涉及一个特定的KDD应用程序,并显示了启发式对站点结构和流量的特殊性的敏感性。第二个实验并不局限于特定的应用程序,而是比较不同度量以及不同应用程序类型的启发式算法的性能。我们的结果表明,不存在单一的最佳启发式,但我们的度量有助于分析人员选择最适合当前应用的启发式。 引用于4文件 MSC公司: 68英里11 互联网主题 关键词:网络使用挖掘;数据准备 PDF格式BibTeX公司 XML格式引用 \textit{M.Spiliopoulou}等人,《信息与计算》。15,第2号,171--190(2003;Zbl 1238.68036) 全文: 内政部