约翰·普宁。;Krishnamoorthy,Mukkai S。;穆罕默德·扎基。 LOGML:用于web使用挖掘的日志标记语言。 (英语) Zbl 1048.68889号 Kohavi,Ron(ed.)等人,WEBKDD 2001——挖掘所有客户接触点的网络日志数据。第三届国际研讨会,美国加利福尼亚州旧金山,2001年8月26日。修订论文。柏林:施普林格出版社(ISBN 3-540-43969-2)。莱克特。票据计算。科学。2356, 88-112 (2002). 摘要:Web使用挖掘是指从存储在Web访问日志中的用户导航行为中发现有趣的信息。虽然从web日志中提取简单信息很容易,但挖掘复杂的结构信息非常具有挑战性。在应用挖掘之前,数据清理和准备是一项非常重要的工作。我们提出了两个新的XML应用程序,XGMML和LOGML,以帮助我们完成这项任务。XGMML是一种图形描述语言,LOGML是一种web-log报告描述语言。我们使用WWWPal系统的网络机器人为网站生成XGMML格式的网络图。我们从web日志文件和web图形为网站生成LOGML格式的web-log报告。我们进一步说明了LOGML在web使用挖掘中的有用性;我们展示了使用LOGML高效指定和实现挖掘算法(用于提取日益复杂的频繁模式)的简单性。有关整个系列,请参见[Zbl 0995.68618号]. 引用于2文件 MSC公司: 68单位99 计算方法和应用 68单位35 信息系统的计算方法(超文本导航、接口、决策支持等) 软件:铲刀;日志ML PDF格式BibTeX公司 XML格式引用 \textit{J.R.Punin}等人,Lect。票据计算。科学。2356、88——112(2002年;Zbl 1048.68889) 全文: 链接