%0期刊文章%1个城市:6695326%戈多伊,丹妮拉%阿曼迪,阿纳拉%C牛津,英国,英国%D 2006年%爱思唯尔科技有限公司。%信息系统杂志。%K集群,用户模型%编号4%电话247--265%R 10.1016/j.is.2005.02.008%基于概念聚类的用户兴趣建模%U型http://dx.doi.org/10.1016/j.is.2005.02.008%第31页%随着更多信息出现在网络上,人们对有效的个性化技术产生了越来越大的兴趣。基于Web文档内容和用户兴趣提供帮助的个人代理成为解决此问题的一个可行的替代方案。如果这些代理依赖于包含在用户配置文件中的用户知识,即通过观察用户行为收集的用户偏好和兴趣模型,那么获取和建模用户兴趣类别的能力已成为个人代理设计中的一个关键组成部分。用户配置文件必须在不同抽象级别上总结与不同用户信息兴趣相对应的类别,以便代理能够决定新信息的相关性。为了实现这个目标,文档聚类提供了一个优点,即不需要类别的先验知识,因此分类是完全无监督的。本文提出了一种文档聚类算法WebDCC(Web document Conceptual clustering),该算法对Web文档进行增量、无监督的概念学习,以获取用户档案。与大多数用户分析方法不同,该算法提供了易于理解的集群解决方案,用户和其他代理都可以轻松地解释和探索这些解决方案。通过从网页中提取语义,该算法还生成了中间结果,最终可以集成到机器可理解的格式中,如本体。在智能Web搜索代理环境中使用该算法的实验结果证明,该算法在建议Web页面时可以达到较高的准确性。