计算机应用››2016,第36卷››问题(9): 2531-2534.内政部:10.11772/j.issn.1001-9081.2016.09.2531

• 人工智能 • 上一篇   下一篇

基于信息熵和时效性的协同过滤推荐

刘江冬,梁刚,冯程,周泓宇  

  1. 四川大学 计算机学院, 成都 610065
  • 收稿日期:2015-12-18 修回日期:2016-03-17 出版日期:2016-09-10 发布日期:2016-09-08
  • 通讯作者:梁刚
  • 作者简介:刘江冬(1989-),男,湖北荆门人,硕士研究生,主要研究方向:机器学习、推荐系统;梁刚(1976-),男,四川成都人,讲师,博士,主要研究方向:机器学习、智能计算;冯程(1991-),男,贵州遵义人,硕士研究生,主要研究方向:机器学习、谣言检测;周泓宇(1990-),男,重庆人,硕士研究生,主要研究方向:数据分析。

基于熵和及时性的协同过滤推荐

刘江东,梁刚,冯成(音),周宏宇  

  1. 四川大学计算机科学学院,中国四川成都610065
  • 收到:2015-12-18 修订过的:2016-03-17 在线:2016-09-10 出版:2016-09-08

摘要:针对协同过滤推荐算法存在的噪声数据问题,提出了用户信息熵模型。用户信息熵模型结合信息论中信息熵的概念,采用信息熵的大小衡量用户信息的含量,利用用户评分数据得到用户的信息熵,过滤信息熵低的用户,从而达到过滤噪声数据的目的。同时,将用户信息熵模型和项目时效性模型相结合,项目时效性模型利用评分数据上下文信息获得项目的时效性,能有效缓解协同过滤的数据稀疏性问题。实验结果表明提出的算法能有效过滤噪声数据,提高推荐精度,与基础算法相比,推荐精度提高了1.1%左右。

关键词: 推荐系统, 协同过滤, 噪声数据, 数据稀疏性, 信息熵, 时效性

摘要:针对协同过滤推荐中的噪声数据问题,提出了用户熵模型。用户熵模型结合了信息论中熵的概念,利用信息熵来度量用户信息的内容,通过计算用户的熵来过滤噪声数据,去除低熵用户。同时,将用户熵模型与项目时效模型相结合,项目时效模型利用评分数据的上下文信息获取项目的时效性,缓解了协同过滤算法中的数据稀疏问题。实验结果表明,该算法能有效滤除噪声数据,提高推荐精度,推荐精度比基本算法提高约1.1%。

关键词: 推荐系统, 协同过滤, 噪声数据, 数据稀疏性, 信息熵, 及时性

中图分类号: