GroupLens Research从MovieLens网站收集并提供了评级数据集(网址:https://movielens.org). 根据数据集的大小,在不同的时间段收集数据集。在使用这些数据集之前,请查看其README文件以了解使用许可证和其他详细信息。

寻求许可?如果您有兴趣获得使用MovieLens数据集的许可,请首先阅读README文件中包含的使用条款。那么,请填写这张表格请求使用。我们通常不允许公共再分配(参见卡格尔如果您担心可用性,请选择其他下载位置)。


推荐用于新研究

 

电影镜头32M

 

MovieLens标签基因组数据集2021

从应用于9734部电影的1084个标签池中计算出1050万个标签电影相关性得分。发布日期:2021年12月。该数据集还包含使用原始过程(Vig et al.2012)和最近的改进(Kotkov et al.2021)生成标签基因组所需的输入

永久链接:https://grouplens.org/datasets/movielens/tag-genome-2021


建议用于教育和发展

 

MovieLens最新数据集

这些数据集将随时间而变化,不适合报告研究结果。我们将保持下载链接稳定,以便自动下载。我们不会存档或提供以前发布的版本。

小型:600名用户对9000部电影应用了100000个收视率和3600个标签应用程序。上次更新时间:2018年9月。

完全:330975名用户对86000部电影应用了大约33000000个收视率和2000000个标签应用程序。包括1100个标签中1400万相关分数的标签基因组数据。上次更新时间:2018年9月。

永久链接:https://grouplens.org/datasets/movielens/latest/


合成数据集

 

MovieLens 1B合成数据集

MovieLens 1B是一个合成数据集,它是ML-20M 2000万真实世界评分的扩展,用于支持MLPerf公司。请注意,这些数据以.npz文件的形式分发,您必须使用python和numpy读取.

此处提供了扩展算法的代码:https://github.com/mlperf/training/tree/master/data_generation网站

为了创建上述数据集,我们运行了算法(使用commit 1c6ae725a81d15437a2b2df05cac0673fde5c3a4),如README中“运行推荐基准指令”一节所述。

永久链接:https://grouplens.org/datasets/movielens/movielens-1b/


较旧的数据集

 

MovieLens 100K数据集

 

MovieLens 1M数据集

 

MovieLens 10M数据集

 

MovieLens 20M数据集

电影镜头20M 电影分级.稳定的基准数据集。138000名用户对27000部电影应用了2000万次收视率和465000个标签应用程序。包括1100个标签的1200万相关分数的标签基因组数据。2015年4月发布;2016年10月更新,更新links.csv并添加标签基因组数据。

另请参阅MovieLens 20M YouTube预告片数据集获取MovieLens电影和YouTube上播放的电影预告片之间的链接。

永久链接:https://grouplens.org/datasets/movielens/20m网站/

 

2014年MovieLens标签基因组数据集

1100万个标签应用于10000部电影,计算出1100万条标签与电影的相关性得分。发布日期:2014年3月。

还可以考虑使用MovieLens 20M或最新数据集,其中还包含(更新的)标签基因组数据或Tag Genome 2021数据集.

永久链接:https://grouplens.org/datasets/movielens/tag-genome/

 

MovieLens 25M数据集