跳到内容

Flverest/前缀

存储库文件导航

CRAN_状态_标签 R-CMD检查 Codecov测试覆盖率

概述

顺序偏好数据集被许多研究团体使用包括但不限于使用推荐系统的人员,计算社会选择、投票系统和组合优化。

这个前缀R包提供了一组功能,使用户可以执行广泛的偏好分析任务,包括偏好聚合、成对比较摘要和方便的IO操作。这使得研究人员和其他专业人员更容易使用这些来执行常见的数据分析和预处理任务数据集。

安装

可以通过CRAN安装软件包

安装.包("前缀")

开发版本可以通过以下方式安装

#install.packages(“远程”)
遥控器::安装github("fleverest/前缀")

用法

前缀为处理来自表格格式以及从一个统一的PrefLib格式,包括将数据文件直接从PrefLib下载到您的R会话。

处理表格数据

偏好数据可以有多种形式。通常偏好数据为在其中一个中表示长的-每行对应的格式特定的排名为单曲选择项目:,例如:

身份证件 项目名称 排名
1 A类 1
1 B类 2
1 C类
2 A类
2 B类 2
2 C类 1
A类 2
B类 1
C类

长格式的项目{A、B、C}的三个订单。

此数据可以从数据帧偏好对象:

长的 <- 数据帧(身份证件 =代表(1:,每个 = ),项目名称 = 字母[代表(1:,)],排名 =c(c)(1,2,,,2,1,2,1,))首选项 <-首选项(长的,格式 = "长的",身份证件 = "身份证件",项目 = "项目名称",等级 = "排名")打印(首选项)
##[1][A>B>C][C>B>A][B>A>C]

另一种列出订单的方法是在单行,每列代表特定的等级项目:

A类 B类 C类
1 2
2 1
2 1

项目{A、B、C}的三个排序采用“排名”格式。

此数据可以从数据帧偏好对象:

排名 <- 矩阵(c(c)(1,2,,,2,1,2,1,),nrow公司 = ,旁观者 = 真的)列名(排名)<- 字母[1:]首选项 <-首选项(排名,格式 = "排名")打印(首选项)
##[1][A>B>C][C>B>A][B>A>C]

从PrefLib读取

这个Netflix奖是一个Netflix设计的竞赛旨在提高其准确性推荐系统。为了促进这一点,他们发布了关于已转换为首选项数据和可从前缀库,(贝内特和兰宁2007). 每个数据集包括一组3或4部电影的排名随机选择。这里我们只考虑一组电影的排名以说明前缀.

这样的PrefLib数据文件可以通过以下方式实时下载指定参数from_preflib=真在中读取回流功能:

网飞 <-读取回流("网飞/00004-00000138.soc",来自reflib = 真的)头部(网飞)
##首选项频率##1[Beverly Hills警察>坏女孩>M…]68##2[Mean Girls>Beverly Hills警察>M…]53##3[Beverly Hills警察>坏女孩>T…]49##4[Mean Girls>Beverly Hills警察>T…]44##5[Beverly Hills警察>任务:Impos…]39##6[木乃伊归来>贝弗利山庄…]37

每一行对应于数据集。分配每个订单的Netflix用户数量为在中给出频率列。在这种情况下,最常见的排序(68名选民指定相同的偏好)是以下内容:

打印(网飞$偏好[1],宽度 = 100)
##[1][Beverly Hills警察>刻薄女孩>任务:不可能II>木乃伊归来]

写入Preflib格式

前缀为编写优惠提供了方便的界面数据集设置为PrefLib格式。为了帮助用户首选项()函数自动计算数据集的指标生成有效的PrefLib文件所必需的。例如,我们可以写我们的首选项从早期开始:

写_预库(首选项)
##write_preflib(prefs)中的警告:缺少“title”:preflib格式需要指定标题。使用“NA”。##write_preflib(prefs)中的警告:缺少“publication_date”,使用今天的日期(2023-06-14)。##write_preflib(prefs)中的警告:缺少“modification_date”,使用今天的日期(2023-06-14)。##write_preflib(prefs)中的警告:缺少`modification_type`:preflib格式要求指定此项。使用##“不适用”。###文件名:不适用###标题:不适用###说明:###数据类型:soc###修改类型:不适用###与以下内容相关:###相关文件:###出版日期:2023-06-14###修改日期:2023-06-14###备选方案数量:3###票数:3###唯一订单数量:3###替代名称1:A###替代名称2:B###替代名称3:C## 1: 1,2,3## 1: 3,2,1## 1: 2,1,3

请注意,这会产生四个警告。每个警告对应一个官方PrefLib格式要求的字段,但可能不是对于内部使用卡是必要的。如果您的目标是发布一些数据对于PrefLib,必须解决这些警告。

项目使用前缀

这个新南威尔士州立法议会选举数据集使用前缀将公共选举数据集处理为PrefLib格式。

R包选举.dree使用前缀用于跟踪Dirichlet-tree模型观察到的选票。

工具书类

Bennett,J.和S.Lanning。2007年,“网飞奖”2007 KDD Cup研讨会会议记录,3-6.ACM。