CASMAP简介

博登汉姆院长

2018年6月27日

介绍

这个CASMAP公司该包提供了在二元数据中搜索组合关联的方法,同时将分类协变量考虑在内。主要有两种模式:搜索基于区域的映射或搜索高阶上位交互作用。

创建级联映射物体

要创建CASMAP公司对象,则必须指定模式。下面的第一个示例创建了一个对象,该对象将执行基于区域的GWAS搜索,然后将目标系列错误率设置为0.01.

下一个示例显示了如何创建一个搜索任意组合的对象,即高阶上位搜索。注意,在通过设置阿尔法.

通过打印对象,可以看到某些信息。这个领域最大组合大小=0表示将考虑所有可能长度的组合。在未来的版本中,可以限制此数字,例如限制为maxmimum长度4的组合。

##CASMAP对象具有:##*模式=高阶外延##*目标FWER=0.01##*最大组合大小=0##*未读取输入文件

读取数据文件

创建对象后,下一步是读取数据文件。这个读行命令,并且应为参数指定数据文件的路径基因型文件,表型文件和(可选)协变量文件。我们随软件包提供了示例数据文件,以及用于轻松获取这些数据文件路径的函数:

##CASMAP对象具有:##*模式=地区GWAS##*目标FWER=0.05##*最大组合大小=0##*读取输入文件##*协变量=真

数据格式

请注意CASMAP公司方法希望数据文件是由空格分隔的文本文件0s和1s、 在中\(p\次n\)矩阵,其中每个\(p\)行是一个功能,每个\(n\)列是一个示例/主题。标签和协变量文件是\(n\)条目,其中每个条目01。要查看数据格式的示例,请查看包含的示例文件,这些文件的路径由命令给定获取示例数据文件名,获取示例标签文件名获取示例变量文件名:

在未来版本中,将支持PLINK数据格式。

执行算法

读入数据、标签和协变量文件后,就可以执行算法了。只需使用执行命令。注意,根据数据集的大小,这可能需要一些时间。

提取结果

主要有两组结果:

  1. 总结结果
  2. 重要地区/重要互动信息

摘要结果提供了有关处理了多少区域/交互、多少区域/互动是可测试的,以及重要性和可测试阈值是什么的信息:

##已处理$n.int## [1] 18193## ##$n.int可测试## [1] 16426## ##$可测试性.threshold##[1]2.630268e-06号## ##$target.fwer(目标功率)## [1] 0.05## ##$已更正。有意义。阈值##[1]3.043955e-06

也可以使用编写摘要命令。

重要区域列出了所有被认为重要的区域。然而,这些区域可能重叠成簇。可以使用获取重要集群代表命令。在下面的示例中,只有一个重要区域,因此它是自己的集群代表:

##开始-结束分数奇数比率值##1 99 102 24.56281 16.12821 7.192676e-07号
##开始-结束分数奇数比率值##1 99 102 24.56281 16.12821 7.192676e-07号

请注意\(p\)-区域/代表的价值和比值比随位置一起提供。

对于高阶外延模式,方法获取重要交互应该使用(并且没有集群代表)。

其他示例

也可以在没有任何协变量的情况下执行搜索:

##CASMAP对象具有:##*模式=地区GWAS##*目标FWER=0.05##*最大组合大小=0##*已读取输入文件##*协变量=假

设置编码方法

二进制数据可以用显性或隐性编码进行编码。的默认值读行占主导地位的,但也可以明确指定编码:

未来版本

请注意,包的未来版本将包括读取PLINK文件的选项,以及设置最大组合长度的选项。