×

全基因组关联研究中方差分量估计与汇总统计的统一框架。 (英语) Zbl 1383.62305号

摘要:线性混合模型(LMM)是遗传关联研究中最常用的工具之一。然而,估计LMM方差分量的标准方法——限制最大似然估计法(REML)——存在几个重要缺陷:REML需要研究中所有样本的个体水平基因型和表型,计算速度慢,并在病例对照研究中得出向下偏倚的估计值。为了弥补这些缺陷,我们提出了一个用于方差分量估计的替代框架,我们称之为MQS。MQS基于矩量法(MoM)和最小范数二次无偏估计(MINQUE)准则,将两种看似无关的方法——著名的Haseman-Elston回归(HE)和最近的LD得分回归(LDSC)引入同一统一的统计框架,我们提供了另一种数学上等价的高等教育形式,允许使用汇总统计。我们提供了LDSC的精确估计形式,以获得无偏且统计上更有效的估计。我们方法的一个关键特征是,它能够将使用所有样本计算的边际得分与使用一小部分随机个体(或来自适当参考群体的个体)计算的SNP相关信息配对,虽然能够产生几乎与使用完整数据计算这两个量一样准确的估计值。因此,我们的方法产生了无偏且统计有效的估计,并利用了汇总统计,而对于大型数据集,它的计算效率很高。通过对8个真实数据集的37种表型的模拟和应用,我们说明了我们的方法在群体研究中估计和划分SNP遗传力以及在家庭研究中估计遗传力的好处。我们的方法在GEMMA软件包中实现,可在http://www.xzlab.org/software.html.

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62J05型 线性回归;混合模型
92D20型 蛋白质序列,DNA序列

软件:

GEMMA公司
PDF格式BibTeX公司 XML格式引用