×

综述:用于将高维遗传数据转换为低维的反向低阶方差分析模型。 (英语) Zbl 1416.62415号

摘要:综述了遗传数据分析的一般建模方法。我们回顾了ANOVA型模型,该模型可以在一个建模框架中处理连续和离散遗传变量。与通常将表型变量设置为响应的回归型模型不同,该ANOVA模型将表型变量视为解释变量。通过对表型变量进行反向处理,将常见的高维问题转化为低维问题。相反,方差分析模型总是包括遗传位置和表型变量之间的交互作用项,以发现它们之间的潜在关联。通过双线性项的乘法,将交互项设计为低秩,以便将所需的参数数量保持在可管理的程度。我们通过微阵列和SNP数据集将回顾的ANOVA模型与其他流行方法的性能进行了比较。

MSC公司:

62J10型 方差和协方差分析(ANOVA)
62页第10页 统计学在生物学和医学科学中的应用;元分析
62-02年 与统计有关的研究展览(专著、调查文章)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿龙,美国。;北巴尔凯。;诺特曼,D。;Gish,K。;麦克,S。;Levine,J.,通过寡核苷酸阵列探测肿瘤和正常结肠组织的聚类分析揭示的广泛基因表达模式,美国国家科学院学报,96,6745-6750(1999)
[2] Canete-Soler,R。;Schlaepfer,W.W.,运动神经元病基因型和表型之间的复杂关系,《神经病学年鉴》,62,1,8-14(2007)
[3] 克莱恩,M.S。;布鲁姆,J。;考利,S。;克拉克,T.A。;胡建生。;Lu,G.,ANOSVA:从表达数据检测剪接变异的统计方法,生物信息学,21,1,107-115(2005)
[4] de Leeuw,J.,通过迭代奇异值分解对二进制数据进行主成分分析,计算统计学和数据分析,50,1,21-39(2006)·Zbl 1429.62218号
[5] 范,J。;Li,R.,通过非一致惩罚似然进行变量选择及其预言性质,美国统计协会杂志,96,456,1348-1360(2001)·Zbl 1073.62547号
[6] 他,Q。;Lin,D.-Y.,《全基因组关联研究的变量选择方法》,生物信息学,27,1,1-8(2011)
[7] 霍尔,A.E。;Kennard,R.W.,《岭回归:非正交问题的有偏估计》,技术计量学,12,1,55-67(1970)·Zbl 0202.17205号
[8] 亨特·D·R。;Lange,K.,《MM算法教程》,《美国统计学家》,1,1,30-37(2004)
[9] 亨特·D·R。;Li,R.,使用MM算法的变量选择,《统计年鉴》,33,4,1617-1642(2005)·Zbl 1078.62028号
[10] 爱尔兰共和国。;霍布斯,B。;科林,F。;Beazer-Barclay,Y.D。;Antonellis,K.J。;谢尔夫,U.,《高密度寡核苷酸阵列探针水平数据的探索、归一化和总结》,生物统计学,4,2,249-264(2003)·兹比尔1141.62348
[11] Jaakkola,T。;Jordan,M.,通过变分方法进行贝叶斯参数估计,统计学与计算,10,25-37(2000)
[12] Jung,Y。;黄J.Z。;Hu,J.,关联研究中的生物标记检测:通过logistic ANOVA同时建模SNP,美国统计协会杂志,109,508,1355-1367(2014)·Zbl 1368.62284号
[13] Jung,Y。;张,H。;Hu,J.,用于高维变量选择的转换低阶方差分析模型,《医学研究中的统计方法》(2018),第0962280217753726页。PMID:29384042。网址:http://dx.doi.org/10.1177/0962280217753726
[14] Lee,S。;黄J.Z。;胡杰,二进制数据的稀疏逻辑主成分分析,应用统计学年鉴,4,3,1579-1601(2010)·Zbl 1202.62084号
[15] McElroy,J。;克里,B。;Caillier,S。;格雷格森,P。;赫伯特,J。;Khan,O.,《改善非裔美国人MHC与多发性硬化症的关系》,《人类分子遗传学》,19,15,3080-3088(2010)
[16] 奥斯·雷利,P.F。;霍加特,C.J。;Pomyen,Y。;卡尔博利,F.C.F。;Elliott,P。;Jarvelin,M.-R.,MultiPhen:多表型联合模型可以增加GWAS中的发现,PLoS One,7,5,e34861(2012)
[17] Purdom,E。;辛普森,K.M。;医学博士罗宾逊。;Conboy,J.G。;拉普克,A.V。;Speed,T.P.,FIRMA:从外显子阵列数据中检测选择性剪接的方法,生物信息学,24,1511707-1714(2008)
[18] 拉马戈帕兰,S。;Maugeri,N。;Handunnetthi,L。;Lincoln,M。;奥尔顿,S。;Dyment,D.,多发性硬化症相关MHC II类等位基因HLA-DRB1*1501的表达受维生素D调控,PLoS遗传学,5,2,e1000369(2009)
[19] Schwarz,G.,估算模型的维度,《统计年鉴》,6,2,461-464(1978)·Zbl 0379.62005年
[20] 史泰利,J.R。;琼斯,E。;Kaptoge,S。;Butterworth,A.S。;Sweeting,M.J。;Wood,A.M.,《用于队列和病例组设计全基因组关联研究的cox和logistic回归的比较》,《欧洲人类遗传学杂志》,25,854-862(2017)
[21] Tibshirani,R。;桑德斯,M。;Rosset,S。;朱,J。;K.奈特(K.K.Knight),《通过融合套索实现的稀疏与平滑》,《皇家统计学会杂志》(Journal of Royal Statistical Society)。B系列:统计方法,67,1,91-108(2005)·兹比尔1060.62049
[22] Waldron,L。;Pintile,M。;曹,M.-S。;谢泼德,F.A。;Huttenhower,C。;Jurisica,I.,《惩罚回归方法在不同基因组数据中的优化应用》,生物信息学,27,24,3399-3406(2011)
[23] Wang,L。;陈,G。;Li,H.,微阵列时间进程基因表达数据的群扫描回归分析,生物信息学,23,12,1486-1494(2007)
[24] Wang,L。;Kim,Y。;Li,R.,超高维非凸惩罚回归的校准,《统计年鉴》,41,5,2505-2536(2013)·Zbl 1281.62106号
[25] Wang,H。;李,B。;Leng,C.,具有发散参数数的收缩率调谐参数选择,英国皇家统计学会杂志。B.系列统计方法,71,3,671-683(2009)·Zbl 1250.62036号
[26] Wang,H。;李,R。;Tsai,C.-L.,平滑剪裁绝对偏差方法的调整参数选择器,Biometrika,94,3,553-568(2007)·Zbl 1135.62058号
[27] Wu,B.,使用惩罚线性回归模型的差异基因表达检测:改进的SAM统计,生物信息学,21,8,1565-1571(2005)
[28] Zhang,C.-H.,最小最大凹惩罚下的几乎无偏变量选择,《统计年鉴》,38,2,894-942(2010)·Zbl 1183.62120号
[29] 邹,H。;Hastie,T.,《通过弹性网的正则化和变量选择》,《皇家统计学会杂志》。B系列:统计方法,67,2,301-320(2005)·兹比尔1069.62054
[30] 邹,H。;哈斯蒂,T。;Tibshirani,R.,《关于套索的“自由度”》,《生物计量学》,35,5,2173-2192(2007)·Zbl 1126.62061号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。