×

使用纵向高维基因组数据预测有序反应的正则化方法。 (英文) Zbl 1306.92006号

摘要:有序量表通常用于衡量医院环境和转化医学研究中的健康状况和疾病相关结果。此外,在临床实践中,重复测量是追踪和监测复杂疾病进展的常见方法。基于统计推断的经典方法,尤其是序数建模,有助于分析响应类别有序且协变量数量(p)仍小于样本量(n)的数据。随着基因组技术的出现越来越多地应用于更准确的诊断和预后,产生了协变量数量(p)远大于样本数量(n)的高维数据。为了满足新出现的需求,我们引入了我们提出的模型,该模型是一个两阶段算法:将广义单调递增逐步向前(GMIFS)方法扩展到累积logit序数模型;并将GMIFS程序与经典的混合效应模型相结合,对疾病进展中的疾病状态进行时间分类。我们使用从炎症和宿主对损伤的反应研究中收集的时间进程微阵列数据集证明了所提出模型在分类中的效率和准确性。

MSC公司:

92B15号机组 普通生物统计学
92 C50 医疗应用(通用)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abramowitz,M.和I.A.Stegun(1972):《数学函数手册》,第1卷,纽约:多佛出版公司·Zbl 0543.33001号
[2] Bates,D.、M.Maechler和B.Bolker(2014):“lme4:使用特征和S4的线性混合效应模型。”R包版本1.1-7。;
[3] Bondell,H.D.、A.Krishna和S.K.Ghosh(2010):“线性混合效应模型中固定和随机效应的联合变量选择”,《生物统计学》,66,1069-1077·Zbl 1233.62134号
[4] 日分?lmann,P.(2006):“推动高维线性模型”,《统计年鉴》,34559-583·Zbl 1095.62077号
[5] Bühlmann,P.和S.van de Geer(2011):高维数据统计:方法、理论和应用,德国海德堡:施普林格·Zbl 1273.62015年
[6] Burgon,P.、W.Lee、A.Nixon、E.Peralta和P.Casey(2001):“g蛋白信号调节器的磷酸化和核移位(rgs10)”,《生物化学杂志》,276328-32834。;
[7] Chen,S.和F.D.Bowman(2011):“纵向高维数据的新型支持向量分类器及其在神经成像数据中的应用”,《统计分析与数据挖掘》,第4604-611页·Zbl 07260306号
[8] Chen,S.,E.Grant,T.T.Wu和F.D.Bowman(2014):“纵向高维数据的一些最新统计学习方法”,威利跨学科评论:计算统计学,6,10-18。;
[9] Christensen,R.H.B.(2013):“序数:序数数据的回归模型”,R包版本2013.9-30。;
[10] Efron,B.和C.Morris(1973):“Stein的估计规则及其竞争对手:经验贝叶斯方法”,《美国统计协会杂志》,68,117-130·Zbl 0275.62005号
[11] Efron,B.、T.Hastie,I.Johnstone和R.Tibshirani(2004):“最小角度回归”,《统计年鉴》,32,407-499·Zbl 1091.62054号
[12] Ezzet,F.和J.Whitehead(1991):“交叉试验顺序反应的随机效应模型”,《医学统计学》,第1090-1907页。;
[13] Fan,Y.和R.Li(2012):“线性混合效应模型中的变量选择”,《统计学年鉴》,第40期,2043-2068页·Zbl 1257.62077号
[14] Fatemi,S.(2001):“小鼠和人的Reelin突变:从Reelin小鼠到精神分裂症、情绪障碍、孤独症和无脑症”,《分子精神病学》,第6期,第129-133页。;
[15] Groll,A.(2014):“glmmLasso:通过L1-enalized估计对广义线性混合模型进行变量选择”,R包版本1.3.1·Zbl 1325.62139号
[16] Groll,A.和G.Tutz(2012):“通过l1-惩罚估计对广义线性混合模型进行变量选择”,《统计与计算》,第24期,第137-154页·Zbl 1325.62139号
[17] Harville,D.和R.Mee(1984):“用于分析有序分类数据的混合模型程序”,《生物计量学》,40393-408·Zbl 0565.62092号
[18] Hastie,T.、J.Taylor、R.Tibshirani和G.Walther(2007):“正向阶段回归和单调套索”,《电子统计杂志》,2007年,1-29·Zbl 1306.62176号
[19] Hastie,T.、R.Tibshirani和J.Friedman(2009):统计学习的要素:数据挖掘、推理和预测,第二版,纽约州纽约市:施普林格出版社·Zbl 1273.62005年
[20] Heagerty,P.J.和S.L.Zeger(1996):“聚类序数测量的边际回归模型”,《美国统计协会杂志》,91,1024-1036·Zbl 0882.62061号
[21] Hedeker,D.和R.Gibbons(1994):“多水平分析的随机效应序数回归模型”,《生物计量学》,50933-944·Zbl 0826.62049号
[22] Hedeker,D.和R.Gibbons(2006):纵向数据分析,新泽西州霍博肯:John Wiley&Sons,Inc·Zbl 1136.62075号
[23] Ibrahim,A.E.、Sarhane,K.A.、Fagan,S.P.和Goverman,J.(2013)。烧伤后肾功能障碍:综述。烧伤和火灾年鉴,26(1),16。;
[24] Karssen,A.,J.Li,S.Her,P.Patel,F.Meng,S.Evans,M.Vawter,H.Tomita,P.Choudary,W.E.Bunney,E.G.Jones,S.Watson,H.Akil,R.M.Myers,A.F.Schatzberg,and D.M.Lyons(2006):“微阵列技术在灵长类行为神经科学研究中的应用”,方法,38,227-234。;
[25] Li,C.和W.H.Wong(2001):“寡核苷酸阵列的基于模型的分析:模型验证、设计问题和标准错误应用”,《基因组生物学》,第2期,第1-11页。;
[26] Marshall,J.(1995):“多器官功能障碍评分:复杂临床结果的可靠描述”,《危重病医学》,第23期,1638-1652页。;
[27] McCullagh,P.(1980):“有序数据的回归模型(带讨论)”,《皇家统计学会杂志》;B系列,42,109-142·Zbl 0483.62056号
[28] McKibben,J.、M.Bresnick、S.Askay和J.Fauerbach(2008):“急性应激障碍和创伤后应激障碍:对严重烧伤样本的患病率、病程和预测因素的前瞻性研究”,《烧伤护理与研究杂志》,29,22-35。;
[29] Opgen-Rhein,R.和K.Strimmer(2014):“纵向:多时间进程数据分析”,R包1.1.9版·兹比尔1158.92311
[30] Park,M.Y.和T.Hastie(2007):“广义线性模型的L1正则化路径算法”,《皇家统计学会杂志:B辑(统计方法)》,69,659-677·Zbl 07555370号
[31] Pasta,D.(2009):“学习何时离散:连续预测与分类预测”,摘自SAS全球论坛,华盛顿特区。;
[32] Pinheiro,J.C.和D.M.Bates(1995):“非线性混合效应模型中对数似然函数的近似”,《计算与图形统计杂志》,第4期,第12-35页。;
[33] Pullamsetti,S.,L.Kiss,H.Ghofrani,R.Voswickel,P.Haredza,W.Klepetko,C.Aigner,L.Fink,J.Muyal;,N.Weissmann、F.Grimminger、W.Seeger和R.Schermuly(2005年):“肺动脉高压中不对称和对称二甲基精氨酸的水平增加和分解代谢减少”,FASEB杂志,第19期,第1175-1177页。;
[34] Renneberg,B.、S.Ripper、J.Schulze、A.Seehausen、M.Weiler、G.Wind、B.Hartmann、G.Germann和A.Liedl(2013):“严重烧伤后的生活质量和长期预后预测因素”,《行为医学杂志》,37,967-976。;
[35] Rivero,G.、A.Gabilondo、J.Garca-Sevilla、R.L.Harpe、B.Morentn和J.Meana(2010):“死后人脑中G蛋白信号rgs4和rgs10蛋白调节器的特征”,国际神经化学,57,722-729。;
[36] Rivero,G.、A.Gabilondo、J.Garca-Sevilla、L.Callado、R.L.Harpe、B.Morentin和J.Meana(2013):“精神分裂症患者的脑RGS4和RGS10蛋白表达与药物治疗的抑郁效应”,《精神药理学》,226,1-12。;
[37] Sahin,F.、W.Qiu、R.E.Wilentz、C.A.Iacobuzio-Donahue、A.Grosmark和G.H.Su(2005):“RPL38、FOSL1和UPP1主要表达于胰腺导管上皮”,胰腺,30,158。;
[38] Schapire,R.、Y.Freund、P.Bartlett和W.Lee(1998):“提高利润率:投票方法有效性的新解释”,《统计年鉴》,26,1651-1686·Zbl 0929.62069号
[39] Schelldorfer,J.(2014):“R包glmmixedlasso:带套索的广义线性混合模型”,见。;
[40] Schelldorfer,J.、P.Bühlmann和S.van de Geer(2011):“使用l1惩罚法估计高维线性混合效应模型”,《斯堪的纳维亚统计杂志》,38,197-214·Zbl 1246.62161号
[41] 谢尔多夫,J.,L.梅耶,P.布?lmann(2014):“GLMMLasso:使用l1-惩罚的高维广义线性混合模型算法”,《计算与图形统计杂志》,23,460-477。;
[42] Tai,Y.和T.Speed(2006):“重复微阵列时间进程数据的多元经验贝叶斯统计”,《统计年鉴》,342387-2412·Zbl 1106.62008号
[43] Yang,M.(2001):“多项式回归”,摘自A.Leyland和H.Goldstein编辑的《健康科学的多级建模》,纽约州纽约市:John Wiley&Sons。;
[44] Yang,H.(2007):“纵向数据分析中广义线性混合模型的变量选择程序”。北卡罗来纳州立大学博士论文。;
[45] Yuan,M.和C.Kendziorski(2006):“多生物条件下微阵列时间进程数据的隐马尔可夫模型(讨论)”,美国统计协会杂志,1011323-1340·Zbl 1171.62359号
[46] Zhang,Y.、R.Tibshirani和R.Davis(2013):“根据时间进程基因表达对患者进行分类”,《生物统计学》,第1487-98页。;
[47] Zhao,P.和B.Yu(2004):“助推套索”,加州大学伯克利分校技术报告。;
[48] Zhou,B.,W.Xu,D.Herndon,R.Tompkins,R.Davis,W.肖和W.H.Wong(2010):“因子时间历程微阵列分析及其在烧伤临床研究中的应用”,《国家科学院学报》,1079923-9928。;
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。