×

纳入不规则测量的高维生物标记物的时间-风险模型。 (英语) Zbl 1453.62731号

总结:具有时间-事件结果的临床研究通常收集大量时变协变量随时间变化的测量值(例如,临床评估或神经成像生物标记物),以建立时间敏感的预后模型。然而,资源密集型或侵入性(例如腰椎穿刺)数据收集过程意味着生物标记物可能很少测量,因此,并非在每个观察到的事件时间点都可用。因此,利用所有可用的时变生物标记物对改进我们的模型事件发生率非常重要。我们提出了一种基于核平滑的方法,该方法可以跨对象借用信息,以解决时变风险模型下生物标记物测量不频繁和不平衡的问题。提出了一种惩罚伪似然函数用于估计,并采用了与交替方向乘法器方法相关的高效增广惩罚最小化算法进行计算。给定用于控制近似偏差和随机变异性的几个正则性条件,我们表明即使在超高维存在的情况下,该方法也能以高概率选择重要的生物标志物。我们通过仿真研究表明,我们的方法在估计和选择性能方面优于现有方法。最后,我们将所提出的方法应用于实际数据,利用纵向全脑结构磁共振成像生物标记物对时间-疾病转换进行建模。结果表明,与当前标准相比,性能有了显著改善,包括仅使用基线度量。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62M10个 统计学中的时间序列、自相关、回归等(GARCH)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Alexander-Bloch,A.、Giedd,J.N.和Bullmore,E.(2013年)。人脑区域之间的成像结构协方差。《自然评论神经科学》14,322-336。
[2] Andersen,P.K.和Liestol,K.(2003)。生存分析中不经常更新的协变量引起的衰减。生物统计4633-649·Zbl 1197.62141号
[3] Boyd,S.、Parikh,N.、Chu,E.、Peleato,B.和Eckstein,J.(2011)。通过交替方向乘数法进行分布式优化和统计学习。机器学习的基础和趋势3,1-122·Zbl 1229.90122号
[4] Bradic,J.、Fan,J.和Jiang,J.(2011)。具有np维的coxs比例风险模型的正则化。《统计年鉴》393092-3120·Zbl 1246.62202号
[5] Bullmore,E.T.和Bassett,D.S.(2011年)。脑图:人脑连接体的图形模型。临床心理学年度回顾,7113-140。
[6] Cao,H.、Churpek,M.M.、Zeng,D.和Fine,J.P.(2015)。具有稀疏纵向协变量的比例风险模型分析。《美国统计协会杂志》110,1187-1196·Zbl 1373.62482号
[7] Cao,H.、Zeng,D.和Fine,J.P.(2014)。稀疏异步纵向数据的回归分析。英国皇家统计学会杂志:B辑(统计方法)77775-776·Zbl 1414.62326号
[8] Chen,T.、Wang,Y.、Chen,H.、Marder,K.和Zeng,D.(2014)。用于年龄相关分类的目标局部支持向量机。《美国统计协会杂志》109,1174-1187·Zbl 1368.62272号
[9] Desikan,R.S.、S´egonne,F.、Fischl,B.、Quinn,B.T.、Dickerson,B.C.、Blacker,D.、Buckner,R.L.、Dale,A.M.、Maguire,R.P.、Hyman,B.T.、Alberti,M.和Killiany,R.S(2006年)。一种自动标记系统,用于将MRI扫描的人类大脑皮层细分为感兴趣的回转区域。神经影像31,968-980。
[10] Dorsey,E.R.,研究员,H.S.G.C.等人(2012年)。一大组亨廷顿病患者及其亲属的特征,纳入队列研究。公共科学图书馆
[11] 1630LI等人。One7,e29522。
[12] Eidelberg,D.和Surmeier,D.J.(2011年)。亨廷顿舞蹈症的脑网络。临床研究杂志121,484-492。
[13] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。《美国统计协会杂志》96,1348-1360·兹比尔1073.62547
[14] Fan,J.和Lv,J.(2011)。具有np维的非凹陷惩罚似然。信息理论,IEEE事务57,5467-5484·Zbl 1365.62277号
[15] Feigin,A.、Tang,C.、Ma,Y.、Mattis,P.、Zgaljardic,D.、Guttman,M.、Paulsen,J.、Dhawan,V.和Eidelberg,D.(2007)。临床前亨廷顿病的丘脑代谢和症状发作。Brain130,2858-2867。
[16] Fleming,T.R.和Harrington,D.P.(2011年)。计数过程和生存分析。约翰·威利父子公司·Zbl 1079.62093号
[17] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型的坐标下降正则化路径。统计软件杂志33,1-22。
[18] Gould,L.A.、Boye,M.E.、Crowther,M.J.、Ibrahim,J.G.、Quartey,G.、Micallef,S.和Bois,F.Y.(2014)。生存和纵向非生存数据的联合建模:当前方法和问题。DIA贝叶斯联合建模工作组的报告。医学统计34,2181-2195。
[19] Handley,O.,Landwehrmeyer,B.,Committee,R.S.,调查员,E.R.等人(2012)。欧洲亨廷顿病网络登记:现状。神经病学、神经外科和精神病学杂志83,A47-A47。
[20] He,Y.,Chen,Z.和Evans,A.(2008)。阿尔茨海默病中大规模皮层网络异常拓扑模式的结构见解。《神经科学杂志》284756-4766。
[21] Honda,T.和H¨ardle,W.K.(2014)。变系数cox回归模型中的变量选择。《统计规划与推断杂志》148,67-81·Zbl 1432.62338号
[22] Honda,T.和Yabe,R.(2017年)。变系数cox模型的变量选择和结构识别。多元分析杂志161,103-122·Zbl 1373.62157号
[23] Huang,J.、Horowitz,J.L.和Wei,F.(2010)。非参数可加模型中的变量选择。《统计年鉴》38,2282-2313·Zbl 1202.62051号
[24] Lange,K.(2013)。MM算法。优化185-219。斯普林格。
[25] Langfelder,P.,Cantle,J.P.,Chatzopoulou,D.,Wang,N.,Gao,F.,Al-Ramahi,I.,Lu,X.-H.,Ramos,E.M.,El-Zein,K.,Zhao,Y.,Deverasetty,S.,Tebbe,A.,Schaab,C.,Lavery D.J.,Howland,D.,Kwak,S。,Horvath,S.,Yang,X.W.(2016)。综合基因组学和蛋白质组学定义了小鼠中亨廷顿蛋白cag长度依赖性网络。《自然神经科学》19,623-633。
[26] Li,X.,Xie,S.,Zeng,D.和Wang,Y.(2017)。基于增广和惩罚最小化的高效“0-范数特征选择”。医学统计,出版。
[27] Liu,J.,Huang,J.、Ma,S.和Wang,K.(2013)。使用平滑群体套索将群体相关性纳入全基因组关联研究。生物统计14,205-219。
[28] Liu,M.,Zhang,D.,Shen,D.,Initiative,A.D.N.等人(2014)。通过树结构稀疏学习识别信息成像生物标记物,用于广告诊断。神经信息学12,381-394。
[29] Liu,X.和Zeng,D.(2013)。右偏数据半参数变换模型中的变量选择。Biometrika100,859-876·Zbl 1279.62077号
[30] Long,J.D.、Langbehn,D.R.、Tabrizi,S.J.、Landwehrmeyer,B.G.、Paulsen,J.S.、Warner,J.和Sampaio,C.(2016)。亨廷顿病预后指数的验证。运动障碍32,256-263。
[31] MacDonald,M.E.,Ambrose,C.M.,Duyao,M.P.,Myers,R.H.,Lin,C.,Srinidhi,L.,Barnes,G.,Taylor,S.A.,James,M.,Groot,N.等人(1993年)。一种新的基因,含有一个在亨廷顿病染色体上扩张且不稳定的三核苷酸重复序列。牢房72,971-983。
[32] Meier,L.、Van De Geer,S.和B¨uhlmann,P.(2008)。该组套索用于逻辑回归。英国皇家统计学会杂志:B辑(统计方法)70,53-71·Zbl 1400.62276号
[33] Parikshak,N.N.、Gandal,M.J.和Geschwind,D.H.(2015)。神经发育和神经退行性疾病的系统生物学和基因网络。《自然评论遗传学》16,441-458。
[34] Paulsen,J.S.(2010年)。亨廷顿病的早期检测。未来神经病学5,85-104。
[35] Paulsen,J.S.、Long,J.D.、Johnson,H.J.、Aylward,E.H.、Ross,C.A.、Williams,J.K.、Nance,M.A.、Erwin,C.J.、Westervelt,H.J、Harrington,D.L.等人(2014a)。早产儿亨廷顿病的临床和生物标志物变化显示了试验的可行性:为期十年的预测性hd研究。衰老神经科学前沿6,78。
[36] Paulsen,J.S.、Long,J.D.、Ross,C.A.、Harrington,D.L.、Erwin,C.J.、Williams,J.K.、Westervelt,H.J.、Johnson,H.J.、Aylward,E.H.、Zhang,Y.等人(2014b)。用临床和影像学方法预测明显的亨廷顿病:一项前瞻性观察研究。《柳叶刀神经病学》13,1193-1201。
[37] Prentice,R.(1982)。失效时间回归模型中的协变量测量误差和参数估计。生物特征69,331-342·Zbl 0523.62083号
[38] Razavian,N.S.、Moitra,S.、Kamisetty,H.、Ramanathan,A.和Langmead,C.J.(2010年)。分子动力学数据的时变高斯图形模型。技术报告。
[39] 里佐普洛斯博士(2011年)。纵向和时间-事件数据联合模型中的动态预测和预期精度。生物统计学67,819-829·Zbl 1226.62124号
[40] Ross,C.A.、Aylward,E.H.、Wild,E.J.、Langbehn,D.R.、Long,J.D.、Warner,J.H.、Scahill,R.I.、Leavitt,B.R.、Stout,J.C.、Paulsen,J.S.等人(2014)。亨廷顿病:自然史、生物标志物和治疗前景。《自然评论神经病学》10204-216。
[41] Ryan,N.P.、Catroppa,C.、Cooper,J.M.、Beare,R.、Ditchfield,M.、Coleman,L.、Silk,T.、Crossley,L.,Beauchamp,M.H.和Anderson,V.A.(2015)。对发育中的大脑进行全面侮辱后出现的年龄依赖性社会认知缺陷:一项使用敏感性加权成像的纵向前瞻性分析。人脑映射361677-1691。
[42] Schumaker,L.(2007)。样条函数:基本理论。剑桥大学出版社·Zbl 1123.41008号
[43] Simon,N.、Friedman,J.、Hastie,T.和Tibshirani,R.(2013)。稀疏的套索。计算与图形统计杂志22,231-245。
[44] Stuart,J.M.、Segal,E.、Koller,D.和Kim,S.K.(2003)。用于全球发现保守遗传模块的基因表达网络。科学302,249-255。
[45] Tabrizi,S.J.、Scahill,R.I.、Owen,G.、Durr,A.、Leavitt,B.R.、Roos,R.A.、Borowsky,B.、Landwehrmeyer,B.、Frost,C.、Johnson,H.等人(2013)。track-hd研究中早产儿和早期亨廷顿病表型进展和发病的预测因素:对36个月观察数据的分析。《柳叶刀神经病学》12,637-649。
[46] 1632LI等人。
[47] Taylor,J.M.、Park,Y.、Ankerst,D.P.、Proust-Lima,C.、Williams,S.、Kestin,L.、Bae,K.、Pickles,T.和Sandler,H.(2013)。使用联合模型实时预测前列腺癌复发。生物统计学69,206-213·Zbl 1272.62093号
[48] Tsiatis,A.A.和Davidian,M.(2001年)。具有误差测量的纵向协变量的比例风险模型的半参数估计。生物特征88,447-458·兹比尔0984.62078
[49] Tsiatis,A.A.和Davidian,M.(2004)。纵向和时间-事件数据的联合建模:概述。中国统计局14,809-834·Zbl 1073.62087号
[50] Yan,J.和Huang,J.(2012)。时变系数cox模型的模型选择。生物统计学68,419-428·Zbl 1251.62052号
[51] Zhang,C.-H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。《统计年鉴》38894-942·Zbl 1183.62120号
[52] Zhang,C.-H.和Zhang、T.(2012)。高维稀疏估计问题的凹正则化的一般理论。《统计科学》4576-593·Zbl 1331.62353号
[53] Zhang,Y.、Long,J.D.、Mills,J.A.、Warner,J.H.、Lu,W.和Paulsen,J.S.(2011)。将研究开始时的疾病进展与亨廷顿病风险个体进行索引。美国医学遗传学杂志B部分:神经精神遗传学156,751-763。
[54] Zhao,P.和Yu,B.(2006)。套索的模型选择一致性。J.马赫。学习。第7号决议,2541-2563·Zbl 1222.62008年
[55] Zhou,S.、Lafferty,J.和Wasserman,L.(2010)。时变无向图。机器学习80,295-319·Zbl 1475.62174号
[56] 哥伦比亚大学Mailman公共卫生学院生物统计学系,纽约10032,
[57] 美国。
[58] 电子邮件:XL2473@cumc.columbia.edu
[59] 美国北卡罗来纳大学教堂山分校生物统计学系,邮编:27599。
[60] 电子邮件:quefeng@email.unc.edu
[61] 美国北卡罗来纳大学教堂山分校生物统计学系,NC 27599
[62] 电子邮件:dzeng@email.unc.edu
[63] 哥伦比亚大学外科医生学院神经病学系,纽约10032,
[64] 美国。
[65] 电子邮件:ksm1@columbia.edu
[66] 美国爱荷华大学神经病学、精神病学和心理学系,邮编52242
[67] 电子邮件:jane-paulsen@uiowa.edu
[68] 哥伦比亚大学Mailman公共卫生学院生物统计学系,纽约10032。
[69] 电子邮件:yw2016@哥伦比亚。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。