×

超高维半参数纵向数据分析。 (英语) Zbl 1520.62213号

摘要:随着超高维纵向数据在公共卫生和生物信息学等领域变得越来越明显,开发具有稀疏模型的灵活方法备受关注。在这种情况下,协变量的维数可能会随着簇数的增加呈指数增长。对于超高维纵向数据,我们考虑了一种灵活的半参数方法,即部分线性单指数模型。最重要的是,我们不仅允许部分线性协变量,而且允许非参数估计的未知柔性函数中的单指数协变量是超高维的。该方法使用惩罚广义估计方程,可以捕获被试之间的相关性,以平滑剪裁的绝对偏差惩罚执行同时变量选择和估计,并可以捕获非线性和预测因子之间的潜在交互作用。对于部分线性和非参数分量,我们建立了包括超高维预言性质在内的估计量的渐近理论,并提出了一种有效的算法来处理计算挑战。通过模拟研究和酵母细胞周期基因表达数据,我们证明了我们的方法和算法的有效性。
{©2020国际生物识别学会}

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bähler,J.(2005)芽殖酵母和裂变酵母中基因表达的细胞周期控制。遗传学年鉴,39,69-94。
[2] Banerjee,N.和Zhang,M.Q.(2003)确定控制酵母细胞周期的转录因子之间的合作性。核酸研究,31,7024-7031。
[3] Carroll,R.J.、Fan,J.、Gijbels,I.和Wand,M.P.(1997)广义部分线性单指数模型。美国统计协会杂志,92,477-489·Zbl 0890.62053号
[4] Chen,J.、Li,D.、Liang,H.和Wang,S.(2015)纵向数据部分线性单指数模型中的半参数GEE分析。《统计年鉴》,第43期,1682-1715页·Zbl 1317.62036号
[5] Cheng,C.和Li,L.M.(2008)从微阵列时间序列数据系统识别细胞周期调节转录因子。BMC基因组学,9116。
[6] Cheng,M.-Y。,Honda,T.、Li,J.和Peng,H.(2014)超高维纵向数据的非参数独立性筛选和结构识别。《统计年鉴》,第42期,1819-1849页·Zbl 1305.62169号
[7] Das,D.、Banerjee,N.和Zhang,M.Q.(2004)合作基因调控的交互模型。《美国国家科学院院刊》,10116234-16239。
[8] Fan,J.和Li,R.(2001)通过无条件惩罚似然及其预言性质进行变量选择。美国统计协会杂志,96,1348-1360·Zbl 1073.62547号
[9] Fan,J.和Lv,J.(2008)超高维特征空间的确定独立筛选。英国皇家统计学会杂志:B辑,70849-911·Zbl 1411.62187号
[10] Hoover,D.、Rice,J.、Wu,C.和Yang,L.(1998),具有纵向数据的时变系数模型的非参数平滑估计。生物特征,85,809-822·兹比尔0921.62045
[11] Huang,J.、Horowitz,J.和Wei,F.(2010)非参数可加模型中的变量选择。统计年鉴,38(4),2282-2313·Zbl 1202.62051号
[12] Hunter,D.R.和Li,R.(2005)使用MM算法的变量选择。《统计年鉴》,第33期,1617-1642页·Zbl 1078.62028号
[13] Inan,G.和Wang,L.(2017)PGEE:分析高维协变量纵向数据的R包。《R杂志》,9,393-402。
[14] Johnson,B.A.,Lin,D.和Zeng,D.(2008)半参数回归模型中的惩罚估计函数和变量选择。美国统计协会杂志,103,672-680·Zbl 1471.62330号
[15] Koch,C.和Nasmysy,K.(1994)酵母中的细胞周期调节转录。《细胞生物学最新观点》,6451-459。
[16] Lee,T.I.、Rinaldi,N.J.、Robert,F.、Odom,D.T.、Bar‐Joseph,Z.、Gerber,G.K.等人(2002)《酿酒酵母的转录调控网络》。《科学》,298799-804。
[17] Li,G.,Lai,P.和Lian,H.(2015)具有纵向数据的部分线性单指数模型的变量选择和估计。统计与计算,25579-593·Zbl 1331.62336号
[18] Lian,H.,Liang,H.和Wang,L.(2014)使用GEE对协变量数量发散的聚类数据的广义加性部分线性模型。《中国统计》,24173-196·Zbl 1285.62080号
[19] Luan,Y.和Li,H.(2003)使用带b样条的混合效应模型对时间进程基因表达数据进行聚类。生物信息学,19474-482。
[20] Ma,S.,Liang,H.和Tsai,C.-L。(2014)重复测量的部分线性单指数模型。多元分析杂志,130,354-375·Zbl 1292.62060号
[21] Song,R.,Yi,F.和Zou,H.(2014)关于高维变系数模型的变系数独立筛选。中国统计局,241735-1752·Zbl 1480.62151号
[22] Spellman,P.T.、Sherlock,G.、Zhang,M.Q.、Iyer,V.R.、Anders,K.、Eisen,M.B.等(1998)通过微阵列杂交对酿酒酵母细胞周期调控基因的全面鉴定。细胞分子生物学,93273-3297。
[23] Tibshirani,R.(1996)通过套索进行回归收缩和选择。英国皇家统计学会杂志:B辑(方法学),58267-288·Zbl 0850.62538号
[24] Touloumis,A.(2016)在边际模型规范下模拟相关二进制和多项式响应:SimCorMultRes包。《R杂志》,第879-91页。
[25] 香港蔡。,卢·H·H·S。和Li,W.H。(2005)鉴定酵母细胞周期转录因子的统计方法。《美国国家科学院院刊》,10213532-13537。
[26] Wang,L.,Chen,G.和Li,H.(2007)微阵列时间进程基因表达数据的组SCAD回归分析。生物信息学,231486-1494。
[27] Wang,L.,Zhou,J.和Qu,A.(2012),高维纵向数据分析的惩罚广义估计方程。生物统计学,68,353-360·Zbl 1251.62051号
[28] Yu,Y.和Ruppert,D.(2002)部分线性单指数模型的惩罚样条估计。美国统计协会杂志,971042-1054·Zbl 1045.62035号
[29] Yu,Y.,Wu,C.和Zhang,Y.(2017)广义部分线性单指数模型的惩罚样条估计。统计与计算,27571-582·Zbl 1505.62438号
[30] Zeger,S.L.和Liang,K.-Y。(1986)离散和连续结果的纵向数据分析。生物统计学,42,121-130。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。