×

将预测网络纳入惩罚回归,并应用于微阵列数据。 (英语) Zbl 1192.62235号

摘要:我们考虑惩罚线性回归,特别是对于“大(p),小(n)”问题,其中预测因子之间的关系由网络先验描述。一类激励性示例包括通过基因表达谱建模表型,同时以生物路径或网络的形式解释基因的协调功能。为了结合网络中相邻预测因子相似影响大小的先验知识,我们提出了一种基于(L_{gamma})范数的分组惩罚,该惩罚平滑了网络上预测因子的回归系数。该方法的主要特点是能够自动实现分组变量选择并利用分组效果。我们还讨论了选择\(\gamma\)和\(L_{\gamma}\)范数内的一些权重的影响。仿真研究表明,与拉索、弹性网和最近提出的基于网络的方法相比,该方法具有更好的有限样本性能。在所有考虑的仿真设置中,新方法在变量选择方面表现最佳。为了举例说明,该方法被应用于微阵列数据集,以使用基因表达数据集和从《京都基因和基因组百科全书》(KEGG)路径编译的基因网络预测一些胶质母细胞瘤患者的生存时间。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92 C50 医疗应用(通用)
92C40型 生物化学、分子生物学
62J05型 线性回归;混合模型
65C60个 统计中的计算问题(MSC2010)
92立方厘米 系统生物学、网络
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 阿什伯恩,《基因本体论:生物学统一的工具》。基因本体联盟,《自然遗传学》25页25–(2000)·doi:10.1038/75556
[2] Bondell,同步回归收缩、变量选择和OSCAR预测因子的监督聚类,生物计量学64页115–(2008)·Zbl 1146.62051号 ·doi:10.1111/j.1541-0420.2007.00843.x
[3] Choe,《胶质母细胞瘤患者体内磷脂酰肌醇3'-激酶信号通路的分析》,《癌症研究》63第2742页–(2003)
[4] Efron,最小角度回归,《统计年鉴》第32卷第407页(2004年)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[5] Fan,通过非洞穴惩罚似然的变量选择及其预言性质,《美国统计协会杂志》96第1348页–(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[6] 《福布斯》,《2005年宇宙》,《英国癌症杂志》94,第318页–(2006)·doi:10.1038/sj.bjc.6602928
[7] Gelfand,空间数据分析的适当多元条件自回归模型,生物统计学4第11页–(2003)·Zbl 1142.62393号 ·doi:10.1093/biostatistics/4.1.11
[8] 霍尔,《岭回归:非正交问题的有偏估计》,《技术计量学》12,第55页–(1970)·Zbl 0202.17205号 ·数字对象标识代码:10.2307/1267351
[9] Horvath,《胶质母细胞瘤致癌信号网络分析将ASPM确定为分子靶点》,美国国家科学院院刊103页17402–(2006)·doi:10.1073/pnas.0608396103
[10] 高密度寡核苷酸阵列探针水平数据的虹膜、探索、归一化和总结,生物统计学4第249页–(2003)·Zbl 1141.62348号 ·doi:10.1093/biostatistics/4.2.249
[11] Kanehisa,KEGG:《京都基因和基因组百科全书》,《核酸研究》28页27–(2000)·Zbl 05435931号 ·doi:10.1093/nar/28.1.27
[12] Lam,p19INK4d、CDK4、CDK6在多形性胶质母细胞瘤中的表达,英国神经外科杂志14,第28页–(2000)·doi:10.1080/02688690042870
[13] Li,基因组数据分析的网络约束正则化和变量选择,生物信息学24页1175–(2008)·Zbl 05511605号 ·doi:10.1093/bioinformatics/btn081
[14] Pan,W.2009表达性状的基于网络的多基因座连锁分析http://www.biostat.umn.edu/rrs.php
[15] Ruano,通过表达和CGH微阵列分析检测的多形性胶质母细胞瘤扩增物中新候选靶基因的鉴定,《分子癌症》5第39页–(2006)·doi:10.1186/1476-4598-5-39
[16] Seoane,Smad和叉头通路在控制神经上皮和胶质母细胞瘤细胞增殖中的整合,《细胞》117第211页–(2004)·doi:10.1016/S0092-8674(04)00298-3
[17] Tibshirani,《通过LASSO进行回归收缩和选择》,《皇家统计学会杂志》,B辑58,第267页–(1996)·Zbl 0850.62538号
[18] Wei,基因组数据网络分析的马尔可夫随机场模型,生物信息学23 pp 1537–(2007)·doi:10.1093/bioinformatics/btm129
[19] 袁,分组变量回归中的模型选择和估计,《皇家统计学会杂志》,B辑68,第49页–(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[20] Zhao,P.Yu,B.2004助推拉索
[21] 赵,通过复合绝对惩罚进行分组和分层模型选择,《统计年鉴》(2006)
[22] 朱,基因微阵列的惩罚logistic回归分类,生物统计学5 pp 427–(2004)·Zbl 1154.62406号 ·doi:10.1093/biostatistics/kxg046
[23] Zhu,用于微阵列样本分类的基于网络的支持向量机,BMC生物信息学10(Suppl 1)pp S21–(2009)·Zbl 05739983号 ·doi:10.1186/1471-2105-10-S1-S21
[24] Zou,通过弹性网的正则化和变量选择,英国皇家统计学会期刊,B系列67,第301页–(2005)·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。