×

高维问题的协方差回归和分类。 (英语) 兹比尔1250.62033

小结:我们提出了协方差回归,这是一系列在高维环境中进行预测的方法,它使用特征的逆协方差矩阵的收缩估计来实现更好的预测。在多元正态模型下,通过最大化数据的对数似然,得到了负协方差矩阵的估计,并对其进行了惩罚;然后,它用于估计响应对特征的回归系数。我们证明了岭回归、套索和弹性网是协方差回归的特例,并且我们证明了以前未探索的某些形式的协方差回归在一系列情况下可以优于现有方法。将协方差回归框架扩展到广义线性模型和线性判别分析,并用于分析具有多类和生存结果的基因表达数据集。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62甲12 多元分析中的估计
62J07型 岭回归;收缩估计量
62J12型 广义线性模型(逻辑模型)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bair,从基因表达数据预测患者生存率的半监督方法,PLOS Biol。第2页,第511页–(2004年)
[2] Banerjee,多元高斯或二进制数据的稀疏最大似然估计模型选择,J.Mach。学习。第9号决议第485页–(2008年)·Zbl 1225.68149号
[3] Bickel,通过阈值进行协方差正则化,Ann.Statist。(2008年)·Zbl 1196.62062号
[4] 布雷曼,随机森林,马赫。学习。第5页,共45页–(2001年)·兹比尔1007.68152
[5] Dey,Stein损失下协方差矩阵的估计,Ann.Statist。第13页,1581–(1985)
[6] Frank,一些化学计量学回归工具的统计观点(含讨论),Technometrics 35 pp 109–(1993)·Zbl 0775.62288号
[7] 弗里德曼,正则化判别分析,美国统计学家杂志。评估84第165页–(1989)
[8] 弗里德曼,用图形套索进行稀疏逆协方差估计,生物统计学9,第432页–(2007)
[9] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)通过坐标下降法实现广义线性模型的正则化路径。待发布。
[10] Green,迭代重加权最小二乘法用于最大似然估计,以及一些稳健且有抵抗力的替代方法,J.R.Statist。Soc.B 46第149页–(1984年)·Zbl 0555.62028号
[11] 郭,正则化线性判别分析及其在微阵列中的应用,生物统计学8第86页–(2007)·兹比尔1170.62382
[12] Haff,《协方差矩阵的逆估计:逆Wishart矩阵和恒等式的随机混合》,Ann.Statist。第7页第1264页–(1979)·Zbl 0436.62046号
[13] Hinton,深度信念网的快速学习算法,Neur。计算18 pp 1527–(2006)
[14] 霍尔,《岭回归:非正交问题的有偏估计》,《技术计量学》12,第55页–(1970)·Zbl 0202.17205号
[15] Hummel,来自转录和基因组图谱的伯基特淋巴瘤的生物学定义,新英格兰。《医学杂志》第354页,第2419页–(2006年)
[16] James,程序。伯克利第四交响乐团。数学与统计概率第361页–(1961)
[17] Kalbfleisch,失效时间数据的统计分析(1980)·Zbl 0504.62096号
[18] 梁,未标记数据在预测建模中的应用,统计学。科学。第22页,189页–(2007年)·Zbl 1246.62157号
[19] Mardia,多元分析(1979)
[20] 麦克拉克伦,判别分析和统计模式识别(1992)·Zbl 1108.62317号
[21] Meinshausen,《高维图和用套索选择变量》,Ann.Statist。第34页,1436页–(2006年)·Zbl 1113.62082号
[22] Monti,《弥漫性大B细胞淋巴瘤的分子谱》确定了强大的亚型,包括一种以宿主炎症反应为特征的亚型,Blood 105第1851页–(2005)
[23] O'Neill,《非机密观察的正常辨别》,J.Am.Statist。资产负债表73第821页–(1978年)
[24] Park,广义线性模型的L1正则化路径算法,J.R.Statist。Soc.B 69第659页–(2007年)
[25] Ramaswamy,利用肿瘤基因表达特征进行多类癌症诊断,Proc。国家。阿卡德。科学。美国98第15149页–(2001)
[26] Rosenwald,《利用分子分析预测弥漫性大B细胞淋巴瘤化疗后的生存率》,新英格兰。《医学杂志》第346页,1937–(2002)
[27] Rothman,稀疏置换不变协方差估计,Electr。J.统计。第2页,494页–(2008年)·Zbl 1320.62135号
[28] Shipp,《通过基因表达谱和监督机器学习预测弥漫性大B细胞淋巴瘤预后》,《国家医学》,第8页,68–(2002)
[29] Tibshirani,《通过套索进行回归收缩和选择》,J.R.Statist。Soc.B 58第267页(1996年)·Zbl 0850.62538号
[30] Tibshirani,通过基因表达的收缩中心诊断多种癌症类型,Proc。国家。阿卡德。科学。美国99 pp 6567–(2002)
[31] Tibshirani,通过最近收缩的质心进行分类预测,并应用于DNA微阵列,Statist。科学。第18页104–(2003)·Zbl 1048.62109号
[32] Tusher,应用于电离辐射反应的微阵列显著性分析,Proc。国家。阿卡德。科学。美国98页5116–(2001)·2014年12月10日
[33] 赵,关于套索的模型选择一致性,J.Mach。学习。第7号决议第2541页–(2006年)·Zbl 1222.62008年
[34] 朱,基因微阵列的惩罚logistic回归分类,生物统计学5 pp 427–(2004)·Zbl 1154.62406号
[35] 邹,通过弹性网进行正则化和变量选择,J.R.Statist。Soc.B 67第301页–(2005年)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。