×

应用于结构化数据的惩罚偏最小二乘法。 (英语) Zbl 1441.62140号

摘要:如今,应用于高维的数据分析已经兴起。高维数据的启迪可以通过收集不同的独立数据来实现。然而,每一个独立的集合可以引入自己的偏差。我们可以在模型中引入观测集结构来应对这种偏见。本文的目的是为稀疏偏最小二乘(sPLS)降维方法在呈现这种观测集结构的数据背景下建立理论基础。创新之处在于构建不同的sPLS模型,并通过公共L asso惩罚将其联系起来。这一理论可以应用于任何领域,在这些领域中,观测呈现出这种结构,因此,可以改进具有竞争力的领域中的sPLS。此外,它还可以扩展到特定的情况,其中变量可以收集在给定的先验组中,其中sPLS被定义为稀疏组偏最小二乘。

MSC公司:

62甲12 多元分析中的估计
62J07型 岭回归;收缩估计器(拉索)
62兰特 大数据和数据科学的统计方面
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布列斯特,A-L;Strimmer,K.,《偏最小二乘:分析高维基因组数据的通用工具》,简介。生物信息。,8, 1, 32-44 (2006)
[2] Chun,H.等人。;Keleš,S.,《同时降维和变量选择的稀疏偏最小二乘回归》,J.R.Stat.Soc.Ser。B(Stat.Methodol.),72,1,3-25(2010年)·Zbl 1411.62184号
[3] De Bie,T。;北卡罗来纳州克里斯蒂亚尼尼。;Rosipal,R.:模式识别中的特征问题。摘自:《几何计算手册》,第129-167页。斯普林格(2005)
[4] 埃斯拉米,A。;EM卡纳里;科勒,A。;Bougeard,S.,多群pls算法,J.Chemom。,28, 3, 192-201 (2014)
[5] JA Gagnon-Bartsch;速度,TP,使用对照基因纠正微阵列数据中不必要的变异,生物统计学,13,33539-552(2012)
[6] Geladi,P。;Kowalski,BR,偏最小二乘回归:教程,Ana。蜂鸣器。《学报》,185,1-17(1986)
[7] Herman,W.:具有潜在变量的路径模型:尼帕尔斯方法。参见:《数量社会学》,第307-357页。爱思唯尔(1975)
[8] 莱曹,K-A;罗索,D。;罗伯特·格拉尼(Robert-Granié),C。;Besse,P.,《整合经济学数据时变量选择的稀疏pls》,《统计应用》。遗传学。分子生物学。,7,1,35(2008年)·Zbl 1276.62061号
[9] 酒类,B。;德米肖,波兰;英国石油公司Hejblum;Thiébaut,R.,应用于基因组学背景的群和稀疏群偏最小二乘法,生物信息学,32,1,35-42(2015)
[10] 酒类,B。;Mengersen,K。;宾夕法尼亚州佩蒂特;Sutton,M.,群体数据多元响应的贝叶斯变量选择回归,贝叶斯分析。,12, 4, 1039-1067 (2017) ·Zbl 1384.62259号
[11] Paaby,AB;罗克曼,MV,《多效性的许多面孔》,《基因趋势》。,29, 2, 66-73 (2013)
[12] 价格,AL;新泽西州帕特森;普伦奇,RM;缅因州温布拉特;夏迪克,NA;Reich,D.,《主成分分析修正全基因组关联研究中的分层》,《自然遗传学》。,38, 8, 904 (2006)
[13] 罗哈特,F。;埃斯拉米,A。;Matigian,N。;Bougeard,S。;Le Cao,K-A,Mint:一种多变量综合方法,用于识别独立实验和平台上的可再生分子特征,BMC Bioninform。,18, 1, 128 (2017)
[14] Seoane,JA;坎贝尔,C。;日,INM;卡萨斯,JP;Gaunt,TR,基于基因的多效性发现的典型相关分析,PLoS Compute。生物,10,10,e1003876(2014)
[15] 沈,H。;Huang,JZ,通过正则化低秩矩阵近似进行稀疏主成分分析,J.Multivar。分析。,99, 6, 1015-1034 (2008) ·Zbl 1141.62049号
[16] 西蒙,N。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《稀疏群套索》,J.Compute。图表。统计,22,2,231-245(2013)
[17] Subramanian,A。;Tamayo,P。;穆塔,VK;穆克吉,S。;埃伯特,BL;马萨诸塞州吉列;Paulovich,A。;波梅罗伊,SL;Golub,TR;Lander,ES,《基因集富集分析:解释全基因组表达谱的基于知识的方法》,Proc。国家。阿卡德。科学。,102, 43, 15545-15550 (2005)
[18] 萨顿,M。;Thiébaut,R。;Liquet,B.:具有群和子群结构的稀疏偏最小二乘法。Stat.Med.(2018)37(23),3338-3356
[19] Tenenhaus,A。;菲利普,C。;吉列莫特,V。;乐曹,K-A;Grill,J。;Frouin,V.,广义典型相关分析的变量选择,生物统计学,15,3,569-583(2014)
[20] VE Vinzi;Trinchera,L;阿马托,S:请为模型评估和改进提供从基础到最新发展和开放问题的路径建模。摘自:《偏最小二乘手册》,第47-82页。施普林格(2010)
[21] Walker,S.J.:大数据:一场将改变我们生活、工作和思考方式的革命。国际期刊广告。33(1), 181-183 (2014)
[22] Wang,T。;Ho,G。;Ye,K。;斯特里克勒,H。;Elston,RC,当多个标记被基因分型时,用于建模基因-基因和基因-环境相互作用的偏最小二乘法,Genet。流行病。,33, 1, 6-15 (2009)
[23] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J.R.Stat.Soc.Ser。B(Stat.Methodol.),68,1,49-67(2006)·Zbl 1141.62030号
[24] 邹,H。;哈斯蒂,T。;Tibshirani,R.,稀疏主成分分析,J.Compute。图表。统计,15,2,265-286(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。