×

具有配对协变量的稀疏分类。 (英语) 兹比尔1459.62007

摘要:本文介绍了配对套索:套索在配对协变量设置中的推广。我们的目的是从两个高维协变量集预测单个反应。我们假设协变量集之间是一对一的对应关系,一个集合中的每个协变量与另一个集合的协变量形成一对。例如,当相同数据的两个转换可用时,就会出现成对协变量。通常不知道这两个协变量集中的哪一个会导致更好的预测,或者这两个协变量集是否互补。配对套索通过加权协变量来解决这个问题,以改进从协变量集和协变量对中的选择。因此,它组合了来自两个协变量集的信息,并解释了配对结构。我们用实验基因组数据在2000多个分类问题上测试了配对套索,发现在估计稀疏但可预测的模型时,配对套索的性能优于标准套索和自适应套索。R包帕拉索可从以下位置获得起重机.

MSC公司:

62-04 统计相关问题的软件、源代码等
62J07型 岭回归;收缩估计量
62J12型 广义线性模型(逻辑模型)
62小时30分 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aben,N。;Vis、DJ;米肖,M。;Wessels,LF,TANDEM:基于多种分子数据类型最大化药物反应模型可解释性的两阶段方法,生物信息学,32,17,i413-i420(2016)·doi:10.1093/bioinformatics/btw449
[2] 伯格森,LC;格拉德,IK;Lyng,H.,带数据集成的加权套索,《Stat Appl Genet Mol Biol》,第10、1、39页(2011年)·Zbl 1296.92017号 ·数字对象标识代码:10.2202/1544-6115.1703
[3] 阿拉巴马州Boulesteix;德宾,R。;蒋,X。;Fuchs,M.,IPF-LASSO:基于多组学数据预测的带有惩罚因子的积分惩罚回归,计算数学方法医学,2017,7691937(2017)·Zbl 1370.92016年 ·doi:10.1155/2017/7691937
[4] Bühlmann,P。;van de Geer,S.,《高维数据统计:方法、理论和应用》(2011),柏林:施普林格出版社,柏林·Zbl 1273.62015年
[5] 坎贝尔,F。;Allen,GI,通过排他套索进行组内变量选择,Electron J Stat,11,2,4220-4257(2017)·Zbl 1408.62132号 ·doi:10.1214/17-EJS1317
[6] Colaprico,A。;西尔瓦,TC;奥尔森,C。;加罗法诺,L。;卡瓦,C。;Garolini,D。;萨贝多特,TS;马耳他,TM;帕格诺塔,SM;Castiglioni,I.,《TCGAbiolinks:用于TCGA数据综合分析的R/Bioconductor包》,《核酸研究》,44,8,e71(2016)·doi:10.1093/nar/gkv1507
[7] 科尔特斯,C。;莫赫里,M。;特隆,S。;索尔,LK;Schölkopf,B.,AUC优化与错误率最小化,《神经信息处理系统进展》16,313-320(2004),剑桥:麻省理工学院出版社,剑桥
[8] Dey KK,Stephens M(2018)CorShrink:相关性的经验贝叶斯收缩估计及其应用。生物Rxiv 10.1101/368316
[9] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J R Stat Soc Ser B(Stat Methodol),70,5,849-911(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[10] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降法实现广义线性模型的正则化路径,J Stat Softw(2010)·doi:10.18637/jss.v033.i01
[11] 盖德,S。;Porzelius,C。;Fälth,M。;布拉斯,JC;Wuttig博士。;Kuner,R。;粘合剂H。;苏尔特曼,H。;Beißbarth,T.,基于图形的miRNA和mRNA表达数据融合提高前列腺癌临床预后预测,BMC Bioninform,12,1,488(2011)·doi:10.1186/1471-2105-12-488
[12] 黄,J。;马,S。;Zhang,CH,稀疏高维回归模型的自适应套索,Stat Sin,18,4,1603-1618(2008)·兹比尔1255.62198
[13] 黄,X。;斯特恩,DF;Zhao,H.,配对正常样本的转录谱提供了癌症患者生存的补充信息——来自TCGA泛癌数据的证据,科学代表,620567(2016)·doi:10.1038/srep20567
[14] 里德,S。;Tibshirani,R.,使用集群原型进行稀疏回归和边际检验,生物统计学,17,2,364-376(2016)·doi:10.1093/biostatistics/kxv049
[15] 医学博士Robinson;Oshlack,A.,RNA-seq数据差异表达分析的尺度归一化方法,《基因组生物学》,11,3,R25(2010)·doi:10.1186/gb-2010-11-3-r25
[16] 罗德里格斯-吉隆多,M。;卡库鲁,A。;Salo,P。;佩罗拉,M。;梅斯克,WE;托莱纳尔,RA;Houwing-Disitermaat,J。;梅滕斯,BJ;达塔,S。;Mertens,BJ,《关于组合组学数据预测二元结果》,蛋白质组学、代谢组学和脂质组学数据的质谱统计分析,259-275(2017),Cham:Springer,Cham
[17] 施穆列维奇,I。;Zhang,W.,基因表达数据的二进制分析和基于优化的标准化,生物信息学,18,4,555-565(2002)·doi:10.1093/bioinformatics/18.4.555
[18] Telonis,AG公司;马吉,R。;Loher,P。;谢尔沃内娃,I。;Londin,E。;Rigoutsos,I.,《关于miRNA亚型(isomiRs)存在与否的知识可以成功区分32种TCGA癌症类型》,《核酸研究》,45,6,2973-2985(2017)·doi:10.1093/nar/gkx082
[19] Ternès,北卡罗来纳州。;罗托洛,F。;海因策,G。;Michiels,S.,《生存结果和高维空间随机临床试验中生物标记物与治疗相互作用的识别》,Biom J,59,4,685-701(2017)·Zbl 1369.62306号 ·doi:10.1002/bimj.201500234
[20] Tibshirani,R.,通过套索进行回归收缩和选择,J R Stat Soc Ser B(Methodol),58,1,267-288(1996)·Zbl 0850.62538号
[21] 蒂布希拉尼,R。;桑德斯,M。;Rosset,S。;朱,J。;K.奈特(K.K.Knight),《通过融合套索实现的稀疏与平滑》,J R Stat Soc Ser B(Stat Methodol),67,1,91-108(2005)·Zbl 1060.62049号 ·doi:10.1111/j.1467-9868.2005.00490.x
[22] van de Wiel,马萨诸塞州;留置权,TG;韦拉亚特。;van Wieringen,WN;Wilting,SM,《使用联合数据进行更好的预测:自适应群体-规则岭回归》,《统计医学》,35,3,368-381(2016)·数字对象标识代码:10.1002/sim.6732
[23] 范德拉恩,MJ;波莉,EC;哈伯德,AE,超级学习者,Stat Appl Genet Mol Biol,6,1,25(2007)·Zbl 1166.62387号 ·doi:10.2202/1544-6115.1309
[24] van Wieringen,WN;Kun,D。;汉佩尔,R。;Boulesteix,AL,《使用基因表达数据进行生存预测:回顾和比较》,《计算统计数据分析》,53,5,1590-1603(2009)·Zbl 1453.62225号 ·doi:10.1016/j.csda.2008.05.021
[25] 威斯特福尔,PH;阿米蒂奇,P。;Colton,T.,《组合(P)值》,《生物统计百科全书》(2005),霍博肯:威利
[26] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J R Stat Soc Ser B(Stat Methodol),68,1,49-67(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[27] Zou,H.,《自适应套索及其预言属性》,美国统计学会期刊,101,476,1418-1429(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[28] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J R Stat Soc Ser B(Stat Methodol),67,2,301-320(2005)·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
[29] 兹维纳,I。;弗里希,B。;Binder,H.,《转化RNA-Seq数据以提高预后基因特征的性能》,《公共科学图书馆·综合》,9,1,e85150(2014)·doi:10.1371/journal.pone.0085150
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。