×

高维AFT模型中的双水平特征选择及其在基因组研究中的应用。 (英语) Zbl 1445.92177号

摘要:通过将模型表示为单指标模型,我们提出了一种新的高维加速失效时间模型的双层特征选择方法。该方法在组和单个特征层次上都能产生稀疏解,并具有一种计算效率高且易于实现的权宜之计。我们分析了一个基因组数据集作为例子,并进行了一项仿真研究,以显示所提方法的有限样本性能。

MSC公司:

92D10型 遗传学和表观遗传学
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

黑豹
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bednarski,A.E.、S.C.Elgin和H.B.Pakrasi(2005年)。“蛋白质结构和遗传病的研究:在大型入门课程中向本科生介绍生物信息学,”《细胞生物学》。教育。,4, 207-220.; 贝德纳尔斯基,A.E。;埃尔金,南卡罗来纳州。;Pakrasi,H.B.,《蛋白质结构和遗传病的研究:在大型入门课程《细胞生物学》中向本科生介绍生物信息学。教育。,4, 207-220 (2005)
[2] Breheny,P.(2015)。“双水平变量选择的群指数套索”,《生物统计学》,71731-740。;Breheny,P.,《双水平变量选择的群体指数套索》,《生物统计学》,第71期,第731-740页(2015年)·Zbl 1419.62316号
[3] Breheny,P.和J.Huang(2009年)。“二级变量选择的惩罚方法”,Stat.Its Interface,2369-380。;Breheny,P。;Huang,J.,双层变量选择的惩罚方法,Stat.It Interface,2,369-380(2009)·Zbl 1245.62034号
[4] Buckley,J.和I.James(1979年)。“截尾数据的线性回归”,Biometrika,66,429-436。;巴克利,J。;James,I.,《截尾数据线性回归》,《生物统计学》,第66期,第429-436页(1979年)·Zbl 0425.62051号
[5] Carroll,R.J.、J.Fan、I.Gijbels和M.P.Wand(1997年)。“广义部分线性单指数模型”,《美国统计协会期刊》,92,477-489。;卡罗尔·R·J。;范,J。;Gijbels,I。;Wand,M.P.,广义部分线性单指数模型,美国统计协会,92,477-489(1997)·Zbl 0890.62053号
[6] Fan,J.和R.Li(2001年)。“通过非一致惩罚似然及其预言属性进行变量选择”,《美国统计协会期刊》,第96期,第1348-1360页。;范,J。;Li,R.,《通过非一致惩罚似然进行变量选择及其预言属性》,美国统计协会,96,1348-1360(2001)·Zbl 1073.62547号
[7] Fei,F.、J.Qu、M.Zhang、Y.Li和S.Zhangs(2017)。“S100A4在癌症进展和转移中的作用:系统综述”,Oncotarget,873219。;费,F。;Qu,J。;张,M。;李,Y。;Zhang,S.,S100A4在癌症进展和转移中的作用:系统综述,Oncotarget,873219(2017)
[8] 弗拉纳根、J.M.、J.M·富内斯、S.亨德森、L.Wild、N.凯里和C.Boshoff(2009)。“转基因干细胞的基因组筛查显示RNASEH2A、PPAP2C和ADARB1是假定的抗癌药物靶点,”《分子癌症治疗》。,8, 249-260.; 弗拉纳根,J.M。;Funes,J.M。;亨德森,S。;野生,L。;凯里,N。;Boshoff,C.,转基因干细胞的基因组学筛选显示RNASEH2A、PPAP2C和ADARB1是假定的抗癌药物靶点,Mol.Cancer Ther。,8, 249-260 (2009)
[9] Gui,J.和H.Li(2005)。“高维和低样本量环境下的惩罚Cox回归分析,应用于微阵列基因表达数据”,生物信息学,213001-3008。;桂,J。;Li,H.,高维和低样本量环境下的Penized Cox回归分析,以及微阵列基因表达数据的应用,生物信息学,213001-3008(2005)
[10] Huang,J.、P.Breheny和S.Ma(2012年)。“高维模型中群体选择的选择性综述,Stat.Sci.,27,481-499。<pub-id pub-id type=”ThomsonISI“>http://gateway.webofknowledge.com/gateway/gateway.cgi?GWVersion=2&SrcApp=PARTNER_APP&SrcAuth=LinksAMR&KeyUT=WOS:000313757900004&DestLinkType=FullRecord&DestApp=ALL_WOS&UsrCustomerID=b7bc2757938ac7a7a821505f8243d9f3<pub-id-pub-id-type=“doi”>10.1214/12-STS392;<元素引用出版物type=“journal”出版物format=“print”>Huang,J.Breheny,P.Ma,S.2012高维模型中群体选择的选择性综述Stat。科学27481499·Zbl 1331.62347号
[11] Huang,J.、S.Ma、H.Xie和C.-H.Zhang(2009)。“变量选择的群桥方法”,Biometrika,96,339-355。;黄,J。;马,S。;谢浩。;Zhang,C.-H.,变量选择的群体桥接法,Biometrika,96,339-355(2009)·Zbl 1163.62050
[12] Ichimura,H.(1993)。“单指数模型的半参数最小二乘(SLS)和加权SLS估计”,《经济学杂志》。,58, 71-120.; Ichimura,H.,单指数模型的半参数最小二乘(SLS)和加权SLS估计,J.Econom。,58, 71-120 (1993) ·Zbl 0816.62079号
[13] Lee,K.H.,S.Chakraborty和J.Sun(2017年)。“使用组套索先验法对高维基因组数据和审查结果进行变量选择”,计算。统计数据分析。,112, 1-13.; Lee,K.H。;Chakraborty,S。;Sun,J.,《使用群套索先验筛选结果的高维基因组数据变量选择》,计算。统计数据分析,112,1-13(2017)·Zbl 1464.62115号
[14] Lek,M.,K.J.Karczewski,E.V.Minikel,K.E.Samocha,E.Banks,T.Fennell,A.H.O'Donnell-Luria,J.S.Ware,A.J.Hill,B.B.Cummings,T.Tukiainen,D.P.Birnbaum,J.A.Kosmicki,L.E.Duncan,K.Estrada,F.Zhao,J.Zou,E.Pierce-Hoffman,J.Berghout,D.N.Cooper,N.Deflaux,M.DePristo,R.Do,J.Flanick,M.Fromer,L.Gauthier,J。Goldstein,N.Gupta,D.Howrigan,A.Kiezun,M.I.Kurki,A.L.Moonshine,P.Natarajan,L.Orozco,G.M.Peloso,R.Poplin,M.A.Rivas,V.Ruano-Rubio,S.A.Rose,D.M.Ruderfer,K.Shakir,P.D.Stenson,C.Stevens,B.P.Thomas,G.Tiao,M.T.Tusie-Luna,B.Weisburd,H.H.Won,D.Yu,D.M Altshuler,D.Ardisceno,M.Boehnke,J.Danesh,S。Donnelly,R.Elosia,J.C.Florez,S.B.Gabriel,G.Getz,S.J.Glatt,C.M.Hultman,S.Kathiresan,M.Laakso,S.McCarroll,M.I.McCarthy,D.McGovern,R.McPherson,B.M.Neale,A.Palotie,S.M.Purcell,D.Saleheen,J.M.Scharf,P.Sklar,P.F.Sullivan,J.Tuomilehto,M.T.Tsuang H.C.Watkins,J.G.Wilson,M.J.Daly,D.G。麦克阿瑟和Exome聚合财团(2016年)。《60706人蛋白质编码基因变异分析》,《自然》杂志,536285-291。;Lek,M。;Karczewski,K.J。;Minikel,E.V。;Samocha,K.E。;班克斯,E。;芬内尔,T。;奥唐纳·卢里亚,A.H。;Ware,J.S。;Hill,A.J。;卡明斯,B.B。;Tukiainen,T。;伯恩鲍姆,D.P。;Kosmicki,J.A。;邓肯,L.E。;埃斯特拉达,K。;赵,F。;邹,J。;皮尔斯·霍夫曼,E。;Berghout,J。;库珀,D.N。;德劳克斯,N。;DePristo,M。;Do,R。;弗兰尼克,J。;弗罗默,M。;Gauthier,L。;Goldstein,J。;古普塔,N。;Howrigan,D。;基辅,A。;M.I.Kurki。;Moonshine,A.L。;Natarajan,P。;奥罗佐,L。;佩洛佐,G.M。;府绸,R。;Rivas,医学硕士。;鲁比奥,V。;Rose,美国。;Ruderfer,医学博士。;夏基尔,K。;斯坦森,P.D。;史蒂文斯,C。;B.P.托马斯。;Tiao,G。;Tusie-Luna,麻省理工。;魏斯堡,B。;韩元,H.-H。;Yu,D。;Altshuler,D.M。;Ardissino博士。;Boehnke,M。;Danesh,J。;唐纳利,S。;Elosia,R。;Florez,J.C。;加布里埃尔,S.B。;盖茨,G。;格拉特·S·J。;Hultman,C.M。;Kathiresan,S。;Laakso,M。;McCarroll,S。;M.I.麦卡锡。;麦戈文,D。;麦克弗森(R.McPherson)。;尼尔,B.M。;Palotie,A。;Purcell,S.M。;Saleheen,D。;谢尔夫,J.M。;Sklar,P。;苏利文,P.F。;Tuomilehto,J。;Tsuang,M.T。;Watkins,H.C。;威尔逊,J.G。;戴利,M.J。;麦克阿瑟,D.G,60706人的蛋白质编码遗传变异分析,《自然》,536285-291(2016)
[15] Liang,H.,X.Liu,R.Li和C.L.Tsai(2010)。“部分线性单指数模型的估计和测试”,《Ann.Stat.》,38,3811-3836。;Liang,H。;刘,X。;Li,R。;Tsai,C.L.,部分线性单指数模型的估计和测试,《Ann.Stat.》,38,3811-3836(2010)·Zbl 1204.62068号
[16] Liu,J.,J.Huang,Y.Zhang,Q.Lan,N.Rothman,T.Zheng和S.Ma(2013)。“利用惩罚法鉴定癌症研究中的基因-环境相互作用”,《基因组学》,102189-194。;刘杰。;黄,J。;张,Y。;兰,Q。;北卡罗来纳州罗斯曼。;郑涛。;Ma,S.,使用惩罚法识别癌症研究中的基因-环境相互作用,基因组学,102189-194(2013)
[17] Magger,O.、Y.Y.Waldman、E.Ruppin和R.Sharan(2012年)。“通过组织特异性蛋白质相互作用网络增强致病基因的优先级”,PLoS Compute。生物,8,e1002690。;Magger,O。;Waldman,Y.Y。;鲁平,E。;Sharan,R.,《通过组织特异性蛋白质相互作用网络增强致病基因的优先级》,《公共科学图书馆·计算》。生物,8,e1002690(2012)
[18] Mi,H.、A.Muruganujan、J.T.Casagrande和P.D.Thomas(2013年)。“用豹分类系统进行大规模基因功能分析”,《自然协议》。,8, 1551.; 米·H。;Muruganujan,A。;卡萨格兰德,J.T。;Thomas,P.D.,《利用豹分类系统进行大尺度基因功能分析》,《自然协议》。,8, 1551 (2013)
[19] Quan,M.、J.-J.Cui、X.Feng和Q.Huang(2017)。“自趋化蛋白/溶血磷脂轴在胰腺癌中的关键作用和潜在靶点”,《肿瘤生物学》。,39, 1010428317694544.; Quan,M。;崔俊杰。;X·冯。;黄,Q.,胰腺癌中自趋化蛋白/溶血磷脂轴的关键作用和潜在靶点,肿瘤生物学。,39 (2017)
[20] Rangaswami,H.,A.Bulbule和G.C.Kundu(2006年)。“骨桥蛋白:在细胞信号传导和癌症进展中的作用”,Trends cell Biol。,16, 79-87.; Rangaswami,H。;Bulbule,A。;Kundu,G.C.,骨桥蛋白:在细胞信号传导和癌症进展中的作用,《细胞生物学趋势》。,16, 79-87 (2006)
[21] Tibshirani,R.(1996)。《通过套索进行回归收缩和选择》,J.Royal Stat.Soc.B,58,267-288。;Tibshirani,R.,《通过套索进行回归收缩和选择》,J.Royal Stat.Soc.B,58,267-288(1996)·Zbl 0850.62538号
[22] Timpson,N.J.、C.M.Greenwood、N.Soranzo、D.J.Lawson和J.B.Richards(2018年)。《遗传结构:基因对人类特征和疾病的贡献形状》,《自然评论遗传学》。,19, 110-124.; 新泽西州蒂姆普森。;格林伍德,C.M。;Soranzo,N。;劳森·D·J。;Richards,J.B.,《遗传结构:基因对人类特征和疾病的贡献形状》,《自然遗传学评论》。,19, 110-124 (2018)
[23] Trevino,V.、F.Falciani和H.A.Barrera-SaldañA(2007年)。“DNA微阵列:生物医学和临床研究的强大基因组工具”,《分子医学》,第13527-541页。;特雷维诺,V。;法尔恰尼,F。;Barrera-Saldaña,H.a.,《DNA微阵列:生物医学和临床研究的强大基因组工具》,《分子医学》,第13期,第527-541页(2007年)
[24] Wang,H.,S.Lee,C.L.Nigro,L.Lattanzio,M.Merlano,M.Monteverde,R.Matin,K.Purdie,N.Mladkova,D.Bergamaschi,C.Harwood,N.Syed,P.Szlosarek,E.Briasoulis,A.McHugh,A.Thompson,A.Evans,I.Leigh,C.Fleming,G.J.Inman,E.Hatzimichael,C.Proby,T.Crook(2012)。“NT5E(CD73)在恶性黑色素瘤中受表观遗传调控,并与转移部位特异性相关”,《英国癌症杂志》,1061446。;Wang,H。;Lee,S。;Nigro,C.L。;Lattanzio,L。;梅拉诺,M。;蒙特韦尔德,M。;马汀,R。;Purdie,K。;姆拉德科娃,N。;Bergamaschi,D。;哈伍德,C。;Syed,N。;Szlosarek,P。;Briasoulis,E。;麦克休,A。;汤普森,A。;埃文斯,A。;I·利。;弗莱明,C。;Inman,G.J。;Hatzimichael,E。;普罗比,C。;Crook,T.,NT5E(CD73)在恶性黑色素瘤中受表观遗传调控,并与转移部位特异性相关,英国癌症杂志,106,1446(2012)
[25] Wang,L.,G.Chen和H.Li(2007年)。“微阵列时间进程基因表达数据的群体SCAD回归分析”,生物信息学,231486-1494。;Wang,L。;陈,G。;Li,H.,微阵列时间进程基因表达数据的群组SCAD回归分析,生物信息学,231486-1494(2007)
[26] Wang,T.、P.-R.Xu和L.-X.Zhu(2012)。“具有单指标结构的高维模型中的非凸惩罚估计”,《多元分析杂志》。,109, 221-235.; Wang,T。;Xu,P.-R。;Zhu,L.-X.,单指标结构高维模型中的非凸惩罚估计,J.多元分析。,109, 221-235 (2012) ·Zbl 1241.62097号
[27] Wang,Z.和C.Wang(2010年)。“Buckley-James利用高维生物标记物数据促进生存分析”,Stat.Appl。遗传学。分子生物学。,9, 24.; 王,Z。;Wang,C.,Buckley-James利用高维生物标记物数据进行生存分析,Stat.Appl。遗传学。分子生物学。,9, 24 (2010) ·Zbl 1304.92101号
[28] Wei,L.-J.(1992)。“加速失效时间模型:生存分析中Cox回归模型的有用替代品”,《统计医学》,第11期,1871-1879页。;Wei,L.-J.,《加速失效时间模型:生存分析中Cox回归模型的有用替代品》,《统计医学》,第11期,1871-1879页(1992年)
[29] Witten,D.M.和R.Tibshirani(2010年)。“高维协变量生存分析”,《统计方法医学研究》,19,29-51。;Witten,D.M。;Tibshirani,R.,《高维协变量生存分析》,《统计方法医学研究》,19,29-51(2010)
[30] Wu,J.、W.Du、X.Wang、L.Wei、Y.Pan、X.Wu、J.Zhang和D.Pei(2018)。“Ras相关蛋白Rap2c促进人类骨肉瘤细胞的迁移和侵袭”,Oncol。莱特。,15, 5352-5358.; 吴杰。;杜,W。;王,X。;Wei,L。;潘,Y。;吴,X。;张杰。;Pei,D.,Ras相关蛋白Rap2c促进人类骨肉瘤细胞的迁移和侵袭,Oncol。莱特。,15, 5352-5358 (2018)
[31] Xu,L.,S.S.Shen,Y.Hoshida,A.Subramanian,K.Ross,J.-P.Brunet,S.N.Wagner,S.Ramaswamy,J.P.Mesirov和R.O.Hynes(2008)。“动物黑色素瘤模型中的基因表达变化与人类黑色素瘤转移的侵袭性相关”,《分子癌症研究》,6760-769。;徐,L。;沈S.S。;Hoshida,Y。;Subramanian,A。;Ross,K。;布鲁内,J.-P。;Wagner,S.N。;拉马斯瓦米,南卡罗来纳州。;梅西洛夫,J.P。;Hynes,R.O.,动物黑色素瘤模型中的基因表达变化与人类黑色素瘤转移的侵袭性相关,《摩尔癌症研究》,第6期,第760-769页(2008年)
[32] Yuan,M.和Y.Lin(2006)。“分组变量回归中的模型选择和估计”,J.Royal Stat.Soc.B,68,49-67。;袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,J.Royal Stat.Soc.B,68,49-67(2006)·Zbl 1141.62030号
[33] Zeng,B.、X.M.Wen和L.Zhu(2017)。“单指数模型的无链接稀疏组变量选择方法”,J.Appl。统计,44,2388-2400。;曾,B。;Wen,X.M。;Zhu,L.,单指标模型的无链接稀疏群变量选择方法,J.Appl。Stat.,44,2388-2400(2017)·Zbl 1516.62696号
[34] Zhang,C.-H.(2010)。“最小最大凹惩罚下的几乎无偏变量选择”,《美国统计年鉴》,第38卷,第894-942页。;Zhang,C.-H.,最小最大凹惩罚下的几乎无偏变量选择,《美国统计年鉴》,38,894-942(2010)·Zbl 1183.62120号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。