×

用约束分段线性回归样条建模DNA拷贝数和基因表达之间的关联。 (英语) 兹比尔1288.62161

摘要:DNA拷贝数和mRNA表达是癌症研究中广泛使用的数据类型,两者结合比单独提供更多信息。虽然在现有文献中,这两种标记之间的关系形式是先验确定的,但我们对它们的关联进行了建模。我们使用分段线性回归样条(PLRS),它将良好的解释与足够的灵活性结合起来,以识别任何可能的关系类型。模型的规范导致在受限的非标准设置中进行估计和模型选择。我们为测试DNA对mRNA的影响和选择合适的模型提供了方法。此外,我们提出了一种新的方法来获得约束PLRS的可靠置信带,该方法考虑了模型的不确定性。该程序适用于结直肠癌和乳腺癌数据。普遍的假设被发现可能会误导生物相关基因。更灵活的模型可能会为两个标记之间的交互带来更多见解。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62J05型 线性回归;混合模型
92 C50 医疗应用(通用)
62层30 约束条件下的参数化推理
65立方厘米60 统计学中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Akaike,H.(1973)。信息论和最大似然原理的推广。第二届信息理论国际研讨会(Tsahkadsor,1971)(B.N.Petrov和F.Csaki编辑)267-281。布达佩斯阿卡德米亚·基奥·Zbl 0283.62006号
[2] Andrews,D.W.K.(2000年)。当参数位于参数空间的边界上时,引导数据库不一致。《计量经济学》68 399-405·Zbl 1015.62044号 ·数字对象标识代码:10.1111/1468-0262.00114
[3] Arnold,B.C.和Shavelle,R.M.(1998)。正态分布均值和方差的联合置信集。阿默尔。统计师。52 133-140.
[4] Asimit,J.L.、Andrulis,I.L.和Bull,S.B.(2011年)。回归模型、扫描统计和再现概率,以检测基因表达和拷贝数之间的关联区域。Stat.Med.30 1157-1178·doi:10.1002/sim.4193
[5] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.系列。乙57 289-300·Zbl 0809.62014号
[6] Bicciato,S.、Spinelli,R.、Zampieri,M.、Mangano,E.、Ferrari,F.、Beltrame,L.、Cifola,I.、Peano,C.、Solari,A.和Battaglia,C.(2009年)。识别癌症数据集中差异表达和基因组不平衡区域显著重叠的计算程序。核酸研究37 5057-5070。
[7] Boyd,S.和Vandenberghe,L.(2004)。凸优化。剑桥大学出版社,剑桥·Zbl 1058.90049号
[8] Bozdogan,H.(1987)。模型选择和Akaike信息准则(AIC):一般理论及其分析扩展。《心理测量学》52 345-370·Zbl 0627.62005号 ·doi:10.1007/BF02294361
[9] Brown,L.D.、Cai,T.T.和Das Gupta,A.(2003)。指数族中的区间估计。统计师。Sinica 13 19-49号·Zbl 1017.62027号
[10] Buckland,S.T.、Burnham,K.P.和Augustin,N.H.(1997年)。模型选择:推理不可或缺的一部分。生物统计学53 603-618·Zbl 0885.62118号 ·doi:10.2307/2533961
[11] Burnham,K.P.和Anderson,D.R.(2002年)。模型选择和多模型推理:实用信息理论方法,第二版,Springer,纽约·Zbl 1005.62007号 ·数字对象标识代码:10.1007/b97636
[12] Carvalho,B.、Postma,C.、Mongera,S.、Hopmans,E.、Diskin,S.,van de Wiel,M.A.、van Crieking,W.、Thas,O.、Matthäi,A.、Cuesta,M.A、Droste,J.S.T.S.、Craanen,M.、Schröck,E.、Ylstra,B.和Meijer,G.A.(2009年)。染色体20q扩增子上的多个可能致癌基因与大肠腺瘤的癌变有关。内脏58 79-89。
[13] Chernoff,H.(1954)。关于似然比的分布。安。数学。统计25 573-578·Zbl 0056.37102号 ·doi:10.1214/aoms/1177728725
[14] Gouriéroux,C.、Holly,A.和Monfort,A.(1982年)。在回归参数上有不等式约束的线性模型中的似然比检验、Wald检验和Kuhn-Tucker检验。经济计量学50 63-80·Zbl 0483.62058号 ·doi:10.2307/1912529
[15] Grömping,U.(2010年)。使用R推断线性等式和不等式约束:软件包ic.infer。J.统计软件。33 1-31.
[16] Gu,W.、Choi,H.和Ghosh,D.(2008)。拷贝数和转录mRNA微阵列数据之间的全球关联:一项实证研究。癌症信息。6 17-23.
[17] Hughes,A.W.和King,M.L.(2003)。在存在单边信息的情况下使用AIC进行模型选择。J.统计。计划。推断115 397-411·Zbl 1022.62002号 ·doi:10.1016/S0378-3758(02)00159-3
[18] Jörnsten,R.、Abenius,T.、Kling,T.,Schmidt,L.、Johansson,E.、Nordling,T.E.M.、Nordlander,B.、Sander,C.、Gennemark,P.、Funa,K.、Nilsson,B.、Lindahl,L.和Nelander,S.(2011年)。胶质母细胞瘤中拷贝数畸变转录效应的网络建模。摩尔系统。生物学7 486。
[19] Kodde,D.A.和Palm,F.C.(1986年)。沃尔德联合测试平等和不平等限制的标准。计量经济学54 1243-1248·Zbl 0595.62013.中 ·doi:10.2307/1912331
[20] Kudó,A.(1963年)。单侧测试的多元模拟。生物特征50 403-418·Zbl 0121.13906号 ·doi:10.1093/biomet/50.3-4.03
[21] Leday,G.G.R.、van der Vaart,A.W.、van Wieringen,W.N.和van de Wiel,M.A.(2013)。补充“用约束分段线性回归样条建模DNA拷贝数和基因表达之间的关联”·Zbl 1288.62161号
[22] Lee,H.、Kong,S.W.和Park,P.J.(2008)。综合分析揭示了DNA拷贝数畸变与基因表达变化之间的直接和间接相互作用。生物信息学24 889-896·兹比尔1279.92064
[23] Lipson,D.、Ben-Dor,A.、Dehan,E.和Yakhini,Z.(2004)。DNA拷贝数和基因表达水平的联合分析。生物信息学算法。计算机科学课堂讲稿3240 135-146。柏林施普林格。 ·doi:10.1007/978-3-540-30219-312
[24] Meeker,W.Q.和Escobar,L.A.(1995年)。基于最大似然估计的近似置信区域教学。阿默尔。统计师。49 48-53.
[25] Menezes,R.、Boetzer,M.、Sieswerda,M.,van Ommen,G.J.和Boer,J.(2009)。使用基因集对DNA拷贝数和基因表达微阵列数据进行综合分析。BMC生物信息学10 203+。
[26] Neve,R.M.、Chin,K.、Fridlyand,J.、Yeh,J.,Baehner,F.L.、Fevr,T.、Clark,L.、Bayani,N.、Coppe,J.-P.、Tong,F.、Speed,T.,Spellman,P.T.、DeVries,S.、Lapuk,A.、Wang,N.J.、Kuo,W.-L.、Stilwell,J.L.,J,A.和Gray,J.W.(2006年)。用于研究功能不同的癌症亚型的乳腺癌细胞系集合。癌细胞。10 515-527.
[27] Olshen,A.B.、Venkatraman,E.S.、Lucito,R.和Wigler,M.(2004年)。用于分析基于阵列的DNA拷贝数数据的循环二进制分割。生物统计学5 557-572·Zbl 1155.62478号 ·doi:10.1093/biostatistics/kxh008
[28] Peng,J.,Zhu,J.、Bergamaschi,A.、Han,W.、Noh,D.-Y.、Pollack,J.R.和Wang,P.(2010)。正则化多元回归用于识别主预测因子,并应用于乳腺癌的综合基因组学研究。附录申请。《法律总汇》第4卷第53-77页·Zbl 1189.62174号 ·doi:10.1214/09-AOAS271
[29] Pinkel,D.和Albertson,D.G.(2005年)。阵列比较基因组杂交及其在癌症中的应用。自然遗传学。37补充S11-S17。
[30] Quackenbush,J.(2002)。微阵列数据规范化和转换。自然遗传学。32补遗496-501。
[31] Robertson,T.、Wright,F.T.和Dykstra,R.L.(1988年)。顺序限制统计推断。奇切斯特·威利·Zbl 0645.62028号
[32] Salari,K.、Tibshirani,R.和Pollack,J.R.(2010年)。DR Integrator:一种新的分析工具,用于整合DNA拷贝数和基因表达数据。生物信息学26 414-416。
[33] Schäfer,M.、Schwender,H.、Merk,S.、Haferlach,C.、Ickstadt,K.和Dugas,M.(2009)。拷贝数改变和基因表达的综合分析:对同等定向异常的双变量评估。生物信息学25 3228-3235。
[34] 夏皮罗(1988)。多元分析中不等式约束检验的统一理论。国际。统计师。版次:56 49-62·Zbl 0661.62042号 ·doi:10.2307/1403361
[35] Silvapulle,M.J.和Sen,P.K.(2005)。约束统计推断:不等式、顺序和形状限制。新泽西州霍博肯威利·Zbl 1077.62019年 ·数字对象标识代码:10.1002/9781118165614
[36] Solvang,H.K.、Lingjrde,O.C.、Frigessi,A.、Börresen-Dale,A.-L.和Kristensen,V.N.(2011)。拷贝数畸变和mRNA表达之间的线性和非线性依赖性揭示了乳腺癌中不同的分子途径。BMC生物信息学12 197。
[37] Soneson,C.、Lilljebjörn,H.、Fioretos,T.和Fontes,M.(2010年)。使用典型相关分析对基因表达和拷贝数变化进行综合分析。BMC生物信息学11 191。
[38] van de Wiel,M.A.、Kim,K.I.、Vosse,S.J.、van Wieringen,W.N.、Wilting,S.M.和Ylstra,B.(2007)。CGH调用:调用阵列CGH肿瘤轮廓的畸变。生物信息学23 892-894。
[39] van de Wiel,M.A.、Picard,F.、van Wieringen,W.N.和Ylstra,B.(2011年)。微阵列DNA拷贝数图谱的预处理和下游分析。简介。生物信息学12 10-21。
[40] van der Vaart,A.W.(1998)。渐进统计。剑桥统计与概率数学系列3。剑桥大学出版社,剑桥·Zbl 0910.62001号 ·doi:10.1017/CBO978051180225
[41] van Wieringen,W.N.、Berkhof,J.和van de Wiel,M.A.(2010年)。与DNA拷贝数相关的区域共表达的随机系数模型。统计应用程序。遗传学。分子生物学。9 30. ·兹比尔1304.92064
[42] van Wieringen,W.N.、van de Wiel,M.A.和Ylstra,B.(2007年)。标准化、分段或称为aCGH数据?癌症信息。3 321-327.
[43] van Wieringen,W.N.和van de Wiel,M.A.(2009年)。DNA拷贝数诱导差异mRNA基因表达的非参数检测。生物统计学65 19-29·Zbl 1159.62087号 ·文件编号:10.1111/j.1541-0420.2008.01052.x
[44] VanAntwerp,J.(2000年)。线性和双线性矩阵不等式教程。J.工艺控制。10 363-385.
[45] Vandenberghe,L.和Boyd,S.(1996年)。半定规划。SIAM版本38 49-95·兹比尔0845.65023 ·数字对象标识代码:10.1137/1038003
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。