尼古拉·拉玛;帕特里齐亚·博拉奇;伊莉亚·比甘索利 在删失基因表达数据中探索一种新的强度依赖归一化程序的分布模型。 (英语) Zbl 1453.62128号 计算。统计数据分析。 第53期,第5期,1906-1922(2009). 摘要:当前基于回归平滑技术的基因强度相关归一化方法通常处理减少位置偏差和数据缩放这两个问题,而不考虑某些基因表达的特征性审查,由实验测量约束或之前的归一化步骤生成。此外,用于平衡偏差与方差的标准化程序的控制通常留给用户的经验。提出了一种近似最大似然法来拟合模型,以平滑对数倍基因表达差异对平均基因强度的依赖性。中心趋势和比例因子采用B样条平滑技术建模。作为离群值理论和稳健方法的替代方法,本文提出的方法寻找合适的分布模型,可能推广经典的高斯和拉普拉斯假设,控制不同类型的审查。模型选择采用贝叶斯信息准则。分布假设使用拟合优度统计和蒙特卡罗评估进行测试。提出了随机分位数来产生正态分布的调整数据。出于演示目的,分析了三个公开可用的数据集。学生的\(t\)误差模型揭示了在所有考虑的数据集中的最佳性能。评估非对称拉普拉斯分布需要更多的验证证据,该分布在一个数据集中显示了有趣的结果。 引用于1文件 MSC公司: 62-08 统计问题的计算方法 62页第10页 统计学在生物学和医学科学中的应用;元分析 92D20型 蛋白质序列,DNA序列 软件:法线;超级计算机;vsn(vsn);形状记忆合金;艳阳花;PNEW公司;结婚输入;生物导体;保密协议;R(右);结婚地块;结婚标准;结婚课程 PDF格式BibTeX公司 XML格式引用 \textit{N.Lama}等人,计算。统计数据分析。53,第5号,1906年--1922年(2009年;Zbl 1453.62128) 全文: DOI程序 参考文献: [1] Akaike,H.,《信息理论与最大似然原理的扩展》(Petrov,B.N.;Csaki,B.F.,第二届信息理论国际研讨会(1973),Kiado学院:布达佩斯Kiado院),267-281·Zbl 0283.62006号 [2] 生物导体,2006年。R包版本1.11.3,affydata:Affymetrix数据,用于演示;生物导体,2006年。R包版本1.11.3,affydata:用于演示的Affymetrix数据 [3] 布兰德,J.M。;Altman,D.G.,《评估两种临床测量方法之间一致性的统计方法》,《柳叶刀》,307-310(1986) [4] 布兰德,J.M。;Altman,D.G.,方法比较研究中的测量一致性,医学研究中的统计方法,8135-160(1999) [5] Bolstad,B。;伊里扎里,R。;Astrand,M。;Speed,T.,基于方差和偏差的高密度寡核苷酸阵列数据归一化方法的比较,生物信息学,19,2,185-193(2003) [6] 陈,Y。;Dougherty,E.R。;Bittner,M.L.,基于比率的决策和CDNA微阵列图像的定量分析,生物医学光学杂志,2364-374(1997) [7] 西南克利夫兰。;Devlin,S.J.,局部加权回归:通过局部拟合进行回归分析的方法,美国统计协会杂志,83,596-610(1988)·Zbl 1248.62054号 [8] 崔,X。;科尔,M.K。;Churchill,G.A.,CDNA微阵列数据的转换,遗传学和分子生物学中的统计应用,2,1(2003年),第4条·兹比尔1038.92015 [9] Dabney,A.R。;Storey,J.D.,双通道微阵列强度相关标准化的新方法,(华盛顿大学生物统计学工作论文系列(2005))·兹比尔1170.62373 [10] 达戈斯蒂诺;斯蒂芬斯(Stephens),《足球技术之善》(Goodness-of-fit Techniques)(1986年),马塞尔·戴克(Marcel-Deker:Marcel-Daker New York),(第4章)·Zbl 0597.62030号 [11] deBoor,C.,《样条线实用指南》(1978),《施普林格:施普林格柏林》·Zbl 0406.41003号 [12] Dudoit,S。;Yang,Y.H。;Callow,M.J。;Speed,T.P.,《在重复CDNA微阵列实验中识别差异表达基因的统计方法》,《中国统计》,第12期,第111-139页(2002年)·Zbl 1004.62088号 [13] Dudoit,S。;Yang,Y.H.,CDNA微阵列数据探索性分析和归一化的生物导体R包,(基因表达数据分析:方法和软件(2003),Springer:Springer New York),73-101 [14] 邓恩,P.K。;Smyth,G.K.,随机分位数残差,计算与图形统计杂志,5,236-244(1996) [15] Durbin,B。;Roke,D.M.,微阵列数据的转换参数估计,生物信息学,19,11,1360-1367(2003) [16] Durbin,B.P。;Roke,D.M.,双色微阵列的方差稳定转换,生物信息学,20,5,660-667(2004) [17] 艾恩·多尔,L。;科拉,I。;盖茨,G。;Givol,D。;许多,E.,乳腺癌的结果特征基因:是否存在一组独特的基因?,生物信息学,21,2,171-178(2005) [18] Futschik,M.E。;Crompton,T.,CDNA微阵列数据归一化的模型选择和效率测试,基因组生物学,5,R60(2004) [19] Futschik,M.E。;Crompton,T.,Olin:双通道微阵列数据的优化规范化、可视化和质量测试,生物信息学应用注释,21,8,1724-1726(2005) [20] Hastie,T.J.,《广义加性模型》(1992),Wadsworth&Brooks/Cole,第7章《S中的统计模型》 [21] 胡贝尔,W。;Boer,J.M。;冯·海德布雷克,A。;Gunawan,B。;温格伦,M。;福泽斯,L。;Poustka,A。;Sueltmann,H.,《肾细胞癌的转录谱分析》,德国Gesellschaft für病理学,86,153-164(2002) [22] Huber,W。;冯·海德布雷克,A。;苏尔特曼,H。;Poustka,A。;Vingron,M.,应用于微阵列数据校准和差异表达定量的方差稳定,生物信息学,18 Suppl.1,S96-S104(2002) [23] Huber,W。;冯·海德布雷克,A。;苏特曼,H。;Poustka,A。;Vingron,M.,用于微阵列数据校准和差异表达量化的方差稳定,生物信息学,18 Suppl 1,S96-104(2002) [24] Huber,W。;冯·海德布雷克,A。;苏特曼,H。;Poustka,A。;Vingron,M.,微阵列数据校准和方差稳定的参数估计,遗传学和分子生物学中的统计应用,2,1(2003)·Zbl 1020.62105号 [25] Huber,W.,von Heydebreck,A.,Vingron,M.,2004年。微阵列强度的误差模型,技术报告6,生物导体项目工作文件。URL citeseer.ist.psu.edu/article/newton99differential.html;Huber,W.,von Heydebreck,A.,Vingron,M.,2004年。微阵列强度的误差模型,技术报告6,生物导体项目工作文件。URL citeseer.ist.psu.edu/article/newton99differential.html [26] Ideker,T。;托尔森,V。;西格尔,A.F。;Hood,L.E.,通过微阵列数据的最大似然分析测试差异表达基因,计算生物学杂志,7,6,805-817(2000) [27] Ioanidis,J.P.A.,《微阵列和分子研究:噪音发现?》?,《柳叶刀》,365、9458、454-455(2005) [28] 科尔,M.K。;Churchill,G.A.,基因表达微阵列的实验设计,生物统计学,2,2,183-201(2001)·Zbl 1097.62562号 [29] 科尔,M.K。;莱特,E.H。;皮卡德,L。;Churchill,G.A.,微阵列实验中的变异来源,(基因组学的计算和统计方法(2002),MA Kluwer学术出版社:MA Kluwer学术出版社Norwell),(第3章) [30] Khondoker,M.R。;格拉斯比,C.A。;Worton,B.J.,使用微阵列的多个激光扫描对基因表达进行统计估计,生物信息学,22,2,215-219(2006) [31] 科茨,S。;Kozubowski,T.J。;Podgorski,K.,《拉普拉斯分布与推广》(The Laplace Distribution and Generalizations)(1998),伯克豪泽:伯克豪塞柏林 [32] Lama,N。;安布罗吉,F。;Antolini,L。;Boracchi,P。;Biganzoli,E.,乳腺癌微阵列数据分析中的一些问题和观点:综合研究的必要性,(EWADP 2004,第一届欧洲诊断性能评估研讨会(2004)) [33] Lee,M.-L.T.,微阵列基因表达数据分析(2004),波士顿Kluwer学术出版社,电子图书,ISBN:0792370872 [34] Lee,M.-L.T.,《微阵列基因表达数据分析》(2004),波士顿Kluwer学术出版社,7.1阵列数据中的缺失值,第85-86页 [35] Lemarechal,C.,非光滑优化中的束方法(IIASA系列论文集(1977))·Zbl 0398.90088号 [36] Lindsey,J.K.,《广义线性模型的一些扩展综述》,《医学统计学》,第18期,第2223-236页(1999年) [37] 卢克桑,L。;Vlcek,J.,算法811:Nda:不可微优化算法,ACM数学软件汇刊,27,2,193-213(2001)·Zbl 1070.65552号 [38] 米诺,A.M。;Ruggieri,M.,《指数功率分布的软件工具:软件包》,j-j-STAT-SOFT,12,4,1-24(2005) [39] Pearson,E.S。;Stephens,M.A.,《基于(w_n^2)和(u_n^2http://www.jstor.org/stable/2333974 ·Zbl 0221.62015号 [40] 波切特,N。;DeSmet,F。;苏肯斯,J.A.K。;DeMoor,B.L.R.,微阵列数据分类的系统基准:评估非线性和降维的作用,生物信息学,20,17,3185-3195(2004) [41] 普格,P。;Stephens,M.A.,《拉普拉斯分布的拟合检验及其应用》,《技术计量学》,42,4,417-424(2000),网址http://www.jstor.org/stable/1270952 ·Zbl 0996.62050号 [42] Purdom,E。;Holmes,S.P.,基因表达数据的误差分布,遗传学和分子生物学中的统计应用,4,1(2005),第16条·Zbl 1083.62114号 [43] 邱,X。;布鲁克斯,A.I。;克莱巴诺夫,L。;Yakovlev,A.,标准化对微阵列数据相关结构的影响,BMC生物信息学,6,20(2005) [44] Quackenbush,J.,《微阵列数据规范化和转换》,《自然遗传学》,32 Suppl,496-501(2002) [45] R开发核心团队,2004年。R: 统计计算语言和环境,R统计计算基金会,奥地利维也纳,ISBN 3-900051-00-3,URL网址:http://www.R-project.org; R开发核心团队,2004年。R: 统计计算语言和环境,R统计计算基金会,奥地利维也纳,ISBN 3-900051-00-3,URL网址:http://www.R-project.org [46] Rider,P.R.,《广义误差定律》,《美国统计协会杂志》,第19、146、217-220页(1924年) [47] Roke,D.M。;Durbin,B.,基因表达阵列的测量误差模型,计算生物学杂志,8,61555-569(2001) [48] Russo,G。;泽加,C。;Giordano,A.,微阵列技术在人类癌症中的优势和局限性,Oncogene,22,42,6497-6507(2003) [49] Schwarz,G.,估算模型的维度,《统计年鉴》,第6461-464页(1978年)·Zbl 0379.62005年 [50] 沙洛夫,V。;Kwong,K.Y。;B.弗兰克。;陈,E。;哈塞曼,J。;Gaspard,R。;Yu,Y。;杨,I。;Quackenbush,J.,对数比率的极限,BMC生物技术,4,3(2004) [51] 微阵列实验中的分类,(Speed,T.,基因表达微阵列数据的统计分析(2003),CRC出版社),93-158,(第3章)·Zbl 1108.62331号 [52] Stephens,M.A.,Edf统计拟合优度和一些比较,美国统计协会杂志,69,730-737(1974) [53] Stephens,M.A.,未知参数的良好统计的渐近结果,统计年鉴,4357-369(1976)·Zbl 0325.62014号 [54] Strimmer,K.,《基因表达测量误差建模:准似然方法》,BMC生物信息学,4,10(2003) [55] Tarca,A.L。;库克,J.E.K。;Mackay,J.,CDNA微阵列数据空间和强度相关标准化的稳健神经网络方法,生物信息学,21,11,2674-2683(2005) [56] Tibshirani,R.J。;Efron,B.,微阵列中的预验证和推断,遗传学和分子生物学中的统计应用,1,1,1-18(2002),URLhttp://www.bepress.com/sagmb/vol1/iss1/art1 ·Zbl 1037.62116号 [57] van’t Veer,L.J。;戴,H。;van de Vijver,M.J。;何,Y.D。;哈特,A.A。;毛先生。;彼得斯,H.L。;van der Kooy,K。;Marton,M.J。;Witteveen,A.T。;施赖伯,G.J。;科尔霍芬,R.M。;罗伯茨,C。;Linsley,P.S。;Bernards,R。;Friend,S.H.,基因表达谱预测乳腺癌的临床结果,Nature,415530-536(2002) [58] Vianelli,S.,《非模式一般delle曲线正常频率下的变量La misura della variabilita conditionata》,统计,23,447-474(1963) [59] 威特·E。;McClure,J.,基因表达实验中信号审查的统计调整,生物信息学,19,9,1055-1060(2003) [60] 威特·E。;McClure,J.,《微阵列统计》(2003),John Wiley&Sons [61] 沃克曼,C。;Jensen,L.J。;贾默,H。;戈蒂埃,R.L。;尼尔森,H.B。;尼尔森,H.-H.C。;布鲁纳克,S。;Knudsen,S.,减少DNA微阵列实验中变异性的新非线性归一化方法,基因组生物学,3,9(2002),research0048 [62] 杨,I.V。;陈,E。;Hasseman,J.P。;Liang,W。;B.C.弗兰克。;王,S。;沙洛夫,V。;赛义德,A.I。;怀特,J。;李,J。;Lee,N.H。;叶特曼,T.J。;Quackenbush,J.,《折叠内:评估微阵列分析中的差异表达测量和再现性》,《基因组生物学》,3,11(2002),研究0062 [63] Yang,Y.H。;Dudoit,S。;卢,P。;Lin,D.M。;彭,V。;Ngai,J。;Speed,T.P.,CDNA微阵列数据的归一化:一种处理单个和多个幻灯片系统变化的稳健复合方法,核酸研究,30,4(2002),e15 [64] 杨永华。;Speed,T.,CDNA微阵列实验的设计问题,《自然评论遗传学》,3,8,579-588(2002) [65] Yeung,K.Y。;Bäumgartner,R.E.,具有重复测量的微阵列数据的多类分类:应用于癌症,基因组生物学,4,12,R83(2003) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。