×

缺失值的顺序插补。 (英语) Zbl 1142.62103号

摘要:由于基因表达数据中经常会出现缺失值,因此开发了许多插补方法,用估计值替换这些未知值。尽管有许多插补方法,但这些现有技术仍有一些缺点。一些插补技术将缺失值的插补限制在一组有限的基因上,而其他插补方法则优化了一个更具全局性的标准,从而使该方法的计算时间变得不可行。其他人可能很快但不准确。因此,本文提出了一种新的、快速且准确的估计方法,称为SEQimpute。
通过引入统计距离最小化而非欧几里德距离的概念,该方法与迄今为止存在的插补方法有着本质上的不同。此外,这种新提出的方法可以很容易地嵌入到多重插补技术中,该技术更适合强调缺失值估计的不确定性。进行了一项比较研究,以评估不同插补方法对缺失值的估计。所提出的插补方法在准确性和计算速度方面优于现有的一些插补方法。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
65立方厘米60 统计中的计算问题(MSC2010)
92C40型 生物化学、分子生物学
65K99美元 数学规划、优化和变分技术的数值方法

软件:

插补
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alizadeh,A.A。;艾森,M.B。;Davis,R.E。;马,C。;Lossos,I.S。;罗森瓦尔德,A。;Boldrick,J.C。;萨贝特,H。;Tran,T。;Yu,X。;鲍威尔,J.I。;Yang,L。;马蒂,G.E。;摩尔,T。;哈德森,J。;卢,L。;刘易斯,D.B。;Tibshirani,R。;Sherlock,G。;Chan,W.C。;格雷纳,T.C。;维森伯格,D.D。;Armitage,J.O。;Warnke,R。;利维,R。;威尔逊,W。;格雷弗,M.R。;Byrd,J.C。;博茨坦,D。;布朗,P.O。;Staudt,L.M.,通过基因表达谱确定的弥漫性大B细胞淋巴瘤的不同类型,《自然》,403,3,503-511(2000)
[2] Bishop,C.M.,贝叶斯PCA,(Kearns,M.S.;Solla,S.A.;Cohn,D.A.,《神经信息处理系统进展》,第11卷(1998)),382-388
[3] Bö,T.H。;Dysvik,B。;Jonassen,I.,LSimpute:用最小二乘法准确估计微阵列数据中的缺失值,《核酸研究》,32,3,e34(2004)
[4] 弗里德兰,S。;Niknejad,A。;Chihara,L.,DNA微阵列缺失数据的同步重建,线性代数应用。,416年8月28日(2006年)·Zbl 1096.62117号
[5] 甘,X。;Liew,A.W.-C。;Yan,H.,基于集合理论框架和生物学知识的微阵列缺失数据插补,核酸研究,34,5,1608-1619(2006)
[6] Golub,T.R。;Slonim,D.K。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J.P。;科勒,H。;卢,M。;唐宁,J.R。;Caligiuri,医学硕士。;哥伦比亚特区布隆菲尔德。;Lander,E.S.,《癌症的分子分类:通过基因表达的类别发现和类别预测》,《科学》,286531-537(1999)
[7] Golub,G.H。;Van Loan,C.F.,《矩阵计算》(1996),约翰霍普金斯大学出版社:约翰霍普金大学出版社巴尔的摩·Zbl 0865.65009号
[8] Kim,K.-Y。;Kim,B.-J。;Yi,G.-Su.,在微阵列中重复使用插补数据可提高插补效率,BMC生物信息学,5160(2004)
[9] Kim,H。;Golub,G.H。;Park,H.,DNA微阵列基因表达数据的缺失值估计:局部最小二乘插补,生物信息学,21887-198(2005)
[10] Nguyen,D.V。;Wang,N。;Carroll,R.J.,微阵列数据缺失值估计的评估,数据科学杂志。,2, 347-370 (2004)
[11] 奥巴,S。;佐藤,M-A。;竹马,I。;蒙登,M。;松原,K-I。;Ishii,S.,基因表达谱数据的贝叶斯缺失值估计方法,生物信息学,192088-2096(2003)
[12] Schafer,J.L.,《不完全多元数据分析》(1997),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0997.62510号
[13] 谢尔,I。;奥尔德林,M。;印度格拉德。;瑟朗,R。;Lyng,H。;Frigessi,A.,缺失值插补对从微阵列数据检测差异表达基因的影响,生物信息学,214272-4279(2005)
[14] Seghal,M.S.B。;贡达尔,I。;Dooley,L.S.,《并列缺失值插补:微阵列数据的一种新的稳健缺失值估计算法》,生物信息学,21,2417-2423(2005)
[15] 俄勒冈州特罗扬斯卡娅。;康托,M。;Sherlock,G。;布朗,P。;哈斯蒂,T。;Tibshirani,R。;博茨坦,D。;Altman,R.B.,DNA微阵列缺失值估计方法,生物信息学,17,520-525(2001)
[16] Walczak,B。;马萨特,D.L.,教程,处理缺失数据。第一部分,化学计量学。智力。实验室,58,15-27(2001)
[17] Wynn,H.P.,《D最优实验设计的序列生成》,《数学年鉴》。Stat.,41,1655-1664(1970)·Zbl 0224.62038号
[18] Yoshimoto,H。;Saltsman,K。;Gasch,A.P。;李海霞。;小川,N.D.B。;布朗,P.O。;Cyert,M.S.,Calcineurin/Crzlp信号通路调控的基因表达的全基因组分析酿酒酵母《生物学杂志》。化学。,277, 34, 31079-31088 (2002)
[19] 周,X。;王,X。;Dougherty,E.R.,使用贝叶斯基因选择的线性和非线性回归进行Missing值估计,生物信息学,192302-307(2003)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。