×

微阵列数据质量评估和控制中统计方法之间一致性的实证研究。 (英文) Zbl 1304.65066号

摘要:由于微阵列数据质量可以影响微阵列分析过程的每个步骤,因此质量评估和控制是不可或缺的一部分。它检测超出可接受的随机波动水平的发散测量。该实证研究确定了arrayQualityMetrics软件包版本2.2.2中用于微阵列异常值检测的六种质量评估方法之间的关联和相关性。为了评估两种不同的一致性测试——Cohen’s Kappa,采用同质性边缘标准和AC1统计——,使用了来自公共ArrayExpress数据库的Pearson相关系数和真实微阵列数据。在目前提出的六种统计方法中,只有四种方法可以评估数据集的质量,以全面量化大量微阵列中的质量信息。这节省了计算时间,降低了分析员的决策复杂性。新提出的规则通过生物医学研究的数据集进行了验证。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奥特曼DG(1991)医学研究实用统计学。查普曼&霍尔,博卡配给
[2] Berrar,DP,Dubitzky,W,Granzow,M(编辑)(2003)微阵列数据分析的实用方法。Kluwer学术出版集团,伦敦
[3] Brazma A(2009)关于微阵列实验(miame)的最低信息——成功、失败、挑战。科学世界J 9:420–423·doi:10.1100/tsw.2009.57
[4] Brettschneider J、Collin F、Bolstad BM、Speed TP(2007)《短寡核苷酸阵列的质量评估》
[5] Burgoon LD、Eckel-Passow JE、Gennings C、Boverhof DR、Burt JW、Fong CJ、Zacharewski TR(2005)《微阵列数据质量和过程控制保证协议》。核酸研究33:1–11·doi:10.1093/nar/gni167
[6] Fleiss JL、Levin BA、Levin B、Paik MC(2003)《比率和比例的统计方法》。Wiley-Interscience,纽约·Zbl 1034.62113号
[7] Gautier L、Cope L、Bolstad BM、Irizarry RA(2004)affy–探针水平上的affymetrix基因芯片数据分析。生物信息学20(3):307–315·doi:10.1093/bioinformatics/btg405
[8] Gentleman R、Carey V、Huber W、Irizarry R、Dudoit S(2005)《使用R和生物导体的生物信息学和计算生物学解决方案》,第1版。柏林施普林格·Zbl 1142.62100号
[9] RC、Carey VJ、Bates DM、Bolstad B、Dettling M、Dudoit S、Ellis B、Gautier L、Ge Y、Gentry J、Hornik K、Hothorn T、Huber W、Iacus S、Irizarry R、Leich F、Li C、Maechler M、Rossini AJ、Sawitzki G、Smith C、Smiths G、Tierney L、Yang JYH、Zhang J(2004)《生物导体:计算生物学和生物信息学的开放软件开发》。基因组生物学5(10):R80·doi:10.1186/gb-2004-5-10-r80
[10] Gewet K(2002)《水间可靠性手册》。技术报告,STATAXIS出版公司
[11] Gewet K(2002),《群体间可靠性:对特征流行率和边际同质性的依赖性》。统计方法评级机构间可靠性评估2:1–9
[12] Huber W(2008年9月)第六个生活质量和生物资源管理框架方案。技术报告、微阵列和基因表达数据协会、EMERALD研讨会
[13] Hummel M、Bentink S、Berger H、Klapper W、Wessendorf S、Barth TFE、Bernd H-W、Cogliatti SB、Dierlamm J、Feller AC、Hansmann M-L、Haralambieva E、Harder L、Hasenclever D、Khn M、Lenze D、Lichter P、Martin-Subero JI、Möller P、Müller-Hermelink H-K、Ott G、Parwaresch RM、Pott C、Rosenwald A、Rosolowski M、Schwenen C、Stürzenhofecker B、,Szczepanowski M、Trautmann H、Wacker H-H、Spang R、Loefler M、Trümper L、Stein H、Siebert R(2006)德国克雷布希尔夫恶性淋巴瘤网络项目的分子机制。伯基特淋巴瘤的生物学定义来自转录和基因组分析。《新英格兰医学杂志》354(23):2419–2430·doi:10.1056/NEJMoa055351
[14] Kauffmann A、Gentleman R、Huber W(2009)arrayQualityMetrics–用于微阵列数据质量评估的生物导体包。生物信息学25(3):415–416·doi:10.1093/bioinformatics/btn647
[15] Landis JR,Koch GG(1977)分类数据的观察者一致性测量。生物计量学33(1):159–174·Zbl 0351.62039号 ·doi:10.2307/2529310
[16] McNemar Q(1947)关于相关比例或百分比之间差异的抽样误差的注释。《心理测量学》12:153–157·doi:10.1007/BF02295996
[17] Parkinson H、Kapushesky M、Kolesnikov N、Rustici G、Shojatalab M、Abeygunawardena N、Berube H、Dylag M、Emam I、Farne A、Holloway E、Lukk M、Malone J、Mani R、Pilicheva E、Rayner TF、Rezwan F、Sharma A、Williams E、Bradley XZ、Adamusiak T、Brandizi M、Burdett T、Coulson R、Krestyaninova M、Kurnosov P、Maguire E、Neogi SG、Rocca Serra P,Sansone S-A、Sklyar N、Zhao M、Sarkans U、Brazma A(2009)Arrayexpress更新–从功能基因组学实验档案到基因表达图谱。核酸研究37(数据库问题):D868–D872·doi:10.1093/nar/gkn889
[18] Parkinson H、Kapushesky M、Shojatalab M、Abeygunawardena N、Coulson R、Farne A、Holloway E、Kolesnykov N、Lilja P、Lukk M、Mani R、Rayner T、Sharma A、William E、Sarkans U、Brazma A(2007)Arrayexpress–微阵列实验和基因表达谱的公共数据库。核酸研究35(数据库问题):D747–D750·doi:10.1093/nar/gkl995年
[19] Schmidt M,Böhm D,von Törne C,Steiner E,Puhl A,Pilch H,Lehr H-A,Hengstler JG,Kölbl H,Gehrmann M(2008)体液免疫系统对结节阴性乳腺癌的预后有关键影响。癌症研究68(13):5405–5413·doi:10.1158/0008-5472.CAN-07-5206
[20] Schmidberger M,Mansmann U(2008)高密度寡核苷酸阵列的并行预处理算法。摘自:IEEE并行和分布式处理IPDPS国际研讨会论文集,2008年4月14日至18日,第1-7页
[21] Schmidberger M、Vicedo E、Mansmann U(2009)affypara–用于affymetrix微阵列数据并行预处理算法的生物导体包。Bioninform Biol见解3:83–87
[22] Sotiriou C、Wirapati P、Loi S、Harris A、Fox S、Smeds J、Nordgren H、Farmer P、Praz V、Haibe-Kains B、Desmedt C、Larsimont D、Cardoso F、Peterse H、Nuyten D、Marc B、Van de Vijver MJ、Bergh J、Piccart M、Delorenzi M(2006)《乳腺癌基因表达谱分析:了解组织学分级的分子基础以改善预后》。美国国家癌症研究所杂志98(4):262–272·doi:10.1093/jnci/djj052
[23] Stevens W Richard(1992)UNIX环境中的高级编程。Addison-Wesley,新泽西州上鞍河[u.a.]·Zbl 0883.68034号
[24] Stirewalt DL、Meshinchi S、Kopecky KJ、Fan W、Pogosova-Agadjanyan EL、Engel JH、Cronk MR、Dorcy KS、McQuary AR、Hockenbery D、Wood B、Heimfeld S、Radich JP(2008)《急性髓系白血病异常表达变化基因的鉴定》。基因染色体癌47(1):8–20·doi:10.1002/gcc.20500
[25] Urbanek S(2009)多核:在具有多核或CPU的机器上并行处理R代码,R包版本0.1–3
[26] Vicedo E(2009)大量非对称性基因芯片数据的质量评估
[27] Wang Q、Diskin S、Rappaport E、Attiyeh E、Mosse Y、Shue D、Seiser E、Jagannathan J、Shusterman S、Bansal M、Khazi D、Winter C、Okawa E、Grant G、Cnaan A、Zhao H、Cheung N-K、Gerald W、London W、Matthay KK、Brodeur GM、Maris JM(2006)综合基因组学确定了神经母细胞瘤的不同分子类别,并表明多个基因被dna拷贝数的区域性改变所靶向。癌症研究66(12):6050–6062·doi:10.1158/0008-5472.CAN-05-4618
[28] Wilson CL,Miller CJ(2005)Simpleaffy:用于非对称性线质量控制和数据分析的生物导体包。生物信息学21(18):3683–3685·doi:10.1093/bioinformatics/bti605
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。