×

兹马思-数学第一资源

微阵列数据质量评价与控制统计学方法一致性的实证研究。(英语) Zbl公司 1304.65066
摘要:由于微阵列数据的质量会影响微阵列分析过程的每个步骤,因此质量评估和控制是不可或缺的一部分。它检测超出可接受的随机波动水平的发散测量。这项实证研究确定了arrayQualityMetrics软件包版本2.2.2中用于微阵列异常值检测的六种质量评估方法之间的关联和相关性。为了评估两种不同的一致性检验——Cohen的Kappa(同质性边际标准后)和AC1统计——使用了来自公共ArrayExpress数据库的Pearson相关系数和实际微阵列数据。在目前提出的六种统计方法中,只有四种能够全面量化大系列微阵列中的质量信息,就可以评估数据集的质量。这为分析员节省了计算时间并降低了决策复杂性。新提出的规则用生物医学研究的数据集进行了验证。
理学硕士:
65立方英尺 统计计算问题(MSC2010)
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Altman DG(1991)医学研究实用统计学。查普曼;霍尔,博卡配给
[2] Berrar,DP,Dubitzky,W,Granzow,M(eds)(2003)微阵列数据分析的实用方法。伦敦Kluwer学术出版社集团
[3] Brazma A(2009)微阵列实验(miame)的最低信息——成功、失败、挑战。科学世界J 9:420–423·doi:10.1100/tsw.2009.57
[4] Brettschneider J,Collin F,Bolstad BM,Speed TP(2007)短寡核苷酸阵列的质量评估
[5] Burgoon LD,Eckel Passow JE,Gennings C,Boverhof DR,Burt JW,Fong CJ,Zacharewski TR(2005)微阵列数据质量和过程控制保证协议。核酸研究33:1-11·doi:10.1093/nar/gni167
[6] Fleiss JL,Levin BA,Levin B,Paik MC(2003)比率和比例的统计方法。Wiley Interscience,纽约·Zbl公司 1034.62113
[7] Gautier L,Cope L,Bolstad BM,Irizarry RA(2004)affy–在探针水平分析affymetrix基因芯片数据。生物信息学20(3):307–315·doi:10.1093/bioinformatics/btg405
[8] Gentleman R,Carey V,Huber W,Irizarry R,Dudoit S(2005),使用R和bioconductor 1st edn的生物信息学和计算生物学解决方案。柏林斯普林格·Zbl公司 1142.62100
[9] 绅士RC、凯里VJ、Bates DM、Bolstad B、Dettling M、Dudoit S、Ellis B、Gautier L、Ge Y、Gentry J、Hornik K、Hothorn T、Huber W、Iacus S、Irizarry R、Leisch F、Li C、Maechler M、Rossini AJ、Sawitzki G、Smith C、Smyth G、Tierney L、Yang JYH、Zhang J(2004)《生物导体:计算生物学和生物信息学的开放软件开发》。基因组生物学5(10):R80·doi:10.1186/gb-2004-5-10-r80
[10] Gewet K(2002)内部评级员可靠性手册。技术报告,STATAXIS出版公司
[11] Gewett K(2002)评价者间信度:对性状流行率和边缘同质性的依赖性。统计方法评分员间的可靠性评估2:1-9
[12] Huber W(2008年9月)《第六个生活质量和生物资源管理框架方案》。技术报告,微阵列和基因表达数据学会,翡翠研讨会
[13] Hummel M、Bentink S、Berger H、Klapper W、Wessendorf S、Barth TFE、Bernd H-W、Cogliatti SB、Dierlamm J、Feller AC、Hansmann M-L、Haralambieva E、Harard L、Hasenclever D、Khn M、Lenze D、Lichter P、Martin Subero JI、Mö小P,MüLer Hermelink H-K、Ott G、Parwaresch RM、Pott C、Rosenwald A、Rosolowski M、Schwaenen C、Stürzenhofecker B、Szczepanowski M、Trautmann H、Wacker H-H、Spang R、Loeffler M、Trümper L,Stein H,Siebert R(2006)《恶性淋巴瘤的分子机制》,德国Krebshilfe项目。从转录和基因组分析对伯基特淋巴瘤的生物学定义。英国医学杂志354(23):2419–2430·doi:10.1056/NEJMoa055351
[14] 2009年哈伯曼微阵列质量评估数据包。生物信息学25(3):415-416·Zbl公司 05743749·doi:10.1093/生物信息学/btn647
[15] Landis JR,Koch GG(1977)分类数据的观察者一致性测量。生物特征33(1):159–174·Zbl公司 351.62039·内政部:10.2307/2529310
[16] McNemar Q(1947)关于相关比例或百分比之间差异的抽样误差的注记。心理测量学12:153-157·doi:10.1007/BF02295996
[17] Parkinson H、Kapushesky M、Kolesnikov N、Rustici G、Shojatalab M、Abeygunawardena N、Berube H、Dylag M、Emam I、Farne A、Holloway E、Luck M、Malone J、Mani R、Pilicheva E、Rayner TF、Rezwan F、Sharma A、Williams E、Bradley XZ、Adamusiak T、Brandizi M、Burdett T T、Coulson R、Krestianova M、Kurnosov P、Maguire E、Neogi SG、Rocca Serra P,Sansone S-A,Sklyar N,Zhao M,Sarkans U,Brazma A(2009)Arrayexpress更新-从功能基因组学实验档案到基因表达图谱。核酸研究37(数据库问题):D868–D872·Zbl公司 05746642·doi:10.1093/nar/gkn889
[18] Parkinson H、Kapushesky M、Shojatalab M、Abeygunawardena N、Coulson R、Farne A、Holloway E、Kolesnykov N、Lilja P、Luck M、Mani R、Rayner T、Sharma A、William E、Sarkans U、Brazma A(2007)Arrayexpress——微阵列实验和基因表达谱的公共数据库。核酸Res 35(数据库问题):D747–D750·Zbl公司 05438129·doi:10.1093/nar/gkl995
[19] 施密特M,Bö嗯,冯·Törne C、Steiner E、Puhl A、Pilch H、Lehr H-A、Hengstler JG、Kölbl H,Gehrmann M(2008)体液免疫系统对淋巴结阴性乳腺癌的预后有重要影响。癌症研究68(13):5405-5413·doi:10.1158/0008-5472.CAN-07-5206
[20] Schmidberger M,Mansmann U(2008)高密度寡核苷酸阵列的并行预处理算法。在:IEEE并行和分布式处理IPDPS国际研讨会论文集,2008年4月14-18日,第1-7页
[21] Schmidberger M,Vicedo E,Mansmann U(2009)affypara–用于affymetrix微阵列数据并行预处理算法的生物导体包。生物信息生物观察3:83-87
[22] Sotirio C、Wirapati P、Loi S、Harris A、Fox S、Smeds J、Nordgren H、Farmer P、Praz V、Haibe Kains B、Desmedt C、Larsimont D、Cardoso F、Peterse H、Nuyten D、Marc B、Van de Vijver MJ、Bergh J、Piccart M、Delorenzi M(2006)《乳腺癌的基因表达谱:了解组织学分级的分子基础以改善预后》。国家癌症研究杂志98(4):262–272·doi:10.1093/jnci/djj052
[23] Stevens W Richard(1992)UNIX环境中的高级编程。Addison Wesley,新泽西州上鞍河[美国]·Zbl公司 883.68034
[24] Stirewalt DL,Meshinchi S,Kopecky KJ,Fan W,Pogosova Agadjanyan EL,Engel JH,Cronk MR,Dorcy KS,McQuary AR,Hockenbery D,Wood B,Heimfeld S,Radich JP(2008)《急性髓系白血病异常表达改变基因的鉴定》。基因染色体癌症47(1):8–20·doi:10.1002/gcc.20500
[25] Urbanek S(2009)《多核:在具有多核或CPU的机器上并行处理R代码》,R程序包版本0.1–3
[26] Vicedo E(2009)大量affymetrix微阵列数据的质量评估
[27] Wang Q、Diskin S、Rappaport E、Attiyeh E、Mosse Y、Shue D、Seiser E、Jagannathan J、Shusterman S、Bansal M、Khazi D、Winter C、Okawa E、Grant G、Cnaan A、Zhao H、Cheung N-K、Gerald W、伦敦W、Matthay KK、Brodeur GM,Maris JM(2006)整合基因组学确定了神经母细胞瘤的不同分子类型,并表明多个基因是通过dna拷贝数的区域性改变来靶向的。癌症研究66(12):6050–6062·doi:10.1158/0008-5472.CAN-05-4618
[28] Wilson CL,Miller CJ(2005)Simpleaffy:用于affymetrix质量控制和数据分析的生物导体包。生物信息学21(18):3683–3685·doi:10.1093/bioinformatics/bti605
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。