×

NGS亚硫酸氢盐协议甲基化分析中的错误纠正。 (英语) Zbl 1460.92154号

Elloumi,Mourad(编辑),《下一代测序数据的算法》。技术、方法和应用。查姆:斯普林格。167-183(2017年)。
概述:全基因组亚硫酸氢盐测序(WGBS)已成为DNA甲基化研究的主要技术,因为它在速度、特异性和解决非CpG上下文甲基化或半甲基化等新的生物学意义方面具有巨大潜力。然而,尽管改进意味着WGBS的出现,但处理和分析结果数据集并不像其他甲基化分析那样简单,应特别注意获得可靠的结果。据我们所知,目前尚不存在对甲基化水平测量偏差的误差源以及为处理该偏差而提出的不同算法的广泛综述。因此,在本章中,将对所有已知的WGBS误差源进行广泛审查和批判性评估,以便提出一些最佳实践,以处理WGBS分析中的所有偏差源。
关于整个系列,请参见[Zbl 1383.68005号].

MSC公司:

92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bonasio,R.,Tu,S.,Reinberg,D.:表观遗传状态的分子信号。《科学》330(6004),612-616(2010)·doi:10.1126/科学.1191078
[2] Lister,R.,Ecker,J.R.:寻找第五个碱基:胞嘧啶甲基化的全基因组测序。基因组研究19(6),959-966(2009)·doi:10.1101/gr.083451.108
[3] Jones,P.A.:DNA甲基化的功能:岛屿、起始位点、基因体及其他。Genet国家牧师。13(7), 484-492 (2012) ·doi:10.1038/nrg3230文件
[4] Hotchkiss,R.D.:用纸色谱法定量分离嘌呤、嘧啶和核苷。生物学杂志。化学。175(1), 315-332 (1948)
[5] 里格斯,A.D.:X失活、分化和DNA甲基化。细胞遗传学。细胞遗传学。14(1), 9-25 (1975) ·doi:10.1159/000130315
[6] Holliday,R.,Pugh,J.E.:发育过程中的DNA修饰机制和基因活性。《科学》187(4173),226-232(1975)·doi:10.1126/science.111098
[7] Laird,P.W.:全基因组DNA甲基化分析的原则和挑战。Genet国家牧师。11(3), 191-203 (2010) ·doi:10.1038/nrg2732
[8] Frommer,M.、McDonald,L.E.、Millar,D.S.、Collis,C.M.、Watt,F.、Grigg,G.W.、Molloy,P.L.、Paul,C.L.:一种基因组测序协议,可在单个DNA链中产生5-甲基胞嘧啶残基的阳性显示。程序。国家。阿卡德。科学。美国89(5),1827-1831(1992)·doi:10.1073/pnas.89.5.1827
[9] Xi,Y.,Li,W.:Bsmap:全基因组亚硫酸氢盐序列绘图程序。BMC生物信息。10, 232 (2009) ·doi:10.1186/1471-2105-10-232
[10] Chen,P.Y.,Cokus,S.J.,Pellegrini,M.:Bs探索者:亚硫酸氢盐测序的精确映射。BMC生物信息。11, 203 (2010) ·数字对象标识代码:10.1186/1471-2105-11-203
[11] Guo,W.、Fiziev,P.、Yan,W.、Cokus,S.、Sun,X.、Zhang,M.Q.、Chen,P.Y.、Pellegrini,M.:Bs-seeker2:亚硫酸氢盐测序数据的通用比对管道。BMC基因组学14,774(2013)·doi:10.1186/1471-2164-14-774
[12] Hach,F.、Hormozdiari,F.,Alkan,C.、HormoSdiari,F、Birol,I.、Eichler,E.E.、Sahinalp,S.C.:mrsFAST:一种用于短读映射的缓存可访问算法。自然方法7(8),576-577(2010)
[13] Krueger,F.,Andrews,S.R.:Bismark:用于亚硫酸氢盐-Seq应用的灵活对准剂和甲基化调用者。生物信息学27(11),1571-1572(2011)·doi:10.1093/bioinformatics/btr167
[14] Pedersen,B.,Hsieh,T.F.,Ibarra,C.,Fischer,R.L.:甲基编码器:亚硫酸氢盐处理序列的软件管道。生物信息学27(17),2435-2436(2011)·doi:10.1093/bioinformatics/btr394
[15] Hackenberg,M.,Barturen,G.,Oliver,J.L.:In:Tatarinova,T.(编辑)《高通量测序数据中的DNA甲基化分析》,DNA甲基化-从基因组学到技术,InTech(2012)。doi:10.5772/34825·doi:10.5772/34825
[16] Chatterjee,A.、Stockwell,P.A.、Rodger,E.J.、Morison,I.M.:全基因组亚硫酸氢盐序列数据的比对软件比较。《核酸研究》40(10),e79(2012)·doi:10.1093/nar/gks150
[17] Frith,M.C.,Mori,R.,Asai,K.:一种主要是传统的方法可以改进亚硫酸氢盐转化DNA的比对。《核酸研究》40(13),e100(2012)·doi:10.1093/nar/gks275
[18] Kunde-Ramamoorthy,G.,Coarfa,C.,Laritsky,E.,Kessler,N.J.,Harris,R.A.,Xu,M.,Chen,R.,Shen,L.,Milosavljevic,A.,Waterland,R.A.:全基因组亚硫酸氢盐测序映射算法的比较和定量验证。核酸研究42(6),e43(2014)·doi:10.1093/nar/gkt1325
[19] Schultz,M.D.、Schmitz,R.J.、Ecker,J.R.:为分析单碱基分辨率DNA甲基体“找平”竞争环境。趋势Genet。28(12), 583-585 (2012)
[20] Beck,S.,Rakyan,V.K.:甲基组:全球DNA甲基化分析方法。趋势Genet。24(5), 231-237 (2008) ·doi:10.1016/j.tig.2008.01.006
[21] Krueger,F.、Kreck,B.、Franke,A.、Andrews,S.R.:使用短亚硫酸氢盐测序数据进行DNA甲基组分析。自然方法9(2),145-151(2012)·doi:10.1038/nmeth.1828
[22] Cokus,S.J.、Feng,S.、Zhang,X.、Chen,Z.、Merriman,B.、Haudenschild,C.D.、Pradhan,S.,Nelson,S.F.、Pellegrini,M.、Jacobsen,S.E.:拟南芥基因组的Shotgun亚硫酸氢盐测序揭示了DNA甲基化模式。《自然》452(7184),215-219(2008)·doi:10.1038/nature06745
[23] Meissner,A.,Gnirke,A.,Bell,G.W.,Ramsahoye,B.,Lander,E.S.,Jaenisch,R.:用于比较高分辨率DNA甲基化分析的减少代表性亚硫酸氢盐测序。《核酸研究》33(18),5868-5877(2005)·doi:10.1093/nar/gki901
[24] Hansen,K.D.,Langmead,B.,Irizarry,R.A.:B平滑:从整个基因组亚硫酸氢测序读取到差异甲基化区域。基因组生物学。13(10),R83(2012)·doi:10.1186/gb-2012-13-10-r83
[25] Andrews,S.:FastQC:fastq数据的质量控制应用程序(2010年)。在线获取地址:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
[26] 汉农:Fastx-toolkit(2009)
[27] Martin,M.:Cutadapt从高通量测序读取中删除适配器序列。EMBnet。J.17(1),10-12(2011)·doi:10.14806/ej.17.1.200
[28] Bolger,A.M.、Lohse,M.、Usadel,B.:Trimmomatic:Illumina序列数据的灵活修剪器。生物信息学30(15),2114-2120(2014)·doi:10.1093/生物信息系统/btu170
[29] Hansen,K.D.,Brenner,S.E.,Dudoit,S.:随机六聚体启动引起的Illumina转录组测序偏差。《核酸研究》38(12),e131(2010)·doi:10个
[30] Schwartz,S.、Oren,R.、Ast,G.:检测和消除下一代测序读数分析中的偏差。《公共科学图书馆·综合》6(1),e16685(2011)·doi:10.1371/journal.pone.0016685
[31] Poptsova,M.S.,Il’icheva,I.A.,Nechipurenko,D.Y.,Panchenko,L.A.,Khodikov,M.V.,Oparina,N.Y.,Polozov,R.V.,Nechiprinko,Y.D.,Grokhovsky,S.L.:下一代测序中的非随机DNA片段。科学。代表4,4532(2014)·doi:10.1038/srep04532
[32] Aird,D.,Ross,M.G.,Chen,W.S.,Danielsson,M.,Fennell,T.,Russ,C.,Jaffe,D.B.,Nusbaum,C.,Gnirke,A.:分析和最小化Illumina测序库中的PCR扩增偏差。基因组生物学。12(2),R18(2011)·doi:10.1186/gb-2011-12-2-r18
[33] Benjamini,Y.,Speed,T.P.:总结和纠正高通量测序中的GC含量偏差。《核酸研究》40(10),e72(2012)·doi:10.1093/nar/gks001
[34] Miura,F.,Enomoto,Y.,Dairiki,R.,Ito,T.:通过亚硫酸氢盐后适配器标记进行无扩增的全基因组亚硫酸氢盐测序。《核酸研究》40(17),e136(2012)·doi:10.1093/nar/gks454
[35] Ziller,M.J.,Hansen,K.D.,Meissner,A.,Aryee,M.J.:通过全基因组亚硫酸氢盐测序进行甲基化分析的覆盖建议。《自然方法》12(3),230-232(2015)·doi:10.1038/nmeth.3152
[36] Kozarewa,I.,Ning,Z.,Quail,M.A.,Sanders,M.J.,Berriman,M.,Turner,D.J.:无扩增Illumina序列文库制备有助于改进(g+c)偏向基因组的映射和组装。自然方法6(4),291-295(2009)·doi:10.1038/nmeth.1311
[37] Li,H.、Handsaker,B.、Wysoker,A.、Fennell,T.、Ruan,J.、Homer,N.、Marth,G.、Abecasis,G.和Durbin,R.《亚组基因组项目数据处理:序列比对/地图格式和样本工具》。生物信息学25(16),2078-2079(2009)
[38] 广泛机构:一组用于处理BAM中下一代测序数据的工具。在线获取:http://broadinstitute.github.io/picard网站/
[39] Barturen,G.、Rueda,A.、Oliver,J.L.、Hackenberg,M.:甲基提取物:高质量的甲基化图谱和来自全基因组亚硫酸氢盐测序数据的SNV调用。F1000Res 2,217(2013)
[40] Cock,P.J.、Fields,C.J.、Goto,N.、Heuer,M.L.、Rice,P.M.:具有质量分数的序列的sanger FASTQ文件格式,以及Solexa/Illumina FASTQ变体。《核酸研究》38(6),1767-1771(2010)·doi:10.1093/nar/gkp1137
[41] James Kent,W.、Sugnet,C.W.、Furey,T.S.、Roskin,K.M.、Pringle,T.H.、Zahler,A.M.、Haussler,D.:加州大学旧金山分校的人类基因组浏览器。基因组研究12(6),996-1006(2002)·数字对象标识代码:10.1101/gr.229102
[42] Langmead,B.,Trapnell,C.,Pop,M.,Salzberg,S.L.:短DNA序列与人类基因组的超快和记忆效率比对。基因组生物学。10(3),R25(2009)·doi:10.1186/gb-2009-10-3-r25
[43] Li,H.:通过碱基比对质量改进SNP发现。生物信息学27(8),1157-1158(2011)·doi:10.1093/bioinformatics/btr076
[44] Langmead,B.,Salzberg,S.L.:与Bowtie 2进行快速定距对准。自然方法9(4),357-359(2012)·doi:10.1038/nmeth.1923
[45] Fuller,C.W.,Middendorf,L.R.,Benner,S.A.,Church,G.M.,Harris,T.,Huang,X.,Jovanovich,S.B.,Nelson,J.R.,Schloss,J.A.,Schwartz,D.C.,Vezenov,D.V.:合成测序的挑战。自然生物技术。27(11),1013-1023(2009)·doi:10.1038/nbt.1585
[46] Taub,M.A.,Corrada Bravo,H.,Irizarry,R.A.:克服下一代测序数据中的偏差和系统错误。《基因组医学》2(12),87(2010)·doi:10.1186/gm208
[47] Del Fabbro,C.、Scalabrin,S.、Morgante,M.、Giorgi,F.M.:对Illumina NGS数据分析中的读数微调效应进行广泛评估。《公共科学图书馆·综合》8(12),e85024(2013)·doi:10.1371/journal.pone.0085024
[48] Minoche,A.E.,Dom,J.C.,Himmelbauer,H.:评估Illumina HiSeq和基因组分析仪系统生成的基因组高通量测序数据。基因组生物学。12(11),R112(2011)·doi:10.1186/gb-2011-12-11-r112
[49] Liu,Y.,Siegmund,K.D.,Laird,P.W.,Berman,B.P.:Bis-SNP:结合DNA甲基化和SNP需要亚硫酸氢盐-seq数据。基因组生物学。13(7),R61(2012)·doi:10.1186/gb-2012-13-7-r61
[50] DePristo,M.A.,Banks,E.,Poplin,R.,Garimella,K.V.,Maguire,J.R.,Hartl,C.,Philippakis,A.A.,del Angel,G.,Rivas,M.A.;Hanna,M.,McKenna,A.,Fennell,T.J.,Kernytsky,A.M.,Sivachenko,A.Y.,Cibulskis,K.,Gabriel,S.B.,Altshuler,D.,Daly,M.J.:使用下一代DNA测序数据进行变异发现和基因分型的框架。自然遗传学。43(5), 491-498 (2011) ·印尼盾:10.1038/ng.806
[51] 李斯特,R.、佩利佐拉,M.、多文,R.H.、霍金斯,R.D.、霍恩,G.、托蒂·菲利皮尼,J.、内里,J.R.、李,L.、叶,Z.、Ngo,Q.M.、埃德萨尔,L.,Antosiewicz-Bourget,J.,Stewart,R.,Ruotti,V.、Millar,A.H.、汤姆森,J.A.、Ren,B.、Ecker,J.R.:碱基分辨率下的人类DNA甲基体显示出广泛的表观基因组差异。《自然》462(7271),315-322(2009)·doi:10.1038/nature08514
[52] Hon,G.C.、Hawkins,R.D.、Caballero,O.L.、Lo,C.、Lister,R.、Pelizzola,M.、Valsesia,A.、Ye,Z.、Kuan,S.、Edsall,L.E.等:乳腺癌中的全球DNA低甲基化与抑制性染色质结构域形成和基因沉默耦合。遗传学。第22(2)号决议,246-258(2012)·doi:10.1101/gr.125872.111
[53] Ziller,M.J.、Gu,H.、Muller,F.、Donaghey,J.、Tsai,L.T.、Kohlbacher,O.、De Jager,P.L.、Rosen,E.D.、Bennett,D.A.、Bernstein,B.E.、Gnirke,A.、Meissner,A.:绘制人类基因组的动态DNA甲基化图景。《自然》500(7463),477-481(2013)·doi:10.1038/nature12433
[54] Lin,X.,Sun,D.,Rodriguez,B.,Zhao,Q,Sun,H.,Zhang,Y.,Li,W.:Bseqc:亚硫酸氢盐测序实验的质量控制。生物信息学29(24),3227-3229(2013)·doi:10.1093/bioinformatics/btt548
[55] Sherry,S.T.、Ward,M.H.、Kholodov,M.、Baker,J.、Phan,L.、Smigielski,E.M.、Sirotkin,K.:dbSNP:NCBI遗传变异数据库。《核酸研究》29(1),308-311(2001)
[56] Consortium Genomes Project,Abecasis,G.R.,Altshuler,D.,Auton,A.,Brooks,L.D.,Durbin,R.M.,Gibbs,R.A.,Hurles,M.E.,McVean,G.A.:人群规模测序的人类基因组变异图。《自然》467(7319),1061-1073(2010)
[57] Weisenberger,D.J.、Campan,M.、Long,T.I.、Kim,M.,Woods,C.、Fiala,E.、Ehrlich,M.和Laird,P.W.:通过甲基光分析重复元素DNA甲基化。《核酸研究》33(21),6823-6836(2005)·doi:10.1093/nar/gki987
[58] McKenna,A.、Hanna,M.、Banks,E.、Sivachenko,A.、Cibulskis,K.、Kernytsky,A.、Garimella,K.,Altshuler,D.、Gabriel,S.、Daly,M.和DePristo,M.A.:基因组分析工具包:用于分析下一代DNA测序数据的mapreduce框架。基因组研究20(9),1297-1303(2010)·doi:10.1101/gr.107524.110
[59] Kobolt,D.C.、Chen,K.、Wylie,T.、Larson,D.E.、McLellan,M.D.、Mardis,E.R.、Weinstock,G.M.、Wilson,R.K.、Ding,L.:Varscan:个体和集合样本大规模平行测序中的变异检测。生物信息学25(17),2283-2285(2009)·doi:10.1093/bioinformatics/btp373
[60] Seisenberger,S.、Andrews,S.,Krueger,F.、Arand,J.、Walter,J.,Santos,F.,Popp,C.、Thienpont,B.、Dean,W.、Reik,W.:小鼠原始生殖细胞中全基因组DNA甲基化重编程的动力学。分子细胞48(6),849-862(2012)·doi:10.1016/j.molcel.2012.11.001
[61] Iacobazzi,V.、Castegna,A.、Infantino,V.和Andria,G.:线粒体DNA甲基化作为下一代生物标记物和诊断工具。分子遗传学。Metab公司。110(1-2), 25-34 (2013) ·doi:10.1016/j.ymgme.2013.07.012
[62] Guo,J.U.,Su,Y.,Shin,J.H.,Shin。自然神经科学。17(2), 215-222 (2014) ·doi:10.1038/nn.3607
[63] Guo,W.,Chung,W.Y.,Qian,M.,Pellegrini,M..,Zhang,M.Q.:表征人类多能干细胞中非CpG甲基化的特异性分布。《核酸研究》42(5),3009-3016(2014)·数字对象标识代码:10.1093/nar/gkt1306
[64] M·斯塔德勒。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。