×

用于建模下一代序列读取比率的统计变化点分析方法。 (英语) Zbl 1349.62546号

Letzter,Gail(编辑)等,《数学科学进展》。美国马里兰州大学医学院帕克分校2015年数学女性协会研讨会的研究。Cham:Springer(ISBN 978-3-319-34137-8/hbk;978-3-3169-34139-2/电子书)。数学女性协会系列6,283-300(2016)。
摘要:统计变点分析的一个关键特征是估计施加在样本数据上的各种统计模型的未知变点位置。这种分析可以通过假设测试过程、模型选择视角或贝叶斯方法等方法进行。变点分析在统计质量控制、金融经济、气候研究、医学、遗传学等研究领域有着广泛的应用。本文将提供一种基于基因组数据建模的变点分析。高通量下一代测序(NGS)技术目前常用于肿瘤和对照样本的剖面分析,以研究DNA拷贝数变体(CNV)。特别是,肿瘤样本的读取计数与对照样本的读取数之比通常用于识别CNV区域。识别CNV区域相当于查找NGS读取比率数据中可能存在的变化点。我们提出了一个变点模型和贝叶斯解,用于估计NGS读取比率数据中的变点位置。对该方法的仿真研究表明了该方法在识别变点位置方面的有效性。将介绍使用乳腺癌/肿瘤细胞系和肺癌细胞系的下一代测序数据,提出的变化点模型在识别DNA拷贝数变异(CNV)区域边界方面的应用。
关于整个系列,请参见[兹比尔1354.00102].

理学硕士:

62页第10页 统计学在生物学和医学中的应用;元分析
62F03型 参数假设检验
10层62层 点估计
2015年1月62日 贝叶斯推断
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] R.Redon、S.Ishiwaka、K.R.Fitch、L.Feuk、G.H.Perry、D.Andrews、H.Fiegler、M.H.Shapero、A.R.Carson、W.Chen、E.K.Cho、S.Dallaire、J.L.Freeman、J.R.Gonzalez、M.Gratacos、J.Huang、D.Kalaitzopoulos、D.Komura、J.R.MacDonald、C.R.Marshall、R.Mei、L.Montgomery、K.Nishimura、K.Okamura、F.Shen、M.J.Somerville、J.Tchinda、A。Valsesia,C.Woodwark,F.Yang,J.Zhang,T.Zerjal,J.Zhang,L.Armengol,D.F.Conrad,X.Estivill,C.Tyler-Smith,N.P.Carter,H.Aburatani,C.Lee,K.W.Jones,S.W.Scherer,M.E.Hurles,人类基因组拷贝数的全球变异。《自然》44444-454(2006)·doi:10.1038/nature05329
[2] B.Stranger、M.Forrest、M.Dunning、C.Ingle、C.Beazley、N.Thorne、R.Redon、C.Bird、A.de Grassi、C.Lee、C.Tyler-Smith、N.Carter、S.W.Scherer、S.Tavar、P.Deloukas、M.E.Hurles、E.T.Dermitzakis,核苷酸和拷贝数变异对基因表达表型的相对影响。《科学》315848(2007)·doi:10.1126/科学.1136678
[3] J.Sebat、B.Lakshmi、D.Malhotra、J.Troge、C.Lese-Martin、T.Walsh、B.Yamrom、S.Yoon、A.Krasnitz、J.Kendall、A.Leotta、D.Pai、R.Zhang、Y.-H.Lee、J.Hicks、S.J.Spence、A.T.Lee、K.Puura、T.Lehtimki、D.Ledbetter、P.K.Gregersen、J.Bregman、J.S.Sutcliffe、V.Jobanputra、W.Chung、D.Warburton、M.C.King、D.Skuse、D.H.Geschwind、,T.C.Gilliam,K.Ye,M.Wigler,新拷贝数突变与自闭症的强关联。《科学》316、445–449(2007)·doi:10.1126/science.1138659
[4] P.J.Campbell、P.J.Stephens、E.D.Pleasance、S.O'Meara、H.Li、T.Santarius、L.A.Stebbings、C.Leroy、S.Edkins、C.Hardy、J.W.Teague、A.Menzies、I.Goodhead、D.J.Turner、C.M.Clee、M.A.Quail、A.Cox、C.Brown、R.Durbin、M.E.Hurles、P.A.W.Edwards、G.R.Bignell、M.R.Stratton、P.A.Futreal、,使用全基因组大规模平行配对测序鉴定癌症中的体获得性重排。自然遗传学。40, 722–729 (2008) ·doi:10.1038/ng.128
[5] H.Stefansson、D.Rujescu、S.Cichon、O.P.H.Pietilinen、A.Ingason、S.Steinberg、R.Fossdal、E.Sigurdsson、T.Sigmundsson、J.E.Builder-Voskamp、T.Hansen、K.D.Jakobsen、P.Muglia、C.Franks、P.M.Matthews、A.Gylfason、B.V.Halldorson、D.Gudbjartsson、T.E.Thorgeirsson、A.Sigurdssen、A.Jonasdottir、A.Jonatodtir、A.Jonasdoter、A.Bjornsson、S。Mattiasdottir、T.Blondal、M.Haraldsson、B.B.Magnusdottir、I.Giegling、H.-J.Mller、A.Hartmann、K.V.Shianna、D.Ge、A.C.Need、C.Crombie、G.Fraser、N.Walker、J.Lonqvist、J.Suvisaari、A.Tuulio-Henriksson、T.Paunio、T.Toulopouou、E.Bramon、M.Di Forti、R.Murray、M.Ruggeri、E.Vassos、S.Tosato、M.Walshe、T.Li、C.Vasilescu、T.W。Mhleisen、A.G.Wang、H.Ullum、S.Djurovic、I.Melle、J.Olesen、L.A.Kiemeney、B.Franke、C.Sabatti、N.B.Freimer、J.R.Gulcher、U.Thorsteinsdottir、A.Kong、O.A.Andreassen、R.A.Ophoff、A.Georgi、M.Rietschel、T.Werge、H.Petursson、D.B.Goldstein、M.M.Nthen、L.Peltonen、D.A.Collier、D.St Clair、K.Stefanson、R.S.Kahn、D.H.Linszen、,J.Van Os,D.Wiersma,R.Bruggeman,W.Cahn,L.De Haan,L.Krabbendam,I.Myin-Germeys,与精神分裂症相关的大重复微缺失。《自然》455,232–236(2008)·doi:10.1038/nature07229
[6] T.-L.Yang、X.-D.Chen、Y.Guo、S.-F.Lei、J.-T.Wang、Q.Zhou、F.Pan、Y.Chen,Z.-X.Zhang、S.-S.Dong、X-H.Xu、H.Yan、X.Liu、C.Qiu、X.-Z.Zhu、T.Chen、M.Li、H.Zhang,L.Zhanng、B.M.Drees、J.J.J.J.Hamilton、C.J.Papsian、R.R.R.Recker、X.-P.Song、J.Cheng、H.-W.Deng、基因组全拷贝数变异研究确定了一,UGT2B17,用于骨质疏松症。Am.J.Hum.遗传学。83(6), 663–674 (2008) ·doi:10.1016/j.ajhg.2008.10.006
[7] A.Rovelet-Lecrux、D.Hannequin、G.Raux、N.Le Meur、A.Laquerrire、A.Vital、C.Dumanchin、S.Feuillette、A.Brice、M.Vercelletto、F.Dubas、T.Frebour、D.Campion,APP基因座重复导致常染色体显性早发性阿尔茨海默病伴大脑淀粉样血管病。自然遗传学。38, 24–26 (2006) ·doi:10.1038/ng1718
[8] S.Moorthie,C.J.Mattocks,C.F.Wright,大规模平行DNA测序技术综述。Hugo J.5,112(2001)
[9] S.Yoon,Z.Xuan,V.Makarov,K.Ye,J.Sebat,使用读取覆盖深度对拷贝数变体进行敏感和准确的检测。基因组研究19,1586–1592(2006)·doi:10.1101/gr.092981.109
[10] C.A.Miller,O.Hampton,C.Coarfa,A.Milosavljevic,ReadDepth:检测短序列读取中拷贝数变化的并行R包。《公共科学图书馆·综合》6(1),e16327(2011)·doi:10.1371/journal.pone.0016327
[11] A.Magi,L.Tattini,T.Pippucci,F.Torricelli,M.Benelli,DNA拷贝数变异检测的读取计数方法。生物信息学28,470–478(2012)·doi:10.1093/bioinformatics/btr707
[12] T.Ji,J.Chen,DNA拷贝数变异研究的下一代测序读取计数数据建模。统计应用程序。遗传学。分子生物学。14, 361374 (2015) ·2017年9月13日Zbl
[13] C.Xie,M.T.Tammi,CNV-seq:使用高通量测序检测拷贝数变化的新方法。BMC生物信息。10, 80 (2009) ·doi:10.1186/1471-2105-10-80
[14] A.B.Olshen,E.S.Venkatraman,R.Lucito,M.Wigler,用于分析基于阵列的DNA拷贝数数据的循环二进制分割。生物统计学5(4),557–572(2004)·Zbl 1155.62478号 ·doi:10.1093/生物统计学/kxh008
[15] D.Y.Chiang、G.Getz、D.B.Jaffe、M.J.T.O'Kelly、X.Zhao、S.L.Carter、C.Russ、C.Nusbaum、M.Meyerson、E.S.Lander,用大规模平行测序对拷贝数变化进行高分辨率绘图。自然方法6,99–103(2009)·doi:10.1038/nmeth.1276
[16] T.M.Kim,L.J.Luquette,R.Xi,P.J.Park,rSW-seq:检测深度测序数据中拷贝数变化的算法。BMC生物信息。11(432), 1471–2105 (2010)
[17] R.Xi,A.G.Hadjipanayis,L.J.Luquette,T.-M.Kim,E.Lee,J.Zhang,M.D.Johnson,D.M.Muzny,D.A.Wheeler,R.A.Gibbs,R.Kucherlapati,P.J.Park,使用贝叶斯信息准则检测全基因组测序数据中的拷贝数变化。PNAS 108,E1128–E1136(2011)·doi:10.1073/pnas.1110574108
[18] J.Chen,A.K.Gupta,《参数统计变化点分析——在遗传学、医学和金融中的应用》,第2版。(Birkhauser,纽约,2012年)·Zbl 1273.62016年 ·doi:10.1007/978-0-8176-4801-5
[19] H.Li,J.Vallandingham,J.Chen,SeqBBS:一种基于变点模型的算法和R包,用于通过测序读数的比率搜索CNV区域,发表在《2013年IEEE基因组信号处理与统计国际研讨会论文集》(2013),第46–49页·doi:10.1109/GENSIPS.2013.6735925
[20] J.Chen,Y.-P.Wang,检测阵列CGH数据中DNA拷贝数变化的统计变化点模型方法。IEEE/ACM传输。计算。生物信息。6, 529–541 (2009) ·doi:10.1109/TCBB.2008.129
[21] J.Chen,A.Yiter,K.-C.Chang,《用贝叶斯方法推断变化点模型并应用于DNA拷贝数实验数据》。J.应用。《法律总汇》第38卷,1899–1913(2011)·doi:10.1080/0226677633.2010.529886
[22] L.J.Vostrikova,检测多维随机过程中的“无序”。苏联。数学。多克。2, 55–59 (1981) ·Zbl 0487.62072号
[23] R.E.Bellman,S.E.Dreyfus,《应用动态规划》(普林斯顿大学出版社,普林斯顿,1962年)·Zbl 0106.34901号 ·doi:10.1515/9781400874651
[24] www.Biobase-international.com
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。