×

DNA片段的概率建模和分析。 (英语) Zbl 1418.92084号

摘要:脱氧核糖核酸(DNA)测序已成为现代生物和医学科学不可或缺的一部分。DNA片段化是一种称为鸟枪测序的主流技术的初步步骤,该技术为DNA测序提供了一种时间和成本有效的策略。在本文中,我们提出了随机DNA片段的概率模型,并导出了具有合适长度的平均片段数以及通过从头开始程序集或基于引用的映射程序集。我们根据核苷酸之间的键断裂概率和参与片段化过程的DNA分子数量来描述覆盖问题,并提供对最佳DNA片段化的见解。我们获得了以指定可靠性重建DNA链所需的最小合适片段数的下限。我们使用我们的DNA片段工具评估得出的结果,该工具证明了基于我们模型的这些结果的有效性。最后,我们根据实际数据的片段大小分布更新了我们的模型。

MSC公司:

92D20型 蛋白质序列,DNA序列

软件:

PBSIM卡
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Baudhuin,L-M,Ferber,M-J,《微型纳米孔DNA测序:加速精准医学之路》,《临床化学》63(3):632-6342017年。
[2] Sanger,F,Nicklen,S,Coulson,A-R,用链终止抑制剂进行DNA测序,美国国家科学院院刊74(12):5463-54671977。
[3] Anderson,S,使用克隆的DNase I生成片段进行Shotgun DNA测序,Nucl Acids Res9(13):3015-30271981。
[4] Ronaghi,M,Uhlen,M,Nyrén,P,基于实时焦磷酸盐的测序方法,科学281(5375):363-3651998。
[5] Sapojnikova,Net al.,《DNA片段化方法的比较-生物芯片技术的应用》,《生物技术杂志》256:1-52017年。
[6] Bell,S-P,Dutta,A,真核细胞中的DNA复制,《生物化学年鉴》71(1):333-3742002。
[7] 布雷斯勒,G,布雷斯勒,M,Tse,D,高通量鸟枪测序的最佳组装,BMC生物信息14(5):S182013·Zbl 1364.94215号
[8] Li,Ret al.,《利用大规模并行短阅读测序重新组装人类基因组》,《基因组研究》20(2):265-2722010年。
[9] Shendure,J,Hanlee,J,下一代DNA测序,国家生物技术26(10):1135-11452008。
[10] Shendure,J,Aiden,E-L,DNA测序的扩展范围,国家生物技术30(11):1084-10942012。
[11] Kircher,M,Kelso,J,高通量DNA测序-概念和局限性,生物测定32(6):524-5362010。
[12] Knierim,Eet al.,下一代测序中长程PCR产物片段化三种方法的系统比较,PloS One6(11):e282402011。
[13] Lam,K-K,Khalak,A,Tse,D,带噪声读数的鸟枪测序的近优组合,BMC生物信息15(9):S4,2014年。
[14] Mohajer,S,Motahari,A,Tse,D,基于参考的DNA鸟枪测序:信息理论极限,Proc。IEEE国际交响乐信息理论(ISIT’13),第1635-16392013页。
[15] Motahari,A,Bresler,G,Tse,D,DNA鸟枪测序的信息理论,IEEE Trans-InfTheory59(10):6273-62892013·Zbl 1364.94215号
[16] 兰德,E-S,沃特曼,M-S,通过指纹随机克隆进行基因组映射:数学分析,基因组学2(3):231-2391988。
[17] Fleischmann,Rd等人,《流感嗜血杆菌Rd.的全基因组随机测序和组装》,科学269(5223):496-5121995。
[18] Wendl,M-C,Barbazuk,W-B,Lander-Waterman理论在筛选DNA文库测序中的扩展,BMC生物信息6(1):2452005。
[19] Wendl,M-C,鸟枪DNA测序的一般覆盖理论,计算机生物学杂志13(6):1177-1196,2006。
[20] Roach,J-C,Thorsson,V,Siegel,A-F,基因组测序停车策略,基因组研究10(7):1020-10302000。
[21] Howison,M,Zapata,F,Edwards,E-J,Dunn,C-W,Bayesian基因组组装和马尔可夫链蒙特卡罗抽样评估,公共科学图书馆One9(6):e994972014。
[22] Ewens,W-J,Grant,G-R,《生物信息学中的统计方法:导论》,施普林格科学与商业媒体,2006年·Zbl 0965.92001
[23] Waterman,M-S,Chen,T,Sun,F,《计算生物学导论:地图、序列和基因组》。,第2版。,CRC出版社,2014年。
[24] Chunyu G等人,核酸随机断裂引物和核酸随机断裂方法,2017年9月。美国专利申请。15/519,530.
[25] Ono,Y,Asai,K,Hamada,M,PBSIM:PacBio读取模拟器以实现准确的基因组组装,生物信息学29(1):119-1212012。
[26] Hostetter,Get al.,《随机DNA片段可通过寡核苷酸阵列CGH检测临床FFPE样本中拷贝数的单拷贝、单外显子改变》,《核酸研究3(2):eq》,2010年。
[27] 宫崎骏,K,随机DNA片段与核酸内切酶V:应用于DNA洗牌,核酸研究30(24):e139,2002。
[28] Head,SR等人,《下一代测序的库构建:概述和挑战》,《生物技术》56(2):612014年。
[29] Blumline J,《人类基因组DNA照明兼容测序的DNA库合成协议的开发》,奥克兰大学博士论文,2017年。
[30] Panteleeva I等人,用生物破坏者优化DNA剪切以制备下一代测序文库({}^circledR,2010)。
[31] Bronner,I-F,Quail,M-A,Turner,D-J,Swerdlow,H,发光体测序的改进方案,Curr Protoc Hum Genet80:11-422014。
[32] Profaizer,T,Coonrod,E-M,Delgado,J-C,Kumánovics A,《片段大小、索引和读取长度对Illumina MiSeq HLA序列影响的报告》,人类免疫学76(12):897-9022015。
[33] Lakha,Wet al.,使用成岩剪切系统和片段分析仪进行DNA片段化和质量控制分析,Nat Meth13(10):iii-iv,2016。
[34] Fleischmann,Aet al.,肉食植物Genlisea属(豆芽孢科)基因组大小和染色体数量的进化,以及被子植物最小基因组大小的新估计,Ann Bot114(8):1651-16632014。
[35] Chikhi,R,Medvedev,P,基因组组装的信息和自动化分子大小选择,生物信息学30(1):31-372013。
[36] Shevchuk,O,Roselius,L,Günther,G,Klein,J,Jahn,D,Steinert,M,Münch,R,Infrea识别转座子突变细菌基因组插入位点的新计算方法,生物信息学28(3):306-310,2011。
[37] Fan,HC等人,通过配对测序分析胎儿和母亲无细胞DNA的大小分布,《临床化学》56(8):1279-12862010。
[38] 机械钉。NGS清理和规模选择,2014年5月。
[39] Lo,C-F,《两个对数正态随机变量的和与差》,《应用数学杂志》2012年:文章编号838397,2012年·Zbl 1260.60018号
[40] Hcine M-B,Bouallegue R,关于对数正态分布对对数正态和的近似,arXiv:1502.036192015。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。