摘要
背景
结果
结论
背景
结果
荧光发射的统计特性
减少位置偏差、相位差和串扰
基于模型的聚类和信息理论库调用
基因组覆盖率统计
基本分布统计
优化标签长度
讨论
结论
方法
样品制备和基因组分析仪测序
人类细胞的测序
数据分析
初步数据转换
基于模型的聚类和数据拟合
基本呼叫和标签长度的截止值
可利用性
工具书类
Bentley DR:全基因组重新排序。 遗传学与发展的当前观点 2006, 16(6):545–552. 2016年10月10日/j.gde.2006.10.009 Chen W、Kalscheu V、Tzschach A、Menzel C、Ullmann R、Schulz M、Erdogan F、Li N、Kijas Z、Arkesteijn G、, 等 .:通过下一代测序绘制易位断点。 基因组研究 2008 Korbel JO、Urban AE、Affourtit JP、Godwin B、Grubert F、Simons J、Kim PM、Palejev D、Carriero NJ、Du L、, 等 .:配对基因绘图揭示了人类基因组中广泛的结构变异。 科学类 2007, 318(5849):420–426. 10.1126/科学.1149504 Hafner M、Landgraf P、Ludwig J、Rice A、Ojo T、Lin C、Holoch D、Lim C、Tuschl T:使用cDNA文库测序鉴定微RNA和其他小调控RNA。 方法 2008, 44(1):3–12. 2016年10月10日/j.ymeth.2007.09.009 Vera JC、Wheat CW、Fescemyer HW、Frilander MJ、Crawford DL、Hanski I、Marden JH:使用454焦磷酸测序对非模式生物进行快速转录组表征。 分子生态学 2008, 17(7):1636–1647. 10.1111/j.1365-294X.2008.03666.x Friedländer MR、Chen W、Adamidi C、Maaskola J、Einspanier R、Knespel S、Rajewsky N:使用miRDeep从深度测序数据中发现微RNA。 Nat生物技术 2008, 26(4):407–415. 10.1038/nbt1394 Mikkelsen T、Ku M、Jaffe D、Issac B、Lieberman E、Giannoukos G、Alvarez P、Brockman W、Kim T、Koche R、, 等 .:多能干细胞和谱系提交细胞染色质状态的全基因组图。 自然 2007, 448(7153):553–560. 10.1038/性质06008 Barski A、Cuddapah S、Cui K、Roh TY、Schones DE、Wang Z、Wei G、Chepelev I、Zhao K:人类基因组中组蛋白甲基化的高分辨率分析。 单元格 2007, 129(4):823–837. 2016年10月10日/j.cell.2007.05.009 Hernandez D、François P、Farinelli L、Osterás M、Schrenzel J:新生细菌基因组测序:在台式计算机上组装数百万个非常短的读取。 基因组研究 2008, 18(5):802–809. 10.1101/gr.072033.107 Margulies M、Egholm M、Altman W、Attiya S、Bader J、Bemben L、Berka J、Braverman M、Chen Y、Chen Z、, 等 .:微细加工高密度微微立方体反应器中的基因组测序。 自然 2005, 437(7057):376–380. 尤因B,格林P:使用phred对自动定序器轨迹进行基线标定。 二、。 错误概率。 基因组研究 1998, 8(3):186–194. Cokus SJ、Feng S、Zhang X、Chen Z、Merriman B、Haudenschild CD、Pradhan S、Nelson S、Pellegrini M、Jacobsen SE:拟南芥基因组的Shotgun亚硫酸氢盐测序揭示了DNA甲基化模式。 自然 2008, 452(7184):215–219. 10.1038/性质06745 Erlich Y、Mitra PP、Delabastide M、McCombie WR、Hannon GJ:Alta-Cyclic:下一代测序的自我优化基调用者。 Nat方法 2008 Dom JC、Lottaz C、Borodina T、Himmelbauer H:高通量DNA测序的超短读数据集中的重大偏差。 核酸研究 2008 Smith A、Xuan Z、Zhang M:使用质量分数和更长的读取时间可以提高Solexa读取映射的准确性。 BMC生物信息学 2008, 9: 128. 10.1186/1471-2105-9-128 Dolan PC,丹佛DR:TileQC:Solexa数据基于瓷砖的质量控制系统。 BMC生物信息学 2008, 9(1):250. 10.1186/1471-2105-9-250 Yakovchuk P、Protozanova E、Frank-Kamenetskii MD:碱基封装和碱基对DNA双螺旋热稳定性的贡献。 核酸研究 2006, 34(2):564–574. 10.1093/nar/gkj454 Cleveland WS:稳健的局部加权回归和平滑散点图。 J Amer统计协会 1979, 74(368):829–836. 10.2307/2286407 Banfield JD,Raftery AE:基于模型的高斯和非高斯聚类。 生物计量学 1993, 49(3):803–821. 10.2307/2532201 Fraley C,Raftery AE:MCLUST:基于模型的聚类分析软件。 J分类 1999, 16(2):297–306. 2007年10月7日/003579900058 Fraley C,Raftery AE:基于模型的聚类、判别分析和密度估计。 J Amer统计协会 2002, 97(458):611–631. 10.1198/016214502760047131 Fraley C,Raftery AE:增强的基于模型的聚类、密度估计和判别分析软件:MCLUST。 J分类 2003, 20(2):263–286. 2007年10月7日/00357-003-0015-3 Cover TM,Thomas JA: 信息论要素。 约翰·威利; 1991 Iseli C,Ambrosini G,Bucher P,Jongeel CV:快速搜索基因组序列中的短词的索引策略。 公共科学图书馆 2007年,2(6):e579。 10.1371/journal.pone.0000579 Myers EW,Miller W:线性空间中的最优对准。 计算应用程序Biosci 1988, 4(1):11–17. Smith A、Xuan Z、Zhang M:使用质量分数和更长的读取时间可以提高Solexa读取映射的准确性。 BMC生物信息学 2008, 9(1):128. 10.1186/1471-2105-9-128 Ferragina P,Manzini G,Mäkinen V,Navarro G:序列和全文索引的压缩表示。 ACM算法事务(TALG) 2007., 3(2): Gräf S、Nielsen FG、Kurtz S、Huynen MA、Birney E、Stunnenberg H、Flicek P:全基因组拼接阵列的优化设计和评估。 生物信息学 2007年,23(13):i195-204。 10.1093/生物信息学/btm200 Pop M,Salzberg SL:新测序技术的生物信息学挑战。 趋势Genet 2008, 24(3):142–149. Hinds DA、Stuve LL、Nilsen GB、Halperin E、Eskin E、Ballinger DG、Frazer KA、Cox DR:三个人群常见DNA变异的全基因组模式。 科学类 2005, 307(5712):1072–1079. 10.1126/科学.1105436
致谢
作者信息
作者和附属机构
通讯作者
其他信息
作者的贡献
电子辅助材料
12859_2008_2416_MOESM1_ESM.png
12859_2008_2416_MOESM2_ESM.png
12859_2008_2416_MOESM3_ESM.png
权利和权限