{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2024,6,2],“日期-时间”:“2024-06-02T16:53:37Z”,“时间戳”:1717347217564},“引用-计数”:30,“发布者”:“Springer Science and Business Media LLC”,“问题”:“1”,“内容-域”:{-“域”:[”link.Springer.com“],“交叉标记限制”:false},“short-container-title”:[“BMC生物信息学”],“published-print”:{“date-parts”:[[2008,12]]},“abstract”:“摘要<\/jats:title>\n\n个背景<\/jats:title>\nSolexa \/Illumina短读超高通量DNA测序技术通过DNA菌落的并行序列逐合成产生数百万个短标签(多达36个碱基)。此类高通量数据的处理和统计分析带来了新的挑战;目前,由于无法将标签与参考序列匹配,相当一部分标签被常规丢弃,从而降低了该技术的有效吞吐量<\/jats:p>\n<\/jats:sec>\n\n个结果<\/jats:title>\n我们提出了一种新的基调用算法,该算法利用基于模型的聚类和概率理论来识别模糊基,并用IUPAC符号对其进行编码。我们还使用基于信息内容的分数来选择最佳子标签,以消除接近读取末尾的不确定基数<\/jats:p>\n<\/jats:sec>\n\n个结论<\/jats:title>\n我们表明,与Solexa的数据处理管道相比,该方法平均提高了15%的基因组覆盖率和可用标签数量。提供了一个R包,可以快速准确地调用Solexa的荧光强度文件并生成信息丰富的诊断图<\/jats:p>\n“,”DOI“:”10.1186\/1471-2105-9-431“,”type“:”journal-article“,”created“:{”date-parts“:[[2008,10,14]],”date-time“:”2008-10-14T06:14:16Z“,”timestamp“:1223964856000},”update-policy“:count“:73,”title“:[”Solexa测序数据的概率基调用“]”,“前缀”:“10.1186”,“卷”:“9”,“作者”:[{“给定”:“Jacques”,“家族”:“Rogemont”,“sequence”:“first”,“affiliation”:[]},{“given”:“Arnaud”,”family“:”Amzallag“,”sequence“:”additional“,”affiliance“:[]{”given“Christian”,“family”:“Iseli”,,{“给定”:“Laurent”,“family”:“Farinelli”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Ioannis”,“family”:“Xenarios”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Felix”,“family”:“Naef”,“sequence”:“additional”,“affiliation”:[]},“member”:“297”,“在线发布”:{“date parts”:[[2008,10,13]]]},“reference”:[{“issue”:“6”,“key”:“2416_CR1“,”doi-asserted-by“:”publisher“,”first-page“:”545“,”doi“:”10.1016\/j.gde.2006.10.009“,”volume“:”16“,”author“:”DR Bentley“,”year“:”2006“,”unstructured“:”Bentley DR:全基因组重新排序。《遗传学与发展的当前观点》2006,16(6):545\u2013552。10.1016\/j.gde.2006.10.009“,“journal-title”:“Genetics&Development的当前观点”},{“key”:“2416_CR2”,“volume-title“:“Genome Research”,“author”:“W Chen”,“year”:“2008”,“unstructured”:“Chen W、Kalscheu V、Tzschach A、Menzel C、Ullmann R、Schulz M、Erdogan F、Li N、Kijas Z、Arkesteijn G等:通过下一代测序绘制易位断点。Genome Research 2008.“},{”issue“:”5849“,”key“:”2416_CR3“,”doi-asserted-by“:”publisher“,”first page“:“420”,“doi”:“10.1126\/science.1149504”,“volume”:“318”,“author”:“JO Korbel”,“year”:“2007”,“unstructured”:“Korbel JO、Urban AE、Affourtit JP、Godwin B、Grubert F、Simons J、Kim PM、Palejev D、Carriero NJ、Du L等:配对基因绘图揭示了人类基因组中广泛的结构变异。《科学》2007,318(5849):420\u2013426。10.1126\/science.1149504“,”journal-title“:”science“},{“issue”:“1”,“key”:“2416_CR4”,“doi-asserted-by”:“publisher”,“first-page”:“3”,“doi”:“10.1016\/j.meth.2007.09.009”,“volume”:”44“,”author“M Hafner”,“year”:“2008”,“unstructured”:“Hafner M、Landgraf P、Ludwig J、Rice A、Ojo T、Lin C、Holoch D、Lim C、Tuschl T:使用cDNA文库测序鉴定微RNA和其他小调控RNA。方法2008,44(1):3\u201312。10.1016\/j.ymeth.2007.09.009”,“期刊标题”:“方法”},{“问题”:“7”,“密钥”:“2416_CR5”,“doi断言”:“出版商”,“第一页”:“1636”,“doi”:“10.1111\/j.1365-294X.2008.03666.x”,“卷”:“17”,“作者”:“JC Vera”,“年份”:“2008”,“非结构化”:“Vera JC、Wheat CW、Fescemyer HW、Frilander MJ、Crawford DL、Hanski I、Marden JH:使用454焦磷酸测序对非模式生物进行快速转录组表征。Mol Ecol 2008,17(7):1636\u20131647。10.1111\/j.1365-294X.2008.03666.x“,”journal-title“:”Mol Ecol“},{”issue“:”4“,”key“:”2416_CR6“,”doi-asserted-by“:”publisher“,”first page“:“407”,”doi“:”10.1038\/nbt1394“,“volume”:“26”,“author”:“MR Friedl\u00e4nder”,“year”:“2008”,“unstructured”:“”Friedl\u00e4nder MR、Chen W、Adamidi C、Maaskola J、Einspanier R、Knespel S、Rajewsky N:使用miRDeep从深度测序数据中发现微RNA。国家生物技术2008,26(4):407\u2013415。10.1038\/nbt1394“,”journal-title“:”Nat Biotechol“},{”issue“:”7153“,”key“:”2416_CR7“,”doi-asserted-by“:”publisher“,”first page“:“553”,”doi“:”10.1038\/nature06008“,“volume”:“448”,“author”:“T Mikkelsen”,“year”:“2007”,“unstructured”:“Mikkelsen T、Ku M、Jaffe D、Issac B、Lieberman E、Giannoukos G、Alvarez P、Brockman W、Kim T、Koche R等:多能干细胞和谱系承诺细胞染色质状态的基因组全图。《自然》2007,448(7153):553\u2013560。10.1038\/nature06008“,”journal-title“:”Nature“},{“issue”:“4”,“key”:“2416_CR8”,“doi-asserted-by”:“publisher”,“first-page”:“823”,“doi”:“10.1016\/j.cell.2007.05.009”,“volume”:”129“,“author”:“A Barski”,“year”:“2007”,“unstructured”:“Barski A、Cuddapah S、Cui K、Roh TY、Schones DE、Wang Z、Wei G、Chepelev I、Zhao K:人类基因组中组蛋白甲基化的高分辨率分析。细胞2007,129(4):823\u2013837。10.1016\/j.cell.2007.05.009“,”journal-title“:”cell“},{”issue“:”5“,”key“:”2416_CR9“,”doi-asserted-by“:”publisher“,”first-page“:”802“,“doi”:“10.1101\/gr.072033.107”,“volume”:“18”,“author”:“D Hernandez”,“year”:“2008”,“unstructured”:“Hernandez D,Fran\u00e7ois P,Farinelli L,Oster\u00e5s M,Schrenzel J:新生细菌基因组测序:在台式计算机上组装的数百万次极短读取。基因组研究2008,18(5):802\u2013809。10.1101\/gr.072033.107“,”journal-title“:”Genome Research“},{”issue“:”7057“,”key“:”2416_CR10“,”doi-asserted-by“:”crossref“,”first-page“:”376“,”doi“:”10.1038\/nature03959“,”volume“:“437”,”author“:”M Margulies“,”year“:”2005“,”unstructured“:”Margulies M、Egholm M、Altman W、Attiya S、Bader J、Bemben L、Berka J、Braverman M、Chen Y、Chen Z等:微加工高密度微晶反应器中的基因组测序。Nature 2005,437(7057):376\u2013380.“,”journal-title“:”Nature“},{“issue”:“3”,“key”:“2416_CR11”,“doi-asserted-by”:“publisher”,“first-page”:“186”,”doi“:”10.1101\/gr.8.3.186“,”volume“:”8“,”author“:”B Ewing“,”year“:”1998“,”unstructured“:”尤因B,格林P:使用phred对自动定序器轨迹进行基线标定。二、。错误概率。Genome Research 1998,8(3):186\u2013194.“,“journal-title”:“Genome Research”},{“issue”:“7184”,“key”:“2416_CR12”,“doi-asserted-by”:“publisher”,“first page”:《215》,“doi”:“10.1038\/nature06745”,“volume”:”452“author”:“SJ Cokus”,“year”:“2008”,“unstructured”:“Cokus SJ、Feng S、Zhang X、Chen Z、Merriman B、Haudenschild CD、Pradhan S、Nelson S、Pellegrini M、Jacobsen SE:拟南芥基因组的Shotgun亚硫酸氢盐测序揭示了DNA甲基化模式。《自然》2008,452(7184):215\u2013219。10.1038\/nature06745“,”journal-title“:”Nature“},{“key”:“2416_CR13”,“volume-title”:“Nat Methods”,“author”:“Y Erlich”,“year”:“2008”,“unstructured”:“Erlich Y,Mitra PP,Delabastide M,McCombie WR,Hannon GJ:Alta-Cyclic:下一代测序的自优化基调用者。Nat Metaches 2008。”},“key“:”2416_CR14“volume-title”核酸研究”,“作者”:“JC Dohm”,“年份”:“2008”,“非结构化”:“Dohm JC,Lottaz C,Borodina T,Himmelbauer H:高通量DNA测序的超短读数据集存在重大偏差。核酸研究2008。“},{”key“:”2416_CR15“,”doi-asserted-by“:”publisher“,”first-page“:”128“,”doi“:”10.1186\/1471-2105-9-128“,”volume“:“9”,“author”:“A Smith”,“year”:“2008”,“unstructured”:“Smith A,Xuan Z,Zhang M:使用质量分数和更长的阅读时间可以提高Solexa阅读映射的准确性。BMC生物信息学2008,9:128。10.1186\/1471-2105-9-128“,”journal-title“:”BMC生物信息学“},{“issue”:“1”,“key”:“2416_CR16”,“doi-asserted-by”:“publisher”,“first-page”:“250”,“doi”:“10.1186\/1471-2105-9-250”,”volume“:”9“,”author“:”PC Dolan“,”year“:”2008“,”unstructured“:”Dolan PC,丹佛DR:TileQC:Solexa数据基于瓷砖的质量控制系统。BMC生物信息学2008,9(1):250。10.1186\/1471-2105-9-250“,“journal-title”:“BMC生物信息学”},{“issue”:“2”,“key”:“2416_CR17”,“doi-asserted-by”:“publisher”,“first-page”:“564”,“doi”:“10.1093\/nar\/gkj454”,《volume》:“34”,“author”:“P Yakovchuk”,“year”:“2006”,“unstructured”:“Yakovchuk P、Protozanova E、Frank-Kamenetskii MD:碱基封装和碱基对DNA双螺旋热稳定性的贡献。核酸研究2006,34(2):564\u2013574。10.1093\/nar\/gkj454“,”journal-title“:“核酸研究”},{“issue”:“368”,“key”:“2416_CR18”,”doi-asserted-by“:”publisher“,”first page“:“829”,”doi“:”10.1080\/01621459.1979.10481038“,”volume“:”74“,”author“:”WS-Cleveland“,”year“:”1979“,”unstructured“:”克利夫兰WS:稳健的局部加权回归和平滑散点图。J Amer Statist Assoc 1979,74(368):829\u2013836。10.2307\/2286407“,”journal-title“:”J Amer Statist Assoc“},{”issue“:”3“,”key“:”2416_CR19“,”doi-asserted-by“:”publisher“,”first page“:“803”,”doi“:”10.2307\/2532201“,”volume“:2013821年。10.2307\/2532201“,”journal-title“:”Biometrics“},{”issue“:”2“,”key“:”2416_CR20“,”doi-asserted-by“:”publisher“,”first page“:“297”,”doi“:”10.1007\/s003579900058“,”volume“:2013年3月30日。10.1007\/s003579900058“,”journal-title“:”J Classification“},{”issue“:”458“,”key“:”2416_CR21“,”doi-asserted-by“:”publisher“,”first page“:“611”,”doi“:”10.1198\/016214502760047131“,“volume”:“97”,“author”:“C Fraley”,“year”:“2002”,“unstructured”:“Fraley C,Raftery AE:基于模型的聚类、判别分析和密度估计。美国统计协会2002,97(458):611\u2013631。10.1198\/016214502760047131“,”journal-title“:”J Amer Statist Assoc“},{”issue“:”2“,”key“:”2416_CR22“,”doi-asserted-by“:”publisher“,”first-page“:”263“,”doi“:”10.1007\/s00357-003-0015-3“,“volume”:“20”,”author“:”C Fraley“,”year“:”2003“,”unstructured“:”Fraley C,Raftery AE:增强的基于模型的聚类、密度估计和判别分析软件:MCLUST。J分类2003,20(2):263\u2013286。10.1007 \/s00357-003-0015-3“,”journal-title“:”J Classification“},{“key”:“2416_CR23”,“doi-asserted-by”:“publisher”,“doi”:“10.1002 \/0471200611”,“volume-title”:“信息论要素”,“author”:“TM Cover”,“year”:“1991”,“unstructured”:“Cover TM,Thomas JA:Elements of Information Theory。John Wiley;1991.”},}“issue”:“6”,“key“:”2416_CR2“,”doi-asserted-by“:”publisher“,”first page“:”e579“,”doi“:”10.1371 \/journal.pone.0000579“,”volume“:“2”,“author”:“C Iseli”,“year”:“2007”,“unstructured”:“Iseli C,Ambrosini G,Bucher P,Jongeel CV:快速搜索基因组序列中的短词的索引策略。《公共科学图书馆·综合》2007年,2(6):e579。10.1371 \/journal.pone.0000579“,”journal-title“:”PLoS ONE“},{”issue“:”1“,”key“:”2416_CR25“,”first page“:“11”,“volume”:“4”,”author“:”EW Myers“,”year“:”1988“,”unstructured“:”Myers EW,Miller W:线性空间中的最佳对齐。Comput Appl Biosci 1988,4“,”键“:”2416_CR26“,”doi-asserted-by“:”publisher“,”first-page“:”128“,”doi“:”10.1186\/1471-2105-9-128“,”volume“:”9“,”author“:”ASmith“,”year“:”2008“,”unstructured“:”Smith A,Xuan Z,Zhang M:使用质量分数和更长的阅读时间可以提高Solexa阅读映射的准确性。BMC生物信息学2008,9(1):128。10.1186\/1471-2105-9-128“,”journal-title“:“BMC生物信息学”},{“key”:“2416_CR27”,“doi-asserted-by”:“crossref”,“unstructured”:“Ferragina P,Manzini G,M\u00e4kinen V,Navarro G:序列和全文索引的压缩表示。ACM算法事务(TALG)2007。,3(2):“,”doi“:”10.1145\/1240233.1243“},”{“issue”:“13”,“key“:”2416_CR28“,”doi-asserted-by“:”publisher“,”first page“:”i195“,“doi”:“10.1093\/生物信息学\/btm200”,“volume”:“23”,“author”:“S Gr\u00e4f”,“year”:“2007”,“unstructured”:“Gr\u000e4f S,Nielsen FG,Kurtz S,Huynen MA,Birney E,Stunnenberg H,Flicek P:全基因组拼接阵列的优化设计和评估。生物信息学2007,23(13):i195\u2013204。10.1093,生物信息学,“journal-title”:“生物信息学”},{“issue”:“3”,“key”:“2416_CR29”,“doi-asserted-by”:“publisher”,“first page”:”142“,“doi”:“10.1016\/j.tig.2007.12006”,”volume“:”24“,”author:“M Pop”,“year”:“2008”,“unstructured”:“Pop M,Salzberg SL:新测序技术的生物信息学挑战。Trends Genet 2008,24(3):142\u2013149.“,”journal-title“:”Trends Genet“},{”issue“:”5712“,”key“:”2416_CR30“,”doi-asserted-by“:”publisher“,”first-page“:”1072“,”doi“:”10.1126\/science.1105436“,”volume“:“307”,”author“:”DA Hinds“,”year“:”2005“,”unstructured“:”Hinds DA、Stuve LL、Nilsen GB、Halperin E、Eskin E、Ballinger DG、Frazer KA、Cox DR:三种人群常见DNA变异的全基因组模式。《科学》2005,307(5712):1072\u20131079。10.1126\/science.1105436“,”journal-title“:”science“}],”container-title”:[“BMC生物信息学”],”original-title:[],”language“:”en“,”link“:[{”URL“:”https:\/\/link.springer.com\/content\/pdf\/10.1186\/1471-2105-9-431.pdf“,”content-type“:”application\/pdf“,”content-version“:”vor“,”intended-application“:”similarity-checking“}]”,“存放”:{“date-parts“:[[2021,9,1]],“date-time”:“2021-09-01T11:05:58Z”,“timestamp”:1630494358000},“score”:1,“resource”:{“primary”:{“URL”:“https:\\/bmcbioinformations.biomedcentral.com/articles\/10.1186\/1471-2105-9-431”}},”subtitle“:[],”shorttitle“:[],”issued“:{”date-part“:[2008,10,13]]},‘references-count”:30,“日记问题”:{“问题”:“1”,“published-print“:{”date-parts“:[[2008,12]]}},”alternative-id“:[”2416“],”URL“:”http://\/dx.doi.org\/10.1186\/1471-2105-9-431“,”relationship“:{},“ISSN”:[“1471-2105”],“ISSN-type”:[{“value”:“1471-2115”,“type”:“electronic”}],“subject”:[/],“published”:{“date-part”:[C008,13]]},“断言”:[{“value”:“2008年6月4日”,“order”:1,“name”:“received”,“label”:“收到“,”组“:{“name”:“Article History”,“label”:“文章历史”}},{“value”:“2008年10月13日”,“order”:2,“name”:“accepted”,“table”:“accepted(接受)”,“group”:{”name“:”ArticleHistory“,”label“:”文章历史“},”value“:”2008年10月份13日“,”order“3,”name“:”first_online“,”table“:”first online“,“}”}],“商品编号”:“431”}}