×

兹马思-数学第一资源

从头开始使用贪婪的、基于质量值的算法对长读转录组数据进行聚类。(英语) Zbl 1412.92105
Cowen,Lenore J.(编辑),《计算分子生物学研究》。第23届国际年会,2019年5月5日至8日,美国华盛顿特区。诉讼程序。查姆:斯普林格。选择。笔记计算。科学。11467227-242(2019年)。
摘要:利用PacBio-Iso-Seq和Oxford纳米孔技术对转录物进行长阅读测序已被证明是研究许多生物体内复杂异构体景观的核心。但是,目前从头开始从长时间读取的数据中进行转录重建的算法是有限的,这使得这些技术的潜力无法实现。一个常见的瓶颈是缺乏可伸缩和精确的算法来根据长阅读的基因家族进行聚类。为了解决这一挑战,我们开发了isONclust,一种贪婪(为了扩展)并利用质量值(为了处理可变错误率)的聚类算法。我们在三个模拟的和五个生物数据集上测试isONclust,这些数据集跨越了生物体、技术和阅读深度。我们的结果表明,isONclust在总体准确性和/或对大型数据集的可伸缩性方面都比以前的方法有了实质性的改进。我们的工具在https://github.com/ksahlin/isONclust.
整个系列请参见[Zbl 1408.92004号].
理学硕士:
92C40型 生物化学、分子生物学
68周05分 非数值算法
PDF格式 BibTeX公司 XML 引用
全文: 内政部