,/
,'/
,' / █████╗ ██████╗██████╗ ██████╗(a)自动化
,' /_____, ██╔══██╗██╔════╝██╔══██╗██╔════╝(c)污染
.'____ ,' ███████║██║ммаакатана(d)检测和
/ ,' ██╔══██║██║ммааканала(c)置信度估计
/ ,' ██║ ██║╚██████╗██████╔╝╚██████╗对于单电池
/,' ╚═╝ ╚═╝ ╚═════╝╚═════╝ ╚═════╝基因组数据
/'
单细胞测序的一个主要障碍是样品污染带有外来DNA。确保样品清洁,防止引入将新物种中的污染物输入公共数据库,质量相当高将控制工作纳入后测序分析。污染筛选通常依赖于基于引用的方法,如数据库对齐或标记基因搜索,将可检测的污染物限制在已知物种范围内。但是,由于大多数物种都是未知的,因此以下是一个特殊的挑战de-novo结构的检测需要筛选技术可以自由操作。
Acdc是一种专门为帮助质量控制过程而开发的工具。由结合监督和非监督方法,它可以可靠地检测已知的和脱氮污染物。首先,16S基因预测和包含超快速精确比对技术使用来自数据库的现有知识。第二,无参考检查是通过使用最先进的机器学习技术包括寡核苷酸的快速非线性降维签名和随后的自动估计的聚类算法簇的数量。后者还可以去除任何污染物,最终得到一个干净的样本,而不需要重新排序。此外,考虑到acdc采用的数据复杂性和聚类的不适定性引导技术提供统计意义深远的置信值。通过对来自不同测序项目的大量样本进行测试,我们的该软件能够快速准确地识别污染。结果是显示在交互式结果界面中。Acdc可以作为以及一个专用的命令行应用程序,允许轻松集成进入大型测序项目。
Acdc可以可靠地检测单细胞测序中的污染。此外对于数据库驱动的检测,它通过其无监督技术,允许检测de-novo污染物也是如此。由于质量控制目前是手动完成的捐款有可能大幅减少投入这些过程的资源,特别是在有限的参考物种的可用性,例如在de-novo分析中。