用二项式混合模型研究RNA剪接作为细胞多样性来源
凯伦·伊萨夫(Keren Isaev),大卫·A·诺尔斯(David A.Knowles)
计算生物学会议第18届机器学习会议记录,PMLR 240:163-1752024年。
摘要
选择性剪接(AS)对RNA和蛋白质的变异性有显著贡献,但其在定义细胞多样性中的作用尚未完全理解。虽然与10X单细胞RNA测序(scRNA-seq)相比,Smart-seq2提供了更高的转录物覆盖率,但目前的计算方法往往忽略了AS的全部复杂性。大多数基于单细胞的差异剪接分析方法都专注于简单的AS事件,如外显子跳过,并且依赖于预先定义的细胞类型标签或低维基因表达表示。这限制了他们检测更复杂AS事件的能力,使他们依赖于细胞分类的先验知识。在这里,我们介绍了Leaflet,这是一种以剪接连接为中心的方法,灵感来源于Leafcutter,它是我们用大量RNA-seq量化RNA剪接变异的工具。传单是一种概率混合模型,旨在推断AS驱动的细胞状态,而无需细胞类型标签。我们详细介绍了Leaflet的生成模型、推理方法及其在检测差异拼接连接中的效率。通过将传单应用于Tabula Muris脑细胞数据集,我们强调了细胞状态特定的剪接模式,提供了对细胞多样性的更深入了解,而不仅仅是通过基因表达捕获的多样性。
引用本文
相关材料