返回索引 上一篇文章 下一篇文章 全文

中国统计局 32 (2022), 1835-1856

非参数贝叶斯二级聚类 适用于
受试者水平单细胞表达数据

吴秋雨和罗翔宇

中国人民大学

摘要:单细胞测序的出现为个性化治疗开辟了新的途径。在本研究中,我们解决了二级聚类同步主题子群发现问题(主题级别)和细胞类型检测(单元格级别)用于来自多个受试者的单细胞表达数据。当前的统计方法要么是不考虑受试者异质性的聚类细胞,要么是不使用单细胞信息的分组受试者。为了弥合细胞聚类和主题分组之间的差距,我们开发了一个非参数贝叶斯模型——单细胞表达数据的主题和细胞聚类(SCSC)模型,以同时实现主题和细胞分组。SCSC模型不需要预先指定主题子组编号或单元类型编号。它会自动归纳主题子组结构,并跨主题匹配单元格类型。此外,它通过故意考虑数据的丢失、库大小和过度分散,直接对单细胞原始计数数据进行建模。提出了一种用于后验推断的分块吉布斯采样器。模拟研究和对多受试者诱导的多能干细胞单细胞RNA测序数据集的应用验证了SCSC模型同时聚类受试者和细胞的能力。

关键词:马尔可夫链蒙特卡罗,混合物,基于模型的聚类,非参数贝叶斯,单细胞RNA测序。

返回索引 上一篇文章 下一篇文章 全文