×

空间解析转录组数据的共聚类。 (英语) Zbl 07692390号

摘要:空间转录组学是一项开创性的技术,它可以测量组织样本中数千个基因的活性,并绘制活性发生的位置。这项技术使研究跨组织基因的空间变异成为可能。理解组织不同区域的基因功能和相互作用具有重大的科学意义,因为这可能会加深对几个关键生物学机制的理解,例如细胞间通信或肿瘤与微环境的相互作用。为此,可以将相同类型的细胞和表现出相似表达模式的基因分组。然而,仍然缺乏足够的统计工具,利用以前不可用的空间信息来更连贯地对细胞和基因进行分组。
在这项工作中,我们介绍SpaRTaCo公司这是一个新的统计模型,它根据组织的分区对基因的空间表达谱进行聚类。这是通过执行联合聚类实现的,即推断数据的潜在块结构,并诱导两种类型的聚类:基因的聚类,使用其在组织中的表达;图像区域的聚类,用基因在组织中表达斑点收集RNA的地方。我们提出的方法通过一系列模拟实验进行了验证,并通过对使用10X-Visium协议处理的人脑组织样本的应用,说明了其在响应特定生物问题方面的有用性。

MSC公司:

第62页 统计学的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Allen,G.I.和Tibshirani,R.(2010)。转置正则协方差模型及其在缺失数据插补中的应用。附录申请。斯达。4 764-790. ·Zbl 1194.62079号 ·doi:10.1214/09-AOAS314
[2] ANDERLUCCI,L.和VIROLI,C.(2015)。多元异质纵向数据分析的协方差模式混合模型。附录申请。斯达。9 777-800. ·兹比尔1397.62214 ·doi:10.1214/15-AOAS816
[3] BARBIERATO,M.、BORRI,M.,FACCI,L.、ZUSSO,M.和SKAPER,S.D.以及GIUSTI,P.(2017年)。中枢神经系统胶质细胞群体对急性期蛋白血清淀粉样蛋白a的表达和差异反应性。科学。代表。7 1-14.
[4] BENJAMINI,Y.和HOCHBERG,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.R.统计社会服务。B.统计方法。57 289-300. ·Zbl 0809.62014号
[5] Biernacki,C.、Celeux,G.和Govaert,G.(2000)。用综合完全似然法评估用于聚类的混合模型。IEEE传输。模式分析。机器。智力。22 719-725.
[6] BOUVEYRON,C.、BOZZI,L.、JACQUES,J.和JOLLOIS,F.-X.(2018年)。耗电曲线联合聚类的功能潜在块模型。J.R.统计社会服务。C.申请。斯达。67 897-915. ·doi:10.1111/rssc.12260
[7] BOUVEYRON,C.、CELEUX,G.、MURPHY,T.B.和RAFTERY,A.E.(2019年)。基于模型的数据科学聚类与分类:R中的应用程序.剑桥统计与概率数学系列。剑桥大学出版社,剑桥·Zbl 1436.62006年 ·doi:10.1017/9781108644181
[8] BYRD,R.H.,LU,P.,NOCEDAL,J.和ZHU,C.Y.(1995)。用于边界约束优化的有限内存算法。SIAM J.科学。计算。16 1190-1208. ·兹比尔083665080 ·doi:10.1137/0916069
[9] CAPONERA,A.、DENTI,F.、RIGON,T.、SOTTOSANTI,A.和GELFAND,A.(2017)。静息状态fMRI数据的分层时空建模。启动研究111-130. 施普林格,柏林·Zbl 1414.92159号
[10] CASA,A.、BOUVEYRON,C.、EROSHEVA,E.和MENARDI,G.(2021)。通过形状不变模型对时间相关数据进行共聚类。J.分类38 626-649. ·Zbl 07473953号 ·doi:10.1007/s00357-021-09402-8
[11] Celeux,G.和Govaert,G.(1992年)。一种用于聚类的分类EM算法和两种随机版本。计算。统计师。数据分析。14 315-332. ·Zbl 0937.62605号 ·doi:10.1016/0167-9473(92)90042-E
[12] CHEN,K.H.、BOETTIGER,A.N.、MOFFITT,J.R.、WANG,S.和ZHUANG,X.(2015)。在单个细胞中进行空间分辨、高度复用的RNA图谱分析。科学类348 aaa6090·doi:10.1126/science.aaa6090
[13] 北卡罗来纳州克雷西(2015)。空间数据统计,修订版。威利经典图书馆纽约威利·Zbl 1347.62005年
[14] DELATTRE,M.、LAVIELLE,M.和POURSAT,M.-A.(2014)。关于混合效应模型中BIC的注记。电子。J.统计。8 456-475. ·兹比尔1348.62186 ·doi:10.1214/14-EJS890
[15] DE LA CRUZ-MESíA,R.和MARSHALL,G.(2006)。具有连续时间自回归误差的非线性随机效应模型:贝叶斯方法。统计医学。25 1471-1484. ·doi:10.1002/sim.2290
[16] DRIES,R.、ZHU,Q.、DONG,R.,ENG,C.-H.L.、LI,H.、LIU,K.等人(2021年)。Giotto:空间表达数据的综合分析和可视化工具箱。基因组生物学。22 1-31.
[17] EDSG ad RD,D.,JOHNSSON,P.和SANDBERG,R.(2018)。识别单细胞基因表达数据中的空间表达趋势。自然方法15 339-342. ·数字对象标识代码:10.1038/nmeth.4634
[18] Efron,B.(2009年)。一组微阵列相互独立吗?附录申请。斯达。3 922-942. ·Zbl 1196.62138号 ·doi:10.1214/09-AOAS236
[19] EISENBERG,E.和LEVANON,E.Y.(2003)。人类的家政基因是紧密的。趋势基因。19 362-365.
[20] GOVAERT,G.和NADIF,M.(2008)。用贝努利混合模型进行块聚类:不同方法的比较。计算。统计师。数据分析。52 3233-3245. ·Zbl 1452.62444号 ·doi:10.1016/j.csda.2007.09.007
[21] GOVAERT,G.和NADIF,M.(2010年)。列联表的潜在块模型。通信统计。理论方法39 416-425. ·Zbl 1187.62117号 ·网址:10.1080/03610920903140197
[22] GOVAERT,G.和NADIF,M.(2013年)。协同聚类:模型、算法和应用纽约威利。
[23] GUPTA,A.K.和NAGAR,D.K.(2000)。矩阵变量分布.查普曼和霍尔/CRC纯数学和应用数学专著和调查104.佛罗里达州博卡拉顿市CRC出版社/CRC·Zbl 0935.62064号
[24] HODGE,R.D.、BAKKEN,T.E.、MILLER,J.A.、SMITH,K.A.、BARKAN,E.R.、GRAYBUCK,L.T.等人(2019年)。人类与小鼠皮层中具有不同特征的保守细胞类型。自然573 61-68.
[25] KERIBIN,C.、BRAULT,V.、CELEUX,G.和GOVAERT,G.(2015)。分类数据上潜在块模型的估计和选择。统计计算。25 1201-1216. ·Zbl 1331.62149号 ·doi:10.1007/s11222-014-9472-2
[26] LUBECK,E.、COSKUN,A.F.、ZHIYENTAYEV,T.、AHMAD,M.和CAI,L.(2014)。通过序列杂交进行单细胞原位RNA分析。自然方法11 360-361.
[27] MARX,V.(2021)。2020年方法:空间解析转录组学。自然方法18 9-14.
[28] MAYNARD,K.R.,COLLADO-TORRES,L.,WEBER,L.M.,UYTINGCO,C.,BARRY,B.K.,WILLIAMS,S.R.等人(2021年)。人类背外侧前额叶皮层转录体尺度的空间基因表达。自然神经科学。. ·doi:10.1038/s41593-020-00787-0
[29] MORAN,G.E.、RO采科娃,V.和GEORGE,E.I.(2021)。钉板拉索双集群。附录申请。斯达。15 148-173. ·Zbl 1498.62122号 ·doi:10.1214/20-aoas1385
[30] MURUA,A.和QUINTANA,F.A.(2021)。基于半参数贝叶斯推理的双聚类。贝叶斯分析。1-27. ·Zbl 07809995号 ·doi:10.1214/21-BA1284文件
[31] Nobile,A.和Fearnside,A.T.(2007年)。成分数量未知的贝叶斯有限混合:分配采样器。统计计算。17 147-162. ·doi:10.1007/s11222-006-9014-7
[32] PARDO,B.、SPANGLER,A.、WEBER,L.M.、HICKS,S.C.、JAFFE,A.E.、MARTINOWICH,K.等人(2021年)。空间LIBD:一个R/Bioconductor软件包,用于可视化空间解析转录组学数据。生物Rxiv。 ·doi:10.1101/2021.04.29.440149
[33] RAO,N.、CLARK,S.和HABERN,O.(2020年)。架起基因组学和组织病理学的桥梁。遗传学。生物技术工程。新闻40 50-51. ·doi:10.1089/gen.40.02.16
[34] Rasmussen,C.E.和Williams,C.K.I.(2006)。机器学习的高斯过程.自适应计算与机器学习麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1177.68165号
[35] RIGHHELLI,D.、WEBER,L.M.、CROWELL,H.L.、PARDO,B.、COLLADO-TORRES,L.、GHAZANFAR,S.等人(2022)。空间实验:R中使用生物导体的空间解析转录组学数据的基础设施。生物信息学38 3128-3131. ·doi:10.1126/science.aaw1219
[36] RODRIQUES,S.G.,STICKELS,R.R.,GOEVA,A.,MARTIN,C.A.,MURRAY,E.,VANDERBURG,C.R.等人(2019年)。Slide-seq:一种在高空间分辨率下测量全基因组表达的可扩展技术。科学类363 1463-1467. ·doi:10.1126/science.aaw1219
[37] SMYTH,G.K.(2004)。用于评估微阵列实验中差异表达的线性模型和经验贝叶斯方法。统计应用程序。遗传学。分子生物学。3第3条、第29条·Zbl 1038.62110号 ·数字对象标识代码:10.2202/1544-6115.1027
[38] SOTTOSANTI,A.和RISSO,D.(2023年)。补充“空间解析转录组数据的协同聚类”https://doi.org/10.1214/22-AOAS1677SUPA网站, https://doi.org/10.1214/22-AOAS1677SUPPB
[39] STARZYK,R.M.、ROSENOW,C.、FRYE,J.、LEISMANN,M.、RODZINSKI,E.、PUTNEY,S.和TUOMANEN,E.I.(2000年)。脑细胞粘附分子:血脑屏障毛细血管内皮上的一种新的白细胞粘附决定因子。J.感染。数字化信息系统。181 181-187.
[40] SUN,S.、ZHU,J.和ZHOU,X.(2020)。空间解析转录组学研究中空间表达模式的统计分析。自然方法17 193-200.
[41] SVENSSON,V.、TEICHMANN,S.A.和STEGLE,O.(2018年)。SpatialDE:空间变异基因的鉴定。自然方法15 343-346.
[42] TAN,K.M.和WITTEN,D.M.(2014)。可转座数据的稀疏双聚类。J.计算。图表。统计师。23 985-1008. ·doi:10.1080/10618600.2013.85254
[43] TOWNES,F.W.、HICKS,S.C.、ARYEE,M.J.和IRIZARRY,R.A.(2019年)。基于多项式模型的单细胞RNA-seq特征选择和降维。基因组生物学。20 1-16.
[44] VAN LAARHOVEN,P.J.M.和AARTS,E.H.L.(1987)。模拟退火:理论与应用.数学及其应用37.多德雷赫特·雷德尔。 ·doi:10.1007/978-94-015-7744-1
[45] WITTEN,D.M.和TIBSHIRANI,R.(2009年)。高维问题的协方差正则化回归和分类。J.R.统计社会服务。B.统计方法。71 615-636. ·Zbl 1250.62033号 ·文件编号:10.1111/j.1467-9868.2009.00699.x
[46] WITTEN,D.M.和TIBSHIRANI,R.(2010年)。聚类中的特征选择框架。J.Amer。统计师。协会。105 713-726. ·Zbl 1392.62194号 ·doi:10.1198/jasa.2010.tm09415
[47] WYSE,J.和FRIEL,N.(2012年)。具有折叠潜在块模型的块聚类。统计计算。22 415-428. ·Zbl 1322.62046号 ·doi:10.1007/s11222-011-9233-4
[48] ZHAO,E.,STONE,M.R.,REN,X.,GUENTHOER,J.,SMYTHE,K.S.,PULLIAM,T.等人(2021年)。BayesSpace子点分辨率下的空间转录组学。自然生物技术。1-10
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。