×

指数族嵌入单细胞RNA-seq数据的细胞间应用发展轨迹。 (英语) Zbl 1464.62454号

摘要:科学家在研究单细胞RNA-seq数据以改进下游分析(如发育轨迹分析)时,通常会将细胞嵌入低维空间,但这种非线性嵌入方法的统计特性通常不太清楚。在本文中,我们开发了指数族SVD(eSVD),这是一种针对使用指数族分布的随机点积模型联合用于细胞和基因的非线性嵌入方法。我们的估计器使用交替极小化,这使我们有了一种计算效率高的方法,证明了我们方法的可识别性条件和一致性,并提供了调整我们方法的统计原则程序。所有这些特性都有助于推动单细胞嵌入文献的发展,并且我们提供了大量仿真来证明eSVD与其他嵌入方法相比具有竞争力。我们通过高斯分布应用eSVD,其中标准偏差与分析小鼠大脑中少突胶质细胞的单细胞数据集的方法成比例。利用eSVD估计的包埋,我们随后研究了少突胶质细胞的细胞发育轨迹。虽然之前的结果无法区分成熟少突胶质细胞类型之间的轨迹,但我们的诊断和结果表明,在成熟少突细胞中存在两种主要的发育轨迹。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
65层55 低阶矩阵逼近的数值方法;矩阵压缩
PDF格式BibTeX公司 XML格式引用
全文: 内政部 内政部

参考文献:

[1] Athreya,A。;Fishkind,D.E。;唐,M。;Priebe,C.E。;Park,Y。;Vogelstein,J.T。;莱文,K。;利津斯基,V。;Qin,Y.,“随机点积图的统计推断:一项调查”,《机器学习研究杂志》,18,8393-8484(2017)·Zbl 1473.05279号
[2] Balakrishnan,S。;Wainwright,M.J。;Yu,B.,“EM算法的统计保证:从人口到基于样本的分析”,《统计年鉴》,45,77-120(2017)·Zbl 1367.62052号 ·doi:10.1214/16-AOS1435
[3] 贝希特,E。;麦克因斯,L。;希利,J。;杜特雷,C.-A。;郭,I.W。;Ng,L.G。;Ginhoux,F。;Newell,E.W.,“使用UMAP可视化单细胞数据的降维,自然生物技术,37,38(2019)·doi:10.1038/nbt.4314
[4] 卑尔根,V。;兰格,M。;Peidli,S。;F.A.沃尔夫。;Theis,F.J.,“通过动力学建模将RNA速度推广到瞬态细胞状态,自然生物技术,38,1408-1414(2020)·doi:10.1038/s41587-020-0591-3
[5] 巴特勒,A。;霍夫曼,P。;Smibert,P。;Papalexi,E。;Satija,R.,“跨不同条件、技术和物种整合单细胞转录组数据,自然生物技术,36,411-420(2018)·doi:10.1038/nbt.4096
[6] 蔡,Z。;Xiao,M.,“少突胶质细胞与阿尔茨海默病”,《国际神经科学杂志》,126,97-104(2016)·doi:10.3109/00207454.2015.1025778
[7] 曹,J。;斯皮尔曼,M。;邱,X。;黄,X。;易卜拉欣,D.M。;Hill,A.J。;张,F。;Mundlos,S。;克里斯蒂安森,L。;Steemers,F.J。;Trapnell,C.,“哺乳动物器官发生的单细胞转录景观,自然,566496-502(2019)·数字对象标识代码:10.1038/s41586-019-0969-x
[8] Chi,Y。;Lu,Y.M.先生。;Chen,Y.,“非凸优化遇到低秩矩阵分解:概述,IEEE信号处理汇刊,67,5239-5269(2019)·Zbl 07123429号 ·doi:10.1109/TSP.2019.2937282
[9] 柯林斯,M。;达斯古普塔,S。;Schapire,R.E.,“指数族主成分分析的推广”,《神经信息处理系统的进展》,13,23(2001)
[10] 杜里夫,G。;莫多洛,L。;莫尔德,J.E。;Lambert-Lacroix,S。;Picard,F.,“单细胞表达数据分析的概率计数矩阵分解,生物信息学,35,4011-4019(2019)·doi:10.1093/bioinformatics/btz177
[11] Efron,B.,“指数族的几何,统计年鉴,6362-376(1978)·Zbl 0436.62027号 ·doi:10.1214/aos/1176344130
[12] Ge,R。;Jin,C。;郑毅,1233-1242(2017)
[13] Gunasekar,S。;拉维库马尔,P。;Ghosh,J.,1917-1925(2014)
[14] Haghverdi,L.公司。;Buettner,F。;Theis,F.J.,“分化数据的高维单细胞分析扩散图,生物信息学,312989-2998(2015)·doi:10.1093/bioinformatics/btv325
[15] 哈斯蒂,T。;Stuetzle,W.,“主要曲线,美国统计协会杂志,84,502-516(1989)·Zbl 0679.62048号 ·doi:10.1080/01621459.1989.10478797
[16] 希克斯,南卡罗来纳州。;汤斯,F.W。;滕,M。;Irizarry,R.A.,“单细胞RNA测序实验中的缺失数据和技术可变性,生物统计学,19,562-578(2018)·doi:10.1093/biostatistics/kxx053
[17] 霍夫,医学博士。;Raftery,A.E。;Handcock,M.S.,“社会网络分析的潜在空间方法”,《美国统计协会杂志》,971090-1098(2002)·兹比尔1041.62098 ·doi:10.19198/016214502388618906
[18] Jaggi,M.,427-435(2013)
[19] Jain,P。;Netrapalli,P。;Sanghavi,S.,使用交替最小化完成低秩矩阵(2013)·Zbl 1293.65073号
[20] 北卡罗来纳州凯萨里斯。;Fogarty,M。;Iannarelli,P。;格里斯特,M。;韦格纳,M。;Richardson,W.D.,“前脑少突胶质细胞的竞争波和出生后胚胎谱系的消除,自然神经科学,9173(2006)·文件编号:10.1038/nn1620
[21] 哈尔琴科,P.V。;Silberstein,L。;Scadden,D.T.,“单细胞差异表达分析的贝叶斯方法,自然方法,11740(2014)·doi:10.1038/nmeth.2967
[22] 拉曼诺,G。;索尔达托夫,R。;Zeisel,A。;Braun,E。;Hochgerner,H。;佩图霍夫,V。;Lidschreiber,K。;Kastriti,M.E。;Lönnerberg,P。;弗兰,A。;Fan,J.,“单个细胞的RNA速度,自然,560494-498(2018)·doi:10.1038/s41586-018-0414-6
[23] Lafond,J.,具有指数族噪声的低秩矩阵完备性,学习理论会议,1224-1243(2015)
[24] Landgraf,A.J。;Lee,Y.,“广义主成分分析:饱和模型参数的预测,技术计量学,62,459-472(2020)·doi:10.1080/00401706.20191668854
[25] Lei,J.(2018),“使用图根分布的网络表示”,arXiv编号1802.09684。
[26] 李·T。;莱维纳,E。;Zhu,J.,“基于边缘采样的网络交叉验证,生物统计学,107,257-276(2020)·Zbl 1441.62049号 ·doi:10.1093/biomet/asaa006
[27] Liu,C.和Martin,R.(2020),“推断模型和可能性测度”,arXiv编号2008.06874。
[28] 洛佩兹,R。;Regier,J。;科尔,M.B。;M.I.乔丹。;Yosef,N.,“单细胞转录组学的深层生成建模,自然方法,151053(2018)·doi:10.1038/s41592-018-0229-2
[29] 爱,M.I。;Huber,W。;Anders,S.,“利用DESeq2对RNA-Seq数据的折叠变化和扩散进行适度估计,基因组生物学,15,550(2014)·doi:10.1186/s13059-014-0550-8
[30] Maezika,M.,技术报告,“奇异值分解和低阶近似”,(2016),芝加哥大学
[31] 马奎斯,S。;van Bruggen,D。;瓦尼奇基纳,D.P。;Floriddia,E.M。;Munguba,H。;Väremo,L。;贾科梅洛,S。;法尔考,上午。;Meijer,M。;奥利桑那州比约克隆德。英国。;Hjerling-Leffler,J.,“发育过程中少突胶质细胞世系祖细胞的转录聚合,发育细胞,46,504-517(2018)·doi:10.1016/j.devcel.2018.07.005
[32] 马奎斯,S。;Zeisel,A。;Codeluppi,S。;van Bruggen,D。;法尔考,上午。;肖,L。;李,H。;哈林,M。;Hochgerner,H。;罗曼诺夫,R.A。;Gyllborg,D.,“小鼠幼年和成年中枢神经系统中少突胶质细胞的异质性,科学,3521326-1329(2016)·doi:10.1126/science.aaf6463
[33] Mazumder,R。;哈斯蒂,T。;Tibshirani,R.,“学习大型不完全矩阵的谱正则化算法”,机器学习研究杂志,1122287-2322(2010)·Zbl 1242.68237号
[34] McInnes,L.、Healy,J.和Melville,J.(2018),“UMAP:降维的均匀流形近似和投影”,arXiv编号1802.03426。
[35] 梅恩,B。;Garcia-Verdugo,J.M。;Yaschine,C。;Gonzalez-Perez,O。;罗伊奇,D。;Alvarez-Buylla,A.,“成人大脑脑室下区少突胶质细胞的起源”,《神经科学杂志》,26,7907-7918(2006)·doi:10.1523/JNEUROSCI.1299-06.2006
[36] 皮尔逊,E。;Yau,C.,“ZIFA:零膨胀单细胞基因表达分析的维数降低,基因组生物学,16,241(2015)·doi:10.1186/s13059-015-0805-z
[37] 里索,D。;佩罗多,F。;Gribkova,S。;Dudoit,S。;Vert,J.-P.,“从单细胞RNA-Seq数据中提取信号的通用灵活方法”,《自然通信》,9,284(2018)·doi:10.1038/s41467-017-02554-5
[38] 塞伦,W。;坎努特,R。;托多罗夫,H。;Saeys,Y.,“单细胞轨迹推断方法的比较”,《自然生物技术》,37547(2019)·doi:10.1038/s41587-019-0071-9
[39] 街道,K。;里索,D。;弗莱彻,R.B。;达斯,D。;Ngai,J。;约瑟夫,N。;Purdom,E。;Dudoit,S.,“Slingshot:单细胞转录组学的细胞谱系和伪时间推断,BMC基因组学,19,477(2018)·doi:10.1186/s12864-018-4772-0
[40] Sun,S。;朱,J。;马云(Ma,Y.)。;周,X.,“单细胞RNA-Seq分析降维方法的准确性、稳健性和可扩展性,基因组生物学,20,269(2019)·doi:10.1186/s13059-019-1898-6
[41] Tenenbaum,J.B。;德席尔瓦,V。;Langford,J.C.,“非线性降维的全球几何框架,科学,290,2319-2323(2000)·doi:10.1126/science.290.5500.2319
[42] 汤斯,F.W。;希克斯,南卡罗来纳州。;Aryee,M.J。;Irizarry,R.A.,“单细胞RNA序列的可变审查感知矩阵分解”,bioRxiv,166736(2017)
[43] 特拉内尔,C。;Cacchiarelli,D。;格里姆斯比,J。;Pokharel,P。;李,S。;莫尔斯,M。;新泽西州列侬。;Livak,K.J。;米克尔森,T.S。;Rinn,J.L.,“单细胞的伪时序顺序揭示了细胞命运决定的动力学和调节器,自然生物技术,32,381(2014)·doi:10.1038/nbt.2859
[44] 乌代尔,M。;喇叭,C。;扎德·R。;Boyd,S.,“机器学习中的广义低阶模型、基础和趋势,9,1-118(2016)·Zbl 1350.68221号 ·doi:10.1561/22000055
[45] van Bruggen,D。;阿吉雷,E。;Castelo-Branco,G.,“少突胶质细胞谱系细胞的单细胞转录组学分析,神经生物学的当前观点,47,168-175(2017)·doi:10.1016/j.conb.2017.1005
[46] 范德马滕,L。;Hinton,G.,“使用t-SNE可视化数据”,《机器学习研究杂志》,92579-2605(2008)·Zbl 1225.68219号
[47] Vershynin,R.,“样本协方差矩阵与实际协方差矩阵有多接近?”,《理论概率杂志》,25,655-686(2012)·Zbl 1365.62208号 ·doi:10.1007/s10959-010-0338-z
[48] Wang,L。;张,X。;Gu,Q.,非凸低秩矩阵估计的统一计算和统计框架,人工智能与统计学,981-990(2017)
[49] Witten,D.M.,“使用泊松模型对序列数据进行分类和聚类,应用统计年鉴,52493-2518(2011)·Zbl 1234.62150号 ·doi:10.1214/11-AOAS493
[50] Yu,M。;古普塔,V。;Kolar,M.,“同时恢复低秩和双向稀疏系数矩阵,非凸方法”,《电子统计杂志》,第14期,第413-457页(2020年)·兹比尔1434.90161 ·doi:10.1214/19-EJS1658
[51] 扎皮亚,L。;Phipson,B。;Oshlack,A.,“飞溅:单细胞RNA序列数据的模拟,基因组生物学,18,174(2017)·doi:10.1186/s13059-017-1305-0
[52] Zeisel,A。;穆尼奥斯·曼查多,A.B。;Codeluppi,S。;Lönnerberg,P。;拉曼诺,G。;尤雷乌斯。;马奎斯,S。;Munguba,H。;He,L。;Betsholtz,C。;Rolny,C.,“单细胞RNA-Seq揭示的小鼠皮层和海马细胞类型,科学,3471138-1142(2015)·doi:10.1126/science.aaa1934年
[53] Zhang,Y。;Chen,K。;斯隆管理学院。;Bennett,M.L。;Scholze,A.R。;奥基夫,S。;Phatnani,H.P。;瓜尼埃里,P。;卡内达,C。;Ruderisch,N。;Deng,S.,“大脑皮层神经胶质、神经元和血管细胞的RNA-序列转录组和剪接数据库”,《神经科学杂志》,34,11929-11947(2014)·doi:10.1523/JNEUROSCI.1860-14.2014
[54] Zhao,T.、Wang,Z.和Liu,H.(2015),“通过不精确一阶Oracle实现非凸低秩矩阵分解”,《神经信息处理系统进展》。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。