×

一个用于单细胞聚类的核非负矩阵分解框架。 (英语) Zbl 1481.92045号

摘要:单细胞RNA测序的出现是揭示生物系统中细胞异质性的理想选择,这是单细胞RNA序列研究中一个极具挑战性的问题。然而,大多数当前的计算方法缺乏灵敏度,无法可靠地检测被缺失事件掩盖的非线性基因-基因关系。我们提出了一个用于检测基因间非线性关系的核非负矩阵分解框架,其中使用细胞可微性相关的核技巧开发了新的核。新构建的内核不仅提供了对基因-基因关系的描述,而且有助于在原始数据上构建新的低维表示。此外,我们开发了一种利用扩散映射确定每个数据集中最佳聚类数的有效方法。在使用内部准则(聚类数精度)和外部准则(调整后的随机指数和归一化互信息)的几个基准或实际scRNA-Seq数据集上,将所提出的算法与代表性算法SC3和其他几种最先进的聚类方法进行了进一步比较,以表明我们方法的有效性。

MSC公司:

92C40型 生物化学、分子生物学
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Wang,Z。;Gerstein,M。;Snyder,M.,《Rna-seq:转录组学的革命性工具》,《自然评论遗传学》。,10, 57-63 (2009)
[2] Wei,V.L。;Li,J.J.,《单细胞RNA-seq数据的准确稳健插补方法》,国家通讯社。,9, 1, 997 (2018)
[3] Grün,D。;Lyubimova,A。;凯斯特,L。;Wiebrands,K。;O.巴萨克。;佐佐木,N。;聪明的H。;van Oudenaarden,A.,单细胞信使RNA测序揭示了罕见的肠细胞类型,《自然》,525251-255(2015)
[4] 江,L。;陈,H。;Pinello,L。;Chen,Y.,GiniClust:利用基尼指数从单细胞基因表达数据中检测稀有细胞类型,Genome Biol。,17, 144 (2016)
[5] Tsoucas,D。;Yuan,G.,Giniclust2:一种用于细胞类型检测的聚类软件加权集成聚类方法。,基因组生物学。,19, 58 (2018)
[6] 南卡罗来纳州本德尔。;Davis,K.L。;ad David Amir,E。;Tadmor,医学博士。;西蒙兹,E.F。;Chen,T.J。;Shenfeld,D.K。;诺兰,G.P。;Peer,D.,单细胞轨迹检测揭示了人类B细胞发育过程中的进展和调控协调。,细胞,157,3,714-725(2014)
[7] Yan,L。;杨,M。;郭,H。;Yang,Y。;吴杰。;李,R。;刘,P。;Lian,Y。;郑,X。;严,J。;黄,J。;李,M。;吴,X。;Wen,L。;老挝,K。;李,R。;乔,J。;Tang,F.,人类植入前115个胚胎和胚胎干细胞的单细胞RNA-Seq分析。,自然结构。分子生物学。,2013年11月20日
[8] Chu,L.F。;冷,N。;张杰。;Hou,Z。;马莫特,D。;Vereide,D.T。;Choi,J。;Kendziorski,C。;斯图尔特,R。;Thomson,J.A.,《单细胞RNA-seq揭示了人类胚胎干细胞向最终内胚层分化的新调节因子》,《基因组生物学》。,17, 1, 173 (2016)
[9] Farrell,J.A。;Wang,Y。;里森菲尔德,S.J。;Shekhar,K。;雷格夫,A。;Schier,A.F.,斑马鱼胚胎发生期间发育轨迹的单细胞重建。,《科学》,360,eaar3131(2018)
[10] 高,Y。;镍,X。;郭,H。;苏,Z。;Zhang,N.,单细胞测序揭示了从原代肿瘤细胞到循环肿瘤细胞拷贝数变化的收敛进化,《基因组研究》,27,8,1312(2017)
[11] Brady,S.W。;Mcquerry,J.A。;乔,Y。;Piccolo,S.R。;Shrestha,G。;Jenkins,D.F。;层,R.M。;Pedersen,B.S。;米勒,R.H。;Esch,A.,《对抗耐药癌症表型的亚克隆进化》,国家通讯社。,8, 1, 1231 (2017)
[12] s092867418303659。
[13] Mann,K.M。;Newberg,J.Y。;布莱克,医学硕士。;琼斯·D·J。;Amaya-Manzaneres,F。;Guzman-Rojas,L。;Kodama,T。;沃德,J.M。;Rust,A.G.公司。;van der Weyden,L.,用SBCapSeq分析单粒细胞白血病细胞中的肿瘤异质性和驱动基因,国家生物技术。,34, 9, 962-972 (2016)
[14] 罗林克,S.F。;佐佐木,N。;Lee-Six,H。;Young,医学博士。;Alexandrov,L.B。;贝贾蒂,S。;米切尔·T·J。;格罗斯曼,S。;Lightfoot,H。;Egan,D.A.,《大肠癌在单细胞水平上的肿瘤内多样化》,《自然》,556,7702,102(2018)
[15] 哈尔琴科,P.V。;西尔伯斯坦。;Scadden,D.T.,单细胞差异表达分析的贝叶斯方法,自然方法,11,7,740(2014)
[16] Prabhakaran,S。;阿齐兹,E。;卡尔,A。;Pe’Er,D.,Dirichlet过程混合模型,用于校正单细胞基因表达数据中的技术差异,国际机器学习会议论文集(2016)
[17] 朱,L。;Jing,L。;德夫林,B。;Roeder,K.,《单细胞和大块rna测序数据的统一统计框架》,Ann.Appl。统计,12,1,609-632(2017)·Zbl 1393.62120号
[18] 黄,M。;景书,W。;爱德华多·T。;Hannah,D。;南悉尼。;B.罗伯托。;I.,M.J。;阿琼,R。;明耀,L。;R.,Z.N.,Saver:单细胞rna测序的基因表达恢复,《自然方法》,15,539-542(2018)
[19] 龚·W。;纽约州夸克。;马铃薯,P。;Koyano-Nakagawa,N。;Garry,D.J.,Drimpute:在单细胞rna测序数据中插补脱落事件,BMC Bioninform。,19, 1, 220 (2018)
[20] S0092867418307244。
[21] 巴赫,R。;Kendziorski,C.,单细胞rna测序实验的设计和计算分析,基因组生物学。,17, 1, 63 (2016)
[22] 布伦内克,P。;安德斯,S。;Kim,J.K。;Kolodziejczyk,A.A。;张,X。;普罗塞尔皮奥,V。;巴因,B。;贝内斯,V。;Teichmann,S.A。;Marioni,J.C.,《单细胞rna-seq实验中技术噪声的核算》,《自然方法》,第10、11、1093-1095页(2013年)
[23] Vallejos,C.A。;马里奥尼,J.C。;Richardson,S.,《基础:单细胞测序数据的贝叶斯分析》,《公共科学图书馆·计算》。生物,11,6,e1004333(2015)
[24] Kim,J.K。;Kolodziejczyk,A.A。;伊利西奇,T。;Teichmann,S.A。;Marioni,J.C.,表征单细胞rna-seq中的噪声结构,区分真实的和技术随机等位基因表达,Nat.Commun。,6, 8687 (2015)
[25] 安德鲁斯,T.S。;Hemberg,M.,M3Drop:基于辍学的scRNASeq特征选择,生物信息学,35,16,2865-2867(2019)
[26] 皮尔逊,E。;Yau,C.,Zifa:零膨胀单细胞基因表达分析的降维,基因组生物学。,16, 1, 241 (2015)
[27] Macosko,E。;巴苏,A。;Satija,R。;Nemesh,J。;Shekhar,K。;戈德曼,M。;蒂洛什,I。;比亚拉斯,A。;北卡米塔基。;Martersteck,E.,使用纳米液滴对单个细胞进行高度并行的全基因组表达谱分析,Cell,161,5,1202-1214(2015)
[28] 男爵,M。;Veres,A。;Wolock,S。;浮士德·A。;Gaujoux,R。;维特尔,A。;Ryu,J.H。;瓦格纳,B。;Shen-Orr,S。;Klein,A.,人类和小鼠胰腺的单细胞转录组图谱揭示了细胞间和细胞内群体结构,细胞系统。,3、4、346-360.e4(2016)
[29] Haghverdi,L。;贝特纳,M。;F.A.沃尔夫。;Buettner,F。;Theis,F.J.,《扩散伪时间稳健重建谱系分支》,《自然方法》,13,10,845(2016)
[30] 陈,X。;Su,Z.C.,使用新的聚类方法从单细胞转录体中识别细胞类型,生物信息学,31,12,1974-1980(2015)
[31] 王,B。;朱,J。;皮尔逊,E。;拉马佐蒂,D。;Batzoglou,S.,通过基于核的相似性学习对单细胞RNA-Seq数据进行可视化和分析,自然方法,14,4,414(2017)
[32] 基塞列夫,V.Y。;Kirschner,K。;Schaub,M.T。;安德鲁斯,T。;Yiu,A。;Chandra,T。;Natarajan,K.N。;Reik,W。;巴拉奥纳,M。;Green,A.R.,SC3:单细胞RNA-Seq数据的共识聚类,《自然方法》,14,5,483-486(2017)
[33] 姜浩。;Sohn,L.L。;黄,H.Y。;Chen,L.N.,基于细胞间差异相关性和方差分析的单细胞聚类,生物信息学,34,21,3684(2018)
[34] Lee,D.D。;Seung,H.S.,通过非负矩阵分解学习对象的各个部分,《自然》,401,6755,788-791(1999)·Zbl 1369.68285号
[35] D.Zhang,Z.H Zhou,S.Chen,(2006)核上的非负矩阵因子分解。收录于:Yang Q.,Webb G.(eds)PRICAI 2006:人工智能趋势。价格2006。计算机科学课堂讲稿,第4099卷。施普林格,柏林,海德堡。
[36] 潘,B。;赖,J。;陈伟生,基于mercer核构造的非线性非负矩阵分解,模式识别。,44, 10, 2800-2810 (2011) ·Zbl 1218.68150号
[37] Shawetaylor,J。;Cristianini,N.,《模式分析的核心方法:模式分析》(2004),剑桥大学出版社
[38] R.R.Coifman,S.Lafon,扩散图,应用。计算。哈蒙。分析。21(1) 5-30. ·Zbl 1095.68094号
[39] 美国德米特里。;亚历山德罗,F。;赛义夫,I。;Hind,A。;Peter,L。;道华,L。;Jens,H.L。;Jesper,H。;Olga,K。;Kharchenko,P.V.,《通过大规模单细胞RNA测序对感觉神经元类型进行无偏分类》,《自然神经科学》。,18, 1, 145-153 (2015)
[40] Kolodziejczyk,A。;Kim,J.K。;Tsang,J.H。;伊利西奇,T。;亨利克森,J。;Natarajan,K。;塔克,A。;高,X。;比勒,M。;Liu,P.,多能性状态的单细胞RNA测序解锁模块化转录变异,cell Stem cell,17,4,471-485(2015)
[41] Gierahn,T.M。;Wadsworth,M.H。;休斯·T·K。;布莱森,B.D。;巴特勒,A。;Satija,R。;财富,S。;洛夫,J.C。;Shalek,A.K.,Seq-well:高通量下单个细胞的便携式低成本RNA测序,《自然方法》,14,4,395-398(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。