×

自适应单细胞一致性聚类(adaSC3)。 (英语) 兹比尔1474.62226

摘要:单细胞RNA测序数据的分析在健康研究中具有重要意义。它对数据科学家提出了挑战,但在个性化医疗方面具有巨大潜力。单个细胞的聚类旨在以数据驱动的方式检测患者体内不同的细胞群亚群。一些比较研究表示单细胞一致性聚类(SC3),由V.Y.Kiselev先生等【“SC3:单细胞RNA-seq数据的共识聚类”,《自然方法》14,第5期,483-486(2017;doi:10.1038/nmeth.4236)]作为分类单细胞RNA测序数据的最佳方法。SC3包括拉普拉斯特征映射和主成分分析(PCA)。我们的无监督提案自适应单细胞一致性聚类(adaSC公司3) 建议用扩散映射代替线性PCA,这是一种考虑单个细胞过渡的非线性方法。我们调查adaSC公司3关于SC3原始来源数据集的准确性以及模拟研究。比较adaSC公司3与SC3以及基于进一步替代降维技术的相关算法显示出令人信服的行为adaSC公司三。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
92D20型 蛋白质序列、DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安格尔,P。;Haghverdi,L。;贝特纳,M。;泰斯,FJ;马尔,C。;Buettner,F.,《命运:R中大规模单细胞数据的扩散图》,生物信息学,32,8,1241-1243(2016)·doi:10.1093/生物信息系统/btv715
[2] 贝尔金,M。;Niyogi,P.,用于降维和数据表示的拉普拉斯特征映射,神经计算,15,6,1373-1396(2003)·Zbl 1085.68119号 ·doi:10.1162/089976603321780317
[3] 南卡罗来纳州本德尔;肯塔基州戴维斯;艾尔·阿米尔,AD;Tadmor,医学博士;Simonds,EF;陈,TJ;丹麦Shenfeld;诺兰,GP;Peer,D.,单细胞轨迹检测揭示了人类B细胞发育中的进展和调控协调,《细胞》,157,3714-725(2014)·doi:10.1016/j.cell.2014.04.005
[4] 偏差,FH;曹,X。;Zhong,S.,单细胞RNA测序揭示的2-细胞和4-细胞小鼠胚胎内的细胞命运倾向,Genome Res,24,11,1787-1796(2014)·doi:10.1101/gr.177725.114
[5] Bolker B,Bolker Maintainer Ben and Imports,MASS(2020)软件包“emdbook”R软件包版本1.3.11
[6] Buettner,F。;Theis,FJ,一种解决从受精卵到胚泡单细胞基因表达模式差异的新方法,生物信息学,28,18,i626-i632(2012)·doi:10.1093/bioinformatics/bts385
[7] Cho,SH;Jongsu,J。;Seung,IK,《乳腺癌个性化医疗:系统综述》,《乳腺肿瘤杂志》,第15期,第3期,第265-272页(2012年)·doi:10.4048/jbc.2012.15.3.265
[8] 科伊夫曼,RR;Lafon,S.,扩散图,应用计算谐波分析,21,1,5-30(2006)·Zbl 1095.68094号 ·doi:10.1016/j.acha.2006.04.006
[9] 邓,Q。;拉姆斯克尔德,D。;雷尼乌斯,B。;Sandberg,R.,《单细胞RNA-seq揭示哺乳动物细胞中动态随机单等位基因表达》,《科学》,343,6167,193-196(2014)·doi:10.1126/science.1245316
[10] Diedrich H、Abel M.、Diedrich-Maintainer Holger(2012)包“lle”R包版本1.1
[11] DuóA,Robinson MD,Soneson C(2018)《单细胞RNA-seq数据聚类方法的系统性能评估》。F10000研究7.2
[12] 富特勒,C。;Schollmeyer,G。;Augustin,T.,使用系谱为不可靠的单细胞RNA测序数据构建具有依赖性结构的模拟数据。ISIPTA’19,Proc Mach Learn Res,103,216-224(2019)
[13] 古兰,M。;Scialdone,A.公司。;Graham,SJ;IC麦考利;Jedrusik,A。;Hupalowska,A.,《10月4日的异质性和Sox2靶向4细胞小鼠胚胎的细胞命运偏差》,《细胞》,165,1,61-74(2016)·doi:10.1016/j.cell.2016.01.047
[14] Haghverdi,L。;Buettner,F。;Theis,FJ,分化数据的高维单细胞分析扩散图,生物信息学,31,18,2989-2998(2015)·doi:10.1093/bioinformatics/btv325
[15] 桑格研究所Hemberg Group(2020)scRNA-Seq数据集。https://hemberg-lab.github.io/scRNA.seq.datasets/。2020年8月11日访问
[16] Kayo O(2006)局部线性嵌入算法——扩展和应用。乌洛大学电气与信息工程系技术学院技术报告
[17] 基塞列夫,VY;Kirschner,K。;马耳他州绍布;安德鲁斯,T。;Yiu,A。;Chandra,T。;纳塔拉扬,KN;Rei,W。;巴拉奥纳,M。;Green,AR,SC3:单细胞RNA-Seq数据的共识聚类,Nat Methods,14,5,483-486(2017)·doi:10.1038/nmeth.4236
[18] 克莱伯,C。;Zeileis,A.,使用根图可视化计数数据回归,美国统计局,70,3,296-303(2016)·Zbl 07665888号 ·doi:10.1080/00031305.2016.1173590
[19] Kolodziejczyk,AA;金,JK;Tsang,JCH公司;伊利西奇,T。;亨利克森,J。;纳塔拉詹,KN;塔克,AC;高,X。;比勒,M。;Pentao,L.公司。;马利奥尼,JC;Teichmann,SA,《多能性状态的单细胞RNA测序解锁模块化转录变异》,《细胞干细胞》,17,4,471-485(2015)·doi:10.1016/j.stem.2015.09.011
[20] Oksanen J、Blanchet FG、Friendly M、Kindt R、Legendre P、McGlin D、Minchin PR、O'Hara RB、Simpson GL、Solymos P、Stevens MHH、Szoecs E、Wagner H(2019)《素食:社区生态包》。套餐“纯素食”R套餐版本2.5-6
[21] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A。;米歇尔,V。;蒂里昂,B。;格里塞尔,O。;布隆德尔,M。;普雷滕霍弗,P。;韦斯,R。;杜堡,R。;范德普拉斯,J。;帕索斯,A。;库纳波,D。;布鲁彻·M·佩罗(Brucher M.Perrot)。;Duchesnay,ME,Scikit-learn:蟒蛇中的机器学习,J Mach learn Res,12,2825-2830(2011)·Zbl 1280.68189号
[22] R核心团队(2020)R:统计计算的语言和环境。奥地利维也纳R统计计算基金会https://www.R-project.org/。2020年8月11日访问
[23] 唐,F。;巴巴西奥鲁,C。;Wang,Y。;Nordman,E。;Lee,C。;徐,N。;王,X。;Bodeau,J。;Tuch,BB;Siddiqui,A。;老挝,K。;Surani,MA,MRNA-Seq单细胞全转录组分析,Nat Methods,6377-382(2009)·doi:10.1038/nmeth.1315
[24] 人类细胞图谱。https://www.humancellatlas.org。2020年8月11日访问
[25] 特鲁特林,B。;布朗菲尔德DG;吴,AR;奈夫,NF;曼塔拉斯,德国劳埃德船级社;佛罗里达州埃斯皮诺扎;德赛,TJ;马萨诸塞州克拉斯诺;Quake,SR,使用单细胞RNA-seq重建远端肺上皮的谱系层次,Nature,509,7500,371-375(2014)·doi:10.1038/nature13173
[26] Wagner,GP;Kin,K。;Lynch,VJ,使用RNA-seq数据进行基因表达调用的基于模型的标准,Theory Biosci,132,3159-164(2013)·doi:10.1007/s12064-013-0178-3
[27] Yan,L。;杨,M。;郭,H。;Yang,L.等人。;吴杰。;李,R。;刘,P。;Lian,Y。;郑,X。;Yan,J.,人类植入前胚胎和胚胎干细胞的单细胞RNA-Seq图谱,Nat Struct Mol Biol,20,91131(2013)·doi:10.1038/nsmb.2660
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。