×

尺度在细胞类型比例估计中的作用。 (英语) Zbl 1475.62258号

摘要:复杂组织由大量不同类型的细胞组成,每种细胞都参与多种生物过程。因此,了解这些过程的一个重要组成部分是了解组织的细胞类型组成。使用高通量基因表达数据估计细胞类型组成称为细胞类型反褶积。在本文中,我们首先总结了大量的反褶积文献,确定了一种常见的类似回归的反褶曲方法。我们称这种方法为统一反褶积回归(UDAR)框架。虽然属于该框架的方法都使用类似的模型,但它们适合使用不同规模的数据。基因表达数据的两种常用尺度是对数和线性。不幸的是,这些尺度在UDAR框架中都存在问题。使用对数尺度基因表达提出了一个生物学上不可信的模型,而使用线性尺度基因表达将导致统计上的无效估计。为了探索解决这些问题的方法,在本文中,我们考虑了反褶积方法如何使用两个尺度的混合调整模型。在对仿真和11个实际基准数据集的分析中,我们发现对UDAR框架进行典型的混合尺度调整可以提高统计效率和鲁棒性。更广泛地说,我们认为这些混合尺度建模原理可以被纳入许多现有的反褶积方法中。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
10层62层 点估计
92立方37 细胞生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abbas,A.R.、Wolslegel,K.、Seshasayee,D.、Modrusan,Z.和Clark,H.F.(2009年)。血液微阵列数据的反褶积确定系统性红斑狼疮的细胞激活模式。公共科学图书馆4. ·doi:10.1371/journal.pone.0006098
[2] Altboum,Z.、Steuerman,Y.、David,E.、Barnett-Itzhaki,Z.,Valadarsky,L.、Keren-Shaul,H.、Meningher,T.、Mendelson,E.、Mandelboim,M.等人(2014)。数字细胞定量识别流感感染期间的全球免疫细胞动力学。摩尔系统。生物。10 1-14. ·doi:10.1002/msb.134947
[3] Ayana,R.、Singh,S.和Pati,S.(2018)。人类脑细胞类型转录体的反褶积揭示了小胶质细胞特异性潜在生物标记物。前面。神经病学9 266. ·doi:10.3389/fneur.2018.00266
[4] Blei,D.M.、Ng,A.Y.和Jordan,M.I.(2003年)。潜在Dirichlet分配3 993-1022·Zbl 1112.68379号
[5] Bouquet,J.、Soloski,M.J.、Swei,A.、Cheadle,C.、Federman,S.、Billaud,J.-N.和Rebman,A.W.(2016)。纵向转录组分析显示急性莱姆病7 1-11治疗患者的持续差异基因表达特征·doi:10.1128/mBio.00100-16编辑器
[6] Capurro,A.、Bodea,L.G.、Schaefer,P.、Luthi-Carter,R.和Perreau,V.M.(2015)。使用人群特异性表达分析对帕金森病和亨廷顿病脑组织全基因组表达数据进行计算反褶积。前面。神经科学。9 1-12. ·doi:10.3389/fnins.2014.00441
[7] Conesa,A.、Madrigal,P.、Tarazona,S.、Gomez-Cabrero,D.、Cervera,A.、McPherson,A.、Szcze-si-niak,M.W.、Gaffney,D.J.、Elo,L.等人(2016年)。RNA-seq数据分析最佳实践调查。基因组生物学。17 13. ·doi:10.1186/s13059-016-0881-8
[8] Du,R.、Carey,V.和Weiss,S.T.(2019年)。DeconvSeq:测序数据中细胞混合物分布的反褶积。生物信息学35 5095-5102. ·doi:10.1093/bioinformatics/btz444
[9] Edgar,R.(2002)。基因表达综合:NCBI基因表达和杂交阵列数据仓库。核酸研究。30 207-210. ·doi:10.1093/nar/30.1.207
[10] Fernández,E.,Mahmoud,Y.,Veigas,F.,Rocha,D.,Balzarini,M.,Lujan,H.,Rabinovich,G.和Girotti,M.R.(2019年)。MIXTURE:基于基因表达数据的免疫肿瘤微环境估计的改进算法。生物Rxiv726562. ·数字对象标识代码:10.1101/726562
[11] Finotello,F.、Mayer,C.、Plattner,C.、Laschober,G.、Rieder,D.、Hackl,H.、Krogsdam,A.、Loncova,Z.、Posch,W.等人(2019年)。RNA-seq数据反褶积揭示了肿瘤免疫环境的分子和药理调节剂。一般医学。11 34·doi:10.1186/s13073-019-0638-6
[12] Gaujoux,R.(2013)。介绍基因表达反褶积和CellMix包。1-45.
[13] George,E.L.和Panos,A.(2007年)。白细胞计数高是否意味着感染?护理37 56学时15-56学时16·doi:10.1097/01.NURSE.0000268785.73612.5c
[14] Gong,T.和Szustakowski,J.D.(2013)。DeconRNASeq:基于mRNA-seq数据的异质组织样本反褶积的统计框架。生物信息学29 1083-1085. ·doi:10.1093/bioinformatics/btt090
[15] Gong,T.、Hartmann,N.、Kohane,I.S.、Brinkmann,V.、Staedtler,F.、Letzkus,M.、Bongiovanni,S.和Szustakowski,J.D.(2011)。使用二次规划优化转录剖面数据的反褶积,并应用于复杂的临床血液样本。公共科学图书馆6. ·doi:10.1371/journal.pone.0027156
[16] Hagenauer,M.H.、Li,J.Z.、Walsh,D.M.、Vawter,M.P.、Thompson,R.C.、Turner,C.A.、Bunney,W.E.、Myers,R.M.、Barchas,J.D.等人(2016)。从人脑转录组数据集推断细胞类型组成阐明了年龄、死亡方式、解剖和精神病诊断的影响。生物Rxiv.
[17] Hardin,J.和Wilson,J.(2009)。关于寡核苷酸表达值不正态分布的说明。生物统计学10 446-450. ·Zbl 1437.62489号 ·doi:10.1093/biostatistics/kxp003
[18] Hunt,G.J.和Gagnon-Bartsch,J.A.(2021)。补充“体重秤在细胞类型比例估算中的作用”https://doi.org/10.1214/20-AOAS1395SUPA网站, https://doi.org/10.1214/20-AOAS1395SUPPB
[19] Hunt,G.J.、Freytag,S.、Bahlo,M.和Gagnon-Bartsch,J.A.(2019年)。dtangle:精确而稳健的细胞类型反褶积。生物信息学35 2093-2099. ·doi:10.1093/bioinformatics/bty926
[20] Irizarry,R.A.、Hobbs,B.、Collin,F.、Beazer-Barclay,Y.D.、Antonellis,K.J.、Scherf,U.和Speed,T.P.(2003)。高密度寡核苷酸阵列探针水平数据的探索、规范化和总结。生物统计学4 249-264. ·Zbl 1141.62348号 ·doi:10.1093/biostatistics/4.2.249
[21] Sun,X.,Sun,S.和Yang,S.(2019年)。用单细胞RNA-seq数据反褶积体RNA-seq-数据的一种高效且灵活的方法。细胞8 1161.
[22] Liu,R.,Holik,A.Z.,Su,S.,Jansz,N.,Chen,K.,Leong,S..,Blewitt,M.E.,Smyth,G.K.和Ritchie,M.E.(2015)。为什么体重?建模样本和观测水平变异性提高了RNA-seq分析的功效43·doi:10.1093/nar/gkv412
[23] Lu,P.、Nakorchevsky,A.和Marcotte,E.M.(2003年)。表达反褶积:DNA微阵列数据的重新解释揭示了细胞群的动态变化。程序。国家。阿卡德。科学。美国100 10370-10375. ·doi:10.1073/pnas.1832361100
[24] Mohammadi,S.、Zuckerman,N.、Goldsmith,A.和Grama,A.(2015)。用于分离复杂组织中细胞类型的反褶积方法的关键综述。arXiv 1-20号。
[25] Newman,A.M.,Long Liu,C.,Green,M.R.,Gentles,A.J.,Feng,W.,Xu,Y.,Hoang,C.D.,Diehn,M.和Alizadeh,A.(2015)。组织表达谱中细胞亚群的稳健计数。自然方法12 193-201. ·doi:10.1016/j.molmed.2014.11.008.线粒体
[26] Parsons,J.、Munro,S.、Pine,P.S.、Mcdaniel,J.,Mehaffey,M.和Salit,M.(2015)。使用生物样品的混合物作为RNA测序实验的过程控制。BMC基因组学1-13. ·doi:10.1186/s12864-015-1912-7
[27] 乔·W·、昆·G·、沙沙尔·E·、余·M·、莫里斯·Q·和赞斯特拉·P·W·(2012)。PERT:一种从不同微环境和发育条件中对人类血液样本进行表达反褶积的方法。公共科学图书馆计算。生物。8. ·doi:10.1371/journal.pcbi.1002838
[28] Racle,J.、de Jonge,K.、Baumgaertner,P.、Speiser,D.E.和Gfeller,D.(2017)。从大量肿瘤基因表达数据中同时枚举癌症和免疫细胞类型。电子生活doi:10.7554/eLife.26476
[29] Tu,Y.、Stolovitzky,G.和Klein,U.(2002)。基因表达微阵列实验的定量噪声分析。程序。国家。阿卡德。科学。美国99 14031-14036. ·Zbl 1068.92021号 ·doi:10.1073/pnas.222164199
[30] Wang,M.,Master,S.R.和Chodosh,L.A.(2006年)。复杂哺乳动物器官中的计算表达反褶积。BMC生物信息。7 328. ·doi:10.1186/1471-2105-7-328
[31] Wang,N.,Hoffman,E.P.,Chen,L.,Chen-L.,Zhang,Liu,C.,Yu,G.,Herrington,D.M.,Clarke,R.等人(2016年)。转录异质性的数学模型确定复杂组织中的新标记和亚群。科学。代表。6 18909. ·doi:10.1038/srep18909
[32] Wang,Z.,Cao,S.,Morris,J.S.,Ahn,J,Liu,R.,Tyekucheva,S,Gao,F.,Li,B.,Lu,W.等人(2018年)。免疫浸润异质性肿瘤样本的转录组去卷积。I科学9 451-460. ·doi:10.1016/j.sci.2018.10.028
[33] Weng,L.、Dai,H.、Zhan,Y.、He,Y..、Stepaniants,S.B.和Bassett,D.E.(2006)。基因表达分析的罗塞塔误差模型。生物信息学22 1111-1121. ·doi:10.1093/bioinformatics/btl045
[34] Wilson,D.R.、Jin,C.、Ibrahim,J.G.和Sun,W.(2020)。通过考虑异常基因表达模式,ICeD-T可以准确估计肿瘤样本中免疫细胞的丰度。J.Amer。统计师。协会。115 1055-1065. ·Zbl 1441.62534号 ·doi:10.1080/01621459.2019.1654874
[35] Zwiener,I.、Frisch,B.和Binder,H.(2014)。转换RNA-seq数据以提高预后基因特征的性能。公共科学图书馆9电子85150·doi:10.1371/journal.pone.0085150
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。