×

通过单细胞RNA测序数据构建联合基因网络。 (英语) Zbl 1522.62123号

摘要:与单基因水平的差异基因表达分析相比,基因调控网络(GRN)分析描述了基因之间复杂的转录组相互作用,以更好地理解人类疾病和性状的潜在遗传结构。单细胞RNA测序(scRNA-seq)的最新进展使得构建GRN的分辨率比体RNA seq和微阵列数据更高。然而,scRNA-seq数据本身是稀疏的,这阻碍了流行的高斯图形模型(GGM)的直接应用。此外,现有的利用scRNA-seq数据构建GRN的方法大多只考虑一种条件下的基因网络。为了更好地理解单细胞分辨率下不同但相关条件下的GRN,我们建议在GGM框架下用scRNA-seq数据构建联合基因网络(JGNsc)。为了促进GGM的使用,JGNsc首先提出了一种混合插补程序,该程序将贝叶斯零膨胀泊松模型与迭代低秩矩阵完成步骤相结合,以有效插补技术伪影导致的零膨胀计数。然后,JGNsc通过非正态变换对输入数据进行变换,在此基础上构造联合GGM。我们演示了JGNsc并使用合成数据评估其性能。JGNsc在髓母细胞瘤和胶质母细胞瘤两项癌症临床研究中的应用除了证实了众所周知的生物学结果外,还获得了新的见解。
{©2022国际生物识别学会。}

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.(1998)信息理论和最大似然原理的扩展。收录:Kitagawa,G.K.(主编)、Tanabe,K.(编辑)和Parzen,E.(编辑)Hirotugu Akaike的论文选集。查姆:施普林格,第199-213页。
[2] Blencowe,M.、Arneson,D.、Ding,J.、Chen,Y.‐W.、。,Saleem,Z.和Yang,X.(2019)单细胞组学数据的网络建模:挑战、机遇和进展。生命科学新兴课题,3379-398。
[3] Boulay,G.、Awad,M.E.、Riggi,N.、Archer,T.C.、Iyer,S.、Boonseng,W.E.等人(2017年)远端调控元件的OTX2活性塑造了第3组髓母细胞瘤的染色质景观。癌症发现,7288-301。
[4] Buil,A.、Brown,A.A.、Lappalainen,T.、Viñuela,A.、Davies,M.N.、Zheng,H.F。等(2015)通过转录组序列分析检测双胞胎中的基因-基因和基因-环境相互作用。《自然遗传学》,47,88-91。
[5] Bunt,J.、Hasselt,N.E.、Zwijnenburg,D.A.、Koster,J.和Versteeg,R.&Kool,M.(2011)启动子区域OTX2和MYC的联合结合与髓母细胞瘤中的高基因表达相关。《公共科学图书馆·综合》,第6卷,e26058页。
[6] Chen,J.&Chen,Z.(2008)大模型空间模型选择的扩展贝叶斯信息准则。生物特征,95759-771·Zbl 1437.62415号
[7] Chen,S.&Mar,J.C.(2018)推断基因调控网络的评估方法强调了它们在单细胞基因表达数据方面的不足。BMC生物信息学,19,1-21。
[8] Corcoran,C.C.、Grady,C.R.、Pisitkun,T.、Parulekar,J.和Knepper,M.A.(2017)从20世纪的代谢挂图到21世纪的系统生物学:哺乳动物代谢酶数据库。美国生理学杂志-肾脏生理学,312,F533-F542。
[9] Danaher,P.,Wang,P.&Witten,D.M.(2014)多类协方差逆估计的联合图形套索。英国皇家统计学会杂志:B辑(统计方法),76373-397·Zbl 07555455号
[10] Dang,C.V.(2012)《MYC通往癌症之路》。细胞,149,22-35。
[11] Dong,M.和Jiang,Y.(2019)单细胞等位基因特异性基因表达分析。单位:元,G.‐C。(ed.)(ed.)单细胞数据分析的计算方法。纽约州纽约市:斯普林格出版社,第155-174页。
[12] Hicks,S.C.,Townes,F.W.,Teng,M.&Irizarry,R.A.(2018)单细胞RNA测序实验中的缺失数据和技术可变性。生物统计学,19562-578。
[13] Hovestadt,V.,Smith,K.S.,Bihannic,L.,Filbin,M.G.,Shaw,M.L.,Baumgartner,A.等人(2019)通过单细胞基因组学解决髓母细胞瘤细胞结构。《自然》,57274-79。
[14] Huynh‐Thu,V.A.,Irrthum,A.,Wehenkel,L.&Geurts,P.(2010)使用基于树的方法从表达数据推断调控网络。公共科学图书馆一期,5,e12776。
[15] Jia,B.,Xu,S.,Xiao,G.,Lamba,V.&Liang,F.(2017)从下一代测序数据学习基因调控网络。生物统计学,731221-1230·Zbl 1405.62180号
[16] Jiang,Y.,Zhang,N.R.&Li,M.(2017)SCALE:通过单细胞RNA测序模拟等位基因特异性基因表达。基因组生物学,18,74。
[17] Karlebach,G.&Shamir,R.(2008)基因调控网络的建模和分析。《自然评论分子细胞生物学》,9770-780。
[18] Kim,T.H.,Zhou,X.和Chen,M.(2020),解开单细胞UMI数据中“辍学”的谜团。基因组生物学,21,1-19。
[19] Langfelder,P.&Horvath,S.(2008)WGCNA:加权相关网络分析的R包。BMC生物信息学,9559。
[20] Lathia,J.D.、Mack,S.C.、Mulkearns‐Hubert,E.E.、Valentim,C.L.和Rich,J.N.(2015)胶质母细胞瘤中的肿瘤干细胞。基因与发育,291203-1217。
[21] Lee,S.,Liang,F.,Cai,L.和Xiao,G.(2018)高维异质数据的基因网络分析的两阶段方法。生物统计学,19,216-232。
[22] Liang,F.,Song,Q.&Qiu,P.(2015)高维高斯图形模型偏相关系数的等效度量。美国统计协会杂志,110,1248-1265·Zbl 1373.62287号
[23] Liu,H.,Lafferty,J.&Wasserman,L.(2009)非规范:高维无向图的半参数估计。机器学习研究杂志,102295-2328·Zbl 1235.62035号
[24] Liu,H.、Roeder,K.和Wasserman,L.(2010)高维图形模型正则化选择(星)的稳定性方法。《神经信息处理系统进展》,第1432-1440页。
[25] Lu,Y.,Labak,C.M.,Jain,N.,Purvis,I.J.,Guda,M.R.,Bach,S.E.等人(2017)OTX2表达有助于MYC扩增的髓母细胞瘤的增殖和进展。美国癌症研究杂志,7647-656。
[26] Lyu,Y.、Xue,L.、Zhang,F.、Koch,H.、Saba,L.,Kechris,K.和Li,Q.(2018)条件自适应融合图形套索(CFGL):推断条件特异性基因共表达网络的自适应程序。《公共科学图书馆·计算生物学》,14,e1006436。
[27] Marbach,D.、Costello,J.C.、Küffner,R.、Vega,N.M.、Prill,R.J.、Camacho,D.M.等人(2012)《稳健基因网络推断的群体智慧》。《自然方法》,9796-804。
[28] Mongia,A.、Sengupta,D.和Majumdar,A.(2019)McImpute:基于矩阵完成的单细胞RNA‐seq数据插补。遗传学前沿,10,9。
[29] Neftel,C.、Laffy,J.、Filbin,M.G.、Hara,T.、Shore,M.E.、Rahme,G.J.等人(2019)胶质母细胞瘤细胞状态、可塑性和遗传学的综合模型。细胞,178835-849。
[30] Northcott,P.A.、Korshunov,A.、Witt,H.、Hielscher,T.、Eberhart,C.G.、Mack,S.等人(2011)髓母细胞瘤由四种不同的分子变体组成。临床肿瘤学杂志,291408-1414。
[31] Picelli,S.,Björklund,奥兰多。K.,Faridani,O.R.,Sagasser,S.,Winberg,G.&Sandberg,R.(2013)Smart‐seq2,用于单细胞中敏感的全长转录组分析。《自然方法》,第10期,1096-1098页。
[32] Pratapa,A.、Jalihal,A.P.、Law,J.N.、Bharadwaj,A.和Murali,T.(2020年)《从单细胞转录组数据推断基因调控网络的基准算法》。《自然方法》,17,147-154。
[33] Rigby,R.A.和Stasinopoulos,D.M.(2005)位置、规模和形状的广义加性模型(含讨论)。应用统计学,54,507-554·Zbl 1490.62201号
[34] Schwarz,G.(1978)估算模型的维数。《统计年鉴》,第6461-464页·Zbl 0379.62005年
[35] Shang,L.,Smith,J.A.和Zhou,X.(2020)在全基因组关联研究中利用基因共表达模式推断性状相关组织。《公共科学图书馆·遗传学》,16,e1008734。
[36] Sun,Y.、Babu,P.和Palomar,D.P.(2016)信号处理、通信和机器学习中的优化最小化算法。IEEE信号处理汇刊,65,794-816·兹比尔1414.94595
[37] Svensson,V.(2020)水滴scRNA‐seq不是零膨胀的。《自然生物技术》38,147-150。
[38] Townes,F.W.,Hicks,S.C.,Aryee,M.J.&Irizarry,R.A.(2019)基于多项式模型的单细胞RNA-Seq特征选择和降维。基因组生物学,20,1-16。
[39] Trapnell,C.、Cacchiarelli,D.、Grimsby,J.、Pokharel,P.、Li,S.、Morse,M.等人(2014)通过单细胞的伪时间顺序揭示了细胞命运决定的动力学和调节器。《自然生物技术》,32,381-386。
[40] Van de Sande,B.、Flerin,C.、Davie,K.、de Waegeneer,M.、Hulselmans,G.、Aibar,S.等人(2020)单细胞基因调控网络分析的可扩展场景工作流。自然协议,152247-2276。
[41] Wang,J.,Wang,H.,Li,Z.,Wu,Q.,Lathia,J.D.,McLendon,R.E.等人(2008)c-MYC是维持胶质瘤干细胞所必需的。公共科学图书馆一期,3,e3769。
[42] Wang,X.,Yang,K.,Xie,Q.,Wu,Q.、Mack,S.C.、Shi,Y.等(2017)嘌呤合成促进维持胶质瘤中的脑肿瘤起始细胞。《自然神经科学》,20661-673。
[43] Wu,N.,Yin,F.,Ou‐Yang,L.,Zhu,Z.&Xie,W.(2020)从单细胞基因表达数据联合学习多基因网络。计算与结构生物技术杂志,18,2583-2595。
[44] Wysocki,A.C.和Rhemtulla,M.(2019),关于估算网络模型的惩罚参数选择。多元行为研究,56,288-302。
[45] Yahav,I.&Shmueli,G.(2012)关于在管理科学应用中生成多元泊松数据。商业和工业应用随机模型,2891-102·Zbl 06292433号
[46] Yang,R.,Wang,W.,Dong,M.,Roso,K.,Greer,P.,Bao,X.等人(2021)MYC扩增的髓母细胞瘤细胞基因组中转录产物的分布和脆弱性。生物Rxiv。
[47] Zou,H.(2006)自适应套索及其预言属性。美国统计协会杂志,1011418-1429·Zbl 1171.62326号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。