×

零膨胀单细胞基因表达的图形模型。 (英语) Zbl 1423.62148号

摘要:大量基因表达实验依赖于数千个细胞的聚集来测量生物体中的平均表达。微流控和液滴测序的进展现在允许在单个细胞中进行表达谱分析。这项对细胞间变异的研究表明,单个细胞缺乏转录物的可检测表达,转录物在群体水平上表现丰富,导致零膨胀表达模式。为了从这些数据中推断基因协同调控网络,我们提出了一个多元栅栏模型。它由奇异高斯分布的混合组成。我们使用伪似然邻域选择和群套索惩罚来选择和拟合捕获基因间条件独立性的无向图形模型。该方法在仿真中比现有方法更为敏感,即使在偏离跨栏模型的情况下也是如此。该方法应用于T滤泡辅助细胞数据和小鼠树突状细胞的高维轮廓。它推断出其他方法或批量数据集中未揭示的网络结构。R实现可在https://github.com/amcdavid/HurdleNormal网站.

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92D20型 蛋白质序列,DNA序列
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adachi,Y.、Hiramatsu,S.、Tokuda,N.、Sharifi,K.、Ebrahimi,M.、Islam,A.、Kagawa,Y.,Koshy Vaidyan,L.、Sawada,T.、Hamano,K.和Owada,Y.(2012)。脂肪酸结合蛋白4(FABP4)和FABP5调节小鼠胸腺上皮细胞中细胞因子的产生。组织化学。细胞生物学。138 397-406。
[2] Chen,S.、Witten,D.M.和Shojaie,A.(2015)。混合图形模型的选择和估计。生物特征102 47-64·Zbl 1345.62081号
[3] Cheng,J.、Li,T.、Levina,E.和Zhu,J.(2017)。高维混合图形模型。J.计算。图表。统计26 367-378。
[4] 基因本体联盟基因本体联盟:向前发展。核酸研究43。(D1):D1049-D10562015。
[5] de Jong,E.C.、Vieira,P.L.、Kalinski,P.、Schuitemaker,J.H.N.、Tanaka,Y.、Wierenga,E.A.、Yazdanbakhsh,M.和Kapsenberg,M.L.(2002)。微生物化合物通过不同的th细胞极化信号在体外选择性诱导Th1细胞或Th2细胞树突状细胞。免疫学杂志.168 1704-1709。
[6] Denda-Nagai,K.、Aida,S.、Saba,K.和Suzuki,K.,Moriyama,S.,Oo-puthina,S.和Tsuiji,M.,Morikawa,A.,Kuamoto,Y.,Sugiura,D.,Kudo,A.,Akimoto,Y.、Kawakami,H.、Bovin,N.V.和Irimura,T.(2010年)。巨噬细胞半乳糖型C型凝集素2(MGL2/CD301b)的分布和功能:树突状细胞对糖基化抗原的有效摄取和呈现。生物学杂志。化学285 19193-19204。
[7] Dobra,A.、Hans,C.、Jones,B.、Nevins,J.R.、Yao,G.和West,M.(2004)。探索基因表达数据的稀疏图形模型。《多元分析杂志》90 196-212·Zbl 1047.62104号
[8] Drton,M.和Maathuis,M.(2017年)。图形建模中的结构学习。每年。修订统计申请4 365-393。
[9] Drton,M.、Sturmfels,B.和Sullivant,S.(2009年)。代数统计学讲座。Oberwolfach研讨会39。巴塞尔Birkhäuser·Zbl 1166.13001号
[10] Eltoft,T.、Kim,T.和Lee,T.W.(2006)。关于多元拉普拉斯分布。IEEE信号处理。第13页300-303。
[11] Finak,G.、McDavid,A.、Yajima,M.、Deng,J.、Gersuk,V.、Shalek,A.K.、Slichter,C.K.、Miller,H.W.、Juliana McElrath,M.和Prlic,M.,Linsley,P.S.以及Gottardo,R.(2015)。MAST:评估转录变化和表征单细胞RNA测序数据异质性的灵活统计框架。基因组生物学16 278。
[12] Foygel,R.和Drton,M.(2010年)。线性回归的组套索和稀疏组套索中的精确分块优化。1-19. Arxiv预印本。可从Arxiv:1010.3320获得。
[13] Marinov,G.K.、Williams,B.A.、McCue,K.、Schroth,G.P.、Gertz,J.、Myers,R.M.和Wold,B.J.(2014)。从单细胞到细胞库转录组:基因表达和RNA剪接的保守性。基因组研究24 496-510。
[14] Janes,K.A.、Wang,C.-C.、Holmberg,K.J.、Cabral,K.和Brugge,J.S.(2010年)。通过随机分析识别单细胞分子程序。自然方法7 311-317。
[15] Johnston,R.J.、Poholek,A.C.、DiToro,D.、Yusuf,I.、Eto,D.、Barnett,B.、Dent,A.L.、Craft,J.和Crotty,S.(2009年)。Bcl6和Blimp-1是T滤泡辅助细胞分化的相互拮抗调节因子。科学325。
[16] Kim,J.K.和Marioni,J.C.(2013)。从单细胞RNA测序数据推断随机基因表达的动力学。基因组生物学.14。
[17] Pham,L.V.、Tamayo,A.T.、Yoshimura,L.C.、Lin-Lee,Y.C.和Ford,R.J.(2005)。侵袭性B细胞淋巴瘤中的组成性NF-kappaB和NFAT激活协同激活CD154基因并维持淋巴瘤细胞生存。血液106 3940-3947。
[18] Lauritzen,S.L.(1996)。图形模型。牛津统计科学系列17。牛津大学出版社,纽约。
[19] Lee,J.D.和Hastie,T.J.(2013)。混合图形模型的结构学习。位于亚利桑那州斯科茨代尔AISTATS 16 31 388-396。网址:http://jmlr.org/proceedings/papers/v31/lee13a.html。
[20] Li,Y.,Pearl,S.A.和Jackson,S.A.(2015)。植物生物学中的基因网络:重建和分析方法。《植物科学趋势》20 664-675。
[21] Lin,L.,Finak,G.,Ushey,K.,Seshadri,C.,Hawn,T.R.,Frahm,N.,Scriba,T.J.,Mahomed,H.,Hanekom,W.等人(2015)。COMPASS确定与临床结果相关的T细胞亚群。《自然生物技术》33 610-616。
[22] Ma,C.S.、Deenick,E.K.、Batten,M.和Tangye,S.G.(2012)。T滤泡辅助细胞的起源、功能和调节。《实验医学杂志》,2009年1241-1253。
[23] Markowetz,F.和Spang,R.(2007年)。推断蜂窝网络:综述。BMC生物信息。8。
[24] McDavid,A.、Finak,G.、Chattopadyay,P.K.、Dominguez,M.、Lamoreaux,L.、Ma,S.S.、Roederer,M.和Gottardo,R.(2013)。基于单细胞qPCR的基因表达实验中的数据探索、质量控制和测试。生物信息学29 461-467。
[25] McDavid,A.、Gottardo,R.、Simon,N.和Drton,M.(2019年)。补充“零膨胀单细胞基因表达的图形模型”DOI:10.1214/18-AOAS1213SUPP·Zbl 1423.62148号
[26] Meinshausen,N.和Bühlmann,P.(2006)。使用套索进行高维图形和变量选择。《统计年鉴》34 1436-1462·Zbl 1113.62082号
[27] Parikh,N.和Boyd,S.(2014年)。近似算法。已找到。趋势优化1 123-231。
[28] Precopio,M.L.、Betts,M.R.、Parrino,J.、Price,D.A.、Gostick,E.、Ambrozak,D.R.、Asher,T.E.、Douek,D.C.、Harari,A.等人(2007年)。接种痘苗病毒可诱导多功能和表型独特的CD8(+)T细胞反应。《实验医学杂志》,2004年,1405-1416。
[29] Ravikumar,P.、Wainwright,M.J.和Lafferty,J.D.(2010年)。使用\(\ell_1\)正则化逻辑回归的高维Ising模型选择。《统计年鉴》38 1287-1319·Zbl 1189.62115号
[30] Shah,R.D.和Samworth,R.J.(2013)。误差控制变量选择:稳定性选择的另一个视角。J.R.统计社会服务。B.统计方法75 55-80·Zbl 07555438号
[31] Shalek,A.K.,Satija,R.,Shuga,J.,Trombetta,J.J.,Gennert,D.,Lu,D.,Chen,P.,Gertner,R.S.,Gaubrome,J.T.等人(2014年)。单细胞RNA-seq揭示了细胞变异的动态旁分泌控制。自然510 263-269。
[32] Simon,N.和Tibshirani,R.(2012年)。标准化和拉索集团惩罚。统计师。中国22 983-1001·Zbl 1257.62080号
[33] Tansey,W.、Padilla,O.H.M.、Suggala,A.S.和Ravikumar,P.(2015)。指数族向量空间马尔可夫随机场。第32届国际机器学习会议论文集37 684-692。可在http://jmlr.org/proceedings/papers/v37/tansey15.html。
[34] Tibshirani,R.,Bien,J.,Friedman,J.、Hastie,T.、Simon,N.、Taylor,J.和Tibshilani,R.J.(2012)。套索型问题中丢弃预测因子的强规则。J.R.统计社会服务。B.统计方法74 245-266·Zbl 1411.62213号
[35] Yang,E.,Baker,Y.,Ravikumar,P.,Allen,G.和Liu,Z.(2014)。通过指数族的混合图形模型。在AISTATS 17 33中。冰岛雷克雅未克。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。