×

用于分析协调高维响应的多路径块模型。 (英语) 兹比尔1283.62215

摘要:我们考虑量化多个高维响应之间的时间协调问题。我们引入了一系列适用于此问题的多路随机块模型,它避免了生物学中此类数据通常采用的预处理步骤,如装箱和阈值。我们开发了两个基于坍塌吉布斯采样和变分方法的推理程序。从隶属度和块模型估计、样本外预测和运行时间方面,我们对所提出的方法在模拟数据上进行了全面评估。我们还量化了诸如装箱和阈值化等审查程序对估计任务的影响。我们使用这些模型对酿酒酵母在碳和氮饥饿期间驱动基因表达和代谢产物浓度之间协调的功能机制进行了实证分析。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Airoldi,E.M.(2007)。概率图形模型入门。《公共科学图书馆·计算生物学》3 e252。
[2] Airoldi,E.M.、Blei,D.M.、Fienberg,S.E.和Xing,E.P.(2008)。混合成员随机块模型。机器学习研究杂志9 1981-2014·Zbl 1225.68143号
[3] Airoldi,E.M.、Huttenhower,C.、Gresham,D.、Lu,C.、Caudy,A.、Dunham,M.、Broach,J.R.、Botstein,D.和Troyanskaya,O.G.(2009年)。根据基因表达特征预测细胞生长。公共科学图书馆计算生物学5 e1000257。
[4] Airoldi,E.M.、Hashimoto,T.B.、Brandt,N.、Bahmani,T.、Athanasiadou,N.和Gresham,D.J.(2013a)。细胞生长和转录的协调动力学。
[5] Airoldi,E.M.、Wang,X.和Lin,X.(2013b)。补充“用于分析协调高维响应的多路径块模型”·Zbl 1283.62215号
[6] Ashburner,M.、Ball,C.A.、Blake,J.A.、Botstein,D.、Butler,H.、Cherry,J.M.、Davis,A.P.、Dolinski,K.、Dwight,S.S.、Eppig,J.T.、Harris,M.A.、Hill,D.P.、Issel-Tarver,L.、Kasarskis,A.、Lewis,S.、Matese,J.C.、Richardson,J.E.、Ringwald,M.,Rubinard,G.和Sherlock,G.(2000)。基因本体:生物学统一的工具。基因本体论联盟。《自然遗传学》25 25-29。
[7] Azari,H.和Airoldi,E.M.(2012)。加权网络的Graphlet分解。机器学习研究杂志,W&CP(AI&Stat)22 54-63。
[8] Blei,D.M.和Jordan,M.I.(2006年)。Dirichlet过程混合物的变分推理。贝叶斯分析。1 121-143(电子版)·Zbl 1331.62259号 ·doi:10.1214/06-BA104
[9] Blocker,A.W.和Meng,X.L.(2013)。数据预处理的风险。伯努利19 1176-1211·Zbl 1440.62019 ·doi:10.3150/13-BEJSP16
[10] Boyle,E.I.、Weng,S.、Gollub,J.、Jin,H.、Botstein,D.、Cherry,J.M.和Sherlock,G.(2004)。GO::TermFinder—用于访问与基因列表相关的基因本体术语的开源软件。生物信息学20 3710-3715。
[11] Bradley,P.H.、Brauer,M.J.、Rabinowitz,J.D.和Troyanskaya,O.G.(2009)。酿酒酵母转录物和代谢物的协同浓度变化。《公共科学图书馆·计算生物学》5 e1000270。
[12] Brauer,M.J.、Huttenhower,C.、Airoldi,E.M.、Rosenstein,R.、Matese,J.C.、Gresham,D.、Boer,V.M.、Troyanskaya,O.G.和Botstein,D.(2008)。酵母中生长速率、细胞周期、应激反应和代谢活性的协调。细胞分子生物学19 352-367。
[13] Brauer,M.J.、Yuan,J.、Bennett,B.D.、Lu,W.、Kimball,E.、Botstein,D.和Rabinowitz,J.D.(2006)。保存两种不同微生物对饥饿的代谢组学反应。程序。国家。阿卡德。科学。美国103 19302-19307。
[14] Braun,M.和McAuliffe,J.(2010年)。离散选择大规模模型的变分推理。J.Amer。统计师。协会105 324-335·Zbl 1397.62103号 ·doi:10.1198/jasa.2009.tm08030
[15] Chakrabarti,D.、Papadimitriou,S.、Modha,D.和Faloutsos,C.(2004年)。全自动交叉关联。ACM SIGKDD知识发现和数据挖掘国际会议论文集10 79-88。
[16] Cheng,Y.和Church,G.M.(2000)。表达式数据的双聚类。第八届分子生物学智能系统国际会议论文集8 93-103。
[17] Cherry,J.M.、Ball,C.、Weng,S.、Juvik,G.、Schmidt,R.、Adler,B.、Dunn,C.、Dwight,S.、Riles,L.、Mortimer,R.K.和Botstein,D.(1997年)。酿酒酵母的遗传和物理图谱。自然387 67-73。
[18] Cope,L.、Zhong,X.、Garrett,E.和Parmigiani,G.(2004)。MergeMaid:用于基因表达数据合并和交叉研究验证的R工具。统计应用程序。遗传学。分子生物学。3 a29·兹比尔1077.92040 ·数字对象标识代码:10.2202/1544-6115.046
[19] Fisher,R.A.(1915年)。无限大总体样本中相关系数值的频率分布。生物特征10 507-521。
[20] Fisher,R.A.(1921年)。关于从小样本推导出的相关系数的可能误差。地铁1 3-32。
[21] Franks,A.M.、Csárdi,G.、Drummond,D.A.和Airoldi,E.M.(2012)。从高通量生物学中的多实验室测量值估计结构化协方差矩阵·Zbl 1374.92041号
[22] Gasch,A.P.、Spellman,P.T.、Kao,C.M.、Carmel-Harel,O.、Eisen,M.B.、Storz,G.、Botstein,D.和Brown,P.O.(2000)。酵母细胞对环境变化反应的基因组表达程序。细胞分子生物学11 4241-4257。
[23] Goldenberg,A.、Zheng,A.X.、Fienberg,S.E.和Airoldi,E.M.(2009)。网络统计模型。机器学习的基础和趋势2 1-117·Zbl 1184.68030号
[24] Jordan,M.、Ghahramani,Z.、Jaakkola,T.和Saul,L.(1999)。介绍图形模型的变分方法。机器学习37 183-233·Zbl 0945.68164号 ·doi:10.1023/A:1007665907178
[25] Joutard,C.、Airoldi,E.M.、Fienberg,S.E.和Love,T.M.(2008)。用分层贝叶斯混合成员模型发现潜在模式和模型选择问题。在数据挖掘模式、新方法和应用中。宾夕法尼亚州好时IGI Global。
[26] Kanehisa,M.和Goto,S.(2000年)。KEGG:京都基因和基因组百科全书。核酸研究28 27-30。
[27] Liu,J.S.(1994)。贝叶斯计算中的崩溃吉布斯采样器及其在基因调控问题中的应用。J.Amer。统计师。协会89 958-966·Zbl 0804.62033号 ·doi:10.2307/2290921
[28] Lu,R.,Markowetz,F.,Unwin,R.D.,Leek,J.T.,Airoldi,E.M.,MacArthur,B.D.,Lachmann,A.,Rozov,R.、Ma'ayan,A.,Boyer,L.A.,Troyanskaya,O.G.,Whetton,A.D.和Lemischka,I.R.(2009)。小鼠胚胎干细胞命运变化的系统级动态分析。自然462 358-362。
[29] Markowetz,F.、Airoldi,E.M.、Lemischka,I.R.和Troyanskaya,O.G.(2009年)。将动态组蛋白乙酰化模式映射到纳米级缺失小鼠胚胎干细胞中的基因表达。未出版的手稿。
[30] Nowicki,K.和Snijders,T.A.B.(2001)。随机块体结构的估计和预测。J.Amer。统计师。协会96 1077-1087·Zbl 1072.62542号 ·doi:10.1198/016214501753208735
[31] Rohe,K.和Yu,B.(2012年)。有向图的共聚类:随机共块模型和谱算法。可从获取。1204.2296
[32] SGD项目。酿酒酵母基因组数据库。可从获取。
[33] Slavov,N.、Airoldi,E.M.、van Oudenaarden,A.和Botstein,D.(2013)。保守的细胞生长周期可以解释不同真核生物的环境应激反应。细胞分子生物学23,1986年至1997年。
[34] Snijders,T.A.B.和Nowicki,K.(1997年)。具有潜在块结构的图的随机块模型的估计和预测。J.分类14 75-100·Zbl 0896.62063号 ·数字对象标识代码:10.1007/s003579900004
[35] Stephens,M.(2000年)。成分数目未知的混合模型的贝叶斯分析——可逆跳跃方法的替代方法。安。统计师。28 40-74之间·Zbl 1106.62316号 ·doi:10.1214/aos/1016120364
[36] Titterington,D.M.、Smith,A.F.M.和Makov,U.E.(1985)。有限混合分布的统计分析。奇切斯特·威利·兹伯利0646.62013
[37] Troyanskaya,O.G.、Dolinski,K.、Owen,A.B.、Altman,R.B.和Botstein,D.(2003)。用于组合异质数据源进行基因功能预测的贝叶斯框架(酿酒酵母)。程序。国家。阿卡德。科学。美国100 10623-10628。
[38] Tu,B.P.、Kudlicki,A.、Rowicka,M.和McKnight,S.L.(2005)。酵母代谢循环的逻辑:细胞过程的时间划分。科学310 1152-1158。
[39] 特恩布尔,B.W.(1976)。具有任意分组、删失和截断数据的经验分布函数。J.罗伊。统计师。Soc.序列号。乙38 290-295·Zbl 0343.62033号
[40] Vardi,Y.(1985)。选择偏差模型中的经验分布。安。统计师。13 178-205. ·Zbl 0578.62047号 ·doi:10.1214/aos/1176346585
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。