×

使用异构数据源集合优化细胞路径模型。 (英语) 兹比尔1405.62174

摘要:改进细胞通路的现有模型和假设是系统生物学和功能基因组学的主要挑战之一。需要一种方法来建立在现有专家知识的基础上,并将其与新的高通量研究的结果相协调。此外,可用的数据源是异构的,数据需要以不同的方式进行集成,这取决于它们信息最丰富的路径部分。在本文中,我们引入了一种特定于隔间的策略来集成边缘、节点和路径数据,以细化给定的网络假设。为了进行推断,我们使用局部移动吉布斯采样器来更新异质数据源简编中的路径假设,并使用新的网络回归思想来整合蛋白质属性。我们在酵母信息素反应MAPK通路的个案研究中证明了这种方法的实用性酿酒酵母.

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alberts,B.、Johnson,A.、Lewis,J.、Raff,M.、Roberts,K.和Walter,P.(2002年)。《细胞分子生物学》,第4版,《加兰科学》,纽约。
[2] Balbin,O.A.、Prensner,J.R.、Sahu,A.、Yocum,A.、Shankar,S.、Malik,R.、Fermin,D.、Dhanasekaran,S.M.、Chandler,B.、Thomas,D.、Beer,D.G.、Cao,X.、Nesvizhskii,A.I.和Chinnaiyan,A.M.(2013)。通过整合不同的组学数据重建肺癌的靶向通路。Nat.Commun.4文章ID 2617。数字对象标识码:10.1038/ncomms3617。
[3] Bernard,A.和Hartemink,A.J.(2005)。信息结构优先:从多种类型的数据中联合学习动态监管网络。太平洋生物计算研讨会459–470。
[4] Brem,R.B.和Kruglyak,L.(2005)。酵母5700个基因表达性状的遗传复杂性。程序。国家。阿卡德。科学。美国102 1572–1577。
[5] Franks,A.、Markowetz,F.和Airoldi,E.(2018年)。补充“使用异质数据源集合优化细胞路径模型”。DOI:10.1214/16-AOAS915SUPP。
[6] Friedman,N.(2004)。使用概率图形模型推断蜂窝网络。科学303 799–805。
[7] Fröhlich,H.、Fellmann,M.、Sültmann,H.,Poustka,A.和Beißbarth,T.(2007)。从RNAi和微阵列数据对信号通路进行大规模统计推断。BMC生物信息。8文章ID 386。
[8] Fröhlich,H.、Beissbarth,T.、Tresch,A.、Kostka,D.、Jacob,J.、Spang,R.和Markowetz,F.(2008a)。利用R和Bioconductor中的嵌套效应模型分析基因扰动筛选。生物信息24 2549–2550。
[9] Fröhlich,H.、Fellmann,M.、Sültmann,H.,Poustka,A.和Beißbarth,T.(2008b)。通过域签名预测路径成员身份。生物信息24 2137–2142。
[10] Gasch,A.P.、Spellman,P.T.、Kao,C.M.、Carmel-Harel,O.、Eisen,M.B.、Storz,G.、Botstein,D.和Brown,P.O.(2000)。酵母细胞对环境变化反应的基因组表达程序。分子生物学。手机11 4241–4257。
[11] Gat-Viks,I.和Shamir,R.(2007年)。信号通路的完善和扩展:酵母中的渗透反应网络。基因组研究17 358–367。
[12] Gelman,A.、Jakulin,A.、Pittau,M.G.和Su,Y.-S.(2008)。逻辑和其他回归模型的弱信息默认先验分布。Ann.应用。统计数据2 1360–1383·Zbl 1156.62017年 ·doi:10.1214/08-AOAS191
[13] Gitter,A.、Carmi,M.、Barkai,N.和Bar-Joseph,Z.(2013年)。将信号级联和控制压力反应的动态调节网络连接起来。基因组研究.23 365–376。
[14] Gruhler,A.、Olsen,J.V.、Mohammed,S.、Mortensen,P.、Faergeman,N.J.、Mann,M.和Jensen,O.N.(2005)。定量磷蛋白组学应用于酵母信息素信号通路。分子细胞。蛋白质组学4 310–327。
[15] Guan,Y.、Myers,C.L.、Hess,D.C.、Barutcuoglu,Z.、Caudy,A.A.和Troyanskaya,O.G.(2008)。使用分类器集成在层次上下文中预测基因功能。基因组生物学9(增刊1)S3。
[16] Guan,Y.、Gorenshteyn,D.、Burmeister,M.、Wong,A.K.、Schimenti,J.C.、Handel,M.A.、Bult,C.J.、Hibbs,M.和Troyanskaya,O.G.(2012)。优先考虑表型和疾病基因的组织特异性功能网络。PLoS计算机。生物8文章ID e1002694。
[17] Hahne,F.、Mehrle,A.、Arlt,D.、Poustka,A.、Wiemann,S.和Beißbarth,T.(2008)。使用InterPro域签名基于基因列表扩展路径。BMC生物信息。9文章ID 3。内政部:10.1186/1471-2105-9-3。
[18] Hara,K.、Ono,T.、Kuroda,K.&Ueda,M.(2012年)。膜显示肽配体激活酿酒酵母中的信息素反应途径。《生物化学杂志》151 551–557。
[19] Harbison,C.T.、Gordon,D.B.、Lee,T.I.、Rinaldi,N.J.、Macisaac,K.D.、Danford,T.W.、Hannett,N.M.、Tagne,J.-B.、Reynolds,D.B.,Yoo,J.、Jennings,E.G.、Zeitlinger,J.,Pokholok,D.K.、Kellis,M.、Rolfe,P.A.、Takusagawa,K.、Lander,E.S.、Gifford,D.K、Fraenkel,E.和Young,R.A.(2004)。真核生物基因组的转录调控代码。自然431 99–104。
[20] Hibbs,M.A.、Hess,D.C.、Myers,C.L.、Huttenhower,C.、Li,K.和Troyanskaya,O.G.(2007)。探索基因表达的功能景观:大型微阵列简编的定向搜索。生物信息学23 2692–2699。
[21] Hibbs,M.A.、Myers,C.L.、Huttenhower,C.、Hess,D.C.、Li,K.、Caudy,A.等人(2009年)。指导实验生物学:线粒体生物发生的个案研究。PLoS计算机。生物学5(3)文章ID e1000322。
[22] Hughes,T.R.、Marton,M.J.、Jones,A.R.、Roberts,C.J.、Stoughton,R.、Armour,C.D.、Bennett,H.A.、Coffey,E.、Dai,H.、He,Y.D.、Kidd,M.J.、King,A.M.、Meyer,M.R.,Slade,D.、Lum,P.Y.、Stepaniants,S.B.、Shoemaker,D.、Gachotte,D.、Chakraburtty,K.、Simon,J.、Bard,M.和Friend,S.H.(2000)。通过表达式概要进行功能发现。电话102 109–126。
[23] Hyduke,D.R.和Palsson,B.Ø。(2010). 朝向基因组尺度的信号网络重建。国家修订版基因11 297–307。
[24] Isci,S.、Dogan,H.、Ozturk,C.和Otu,H.H.(2014)。贝叶斯网络先验:利用外部知识对生物数据进行网络分析。生物信息学30 860–867。
[25] Kanehisa,M.和Goto,S.(2000年)。KEGG:京都基因和基因组百科全书。核酸研究28 27–30。
[26] Kirouac,D.C.、Saez Rodriguez,J.、Swantek,J.、Burke,J.M.、Lauffenburger,D.A.和Sorger,P.K.(2012年)。创建和分析信号转导网络建模的通路和蛋白质相互作用简编。BMC系统。生物学6文章ID 29。
[27] Knapp,B.和Kaderali,L.(2013)。使用扰动分析和线性规划重建细胞信号转导网络。PLoS ONE8文章ID e69220。
[28] Kofahl,B.和Klipp,E.(2004年)。模拟酵母信息素途径的动力学。酵母21 831–850。
[29] Letunic,I.、Doerks,T.和Bork,P.(2012)。SMART 7:蛋白质域注释资源的最新更新。核酸研究40 D302–D305。
[30] Li,J.、Wei,H.、Liu,T.和Zhao,P.X.(2013)。GPLEXUS:支持基因组规模的基因关联网络重建和大规模表达数据分析。核酸研究42文章ID e32。
[31] Llewellyn,R.和Eisenberg,D.S.(2008)。用广义功能链接注释蛋白质。程序。国家。阿卡德。科学。美国105 17700–17705。
[32] Lo,K.,Raftery,A.E.,Dombek,K.M.,Zhu,J.,Schadt,E.E.,Bumgarner,R.E.和Yeung,K.Y.(2012)。将外部生物学知识整合到时间序列表达数据的调控网络构建中。BMC系统。生物6文章ID 101。
[33] Markowetz,F.和Spang,R.(2007年)。推断蜂窝网络——综述。BMC生物信息.8(补充6)S5。
[34] Markowetz,F.、Kostka,D.、Troyanskaya,O.G.和Spang,R.(2007)。用于高维表型筛选的嵌套效应模型。生物信息学23 i305–i312。
[35] McClean,M.N.、Mody,A.、Broach,J.R.和Ramanathan,S.(2007年)。MAP激酶途径中的串扰和决策。《自然遗传学》39 409–414。
[36] Mukherjee,S.和Speed,T.P.(2008)。使用信息先验的网络推理。程序。国家。阿卡德。科学。美国105 14313–14318。
[37] Mulder,K.W.、Wang,X.、Escriu,C.、Ito,Y.、Schwarz,R.F.、Gillis,J.、Sirokmany,G.、Donati,G.,Uribe-Lewis,S.、Pavlidis,P.、Murrell,A.、Markowetz,F.和Watt,F.M.(2012a)。不同的表观遗传策略相互作用控制表皮分化。《自然细胞生物学》14 753–763。
[38] Müller,P.、Kuttenkeuler,D.、Gesellchen,V.、Zeidler,M.P.和Boutros,M.(2005)。通过全基因组RNA干扰鉴定JAK/STAT信号成分。自然436 871–875。
[39] Myers,C.L.、Robson,D.、Wible,A.、Hibbs,M.A.、Chiriac,C.、Theesfeld,C.L..、Dolinski,K.和Troyanskaya,O.G.(2005)。从不同功能基因组数据中发现生物网络。基因组生物学。6文章ID R114。
[40] Nagiec,M.J.和Dohlman,H.G.(2012)。酵母分化途径中的检查点在高渗应激期间协调信号传递。PLoS Genet.8文章ID e1002437。
[41] Nariai,N.、Kim,S.、Imoto,S.和Miyano,S.(2004)。利用蛋白质相互作用,通过贝叶斯网络从微阵列数据估计基因网络。太平洋生物计算研讨会336–347。
[42] Ourfali,O.,Shlomi,T.,Ideker,T.、Ruppin,E.和Sharan,R.(2007年)。脊椎:从因果实验推断信号调节通路的框架。生物信息学23 i359–i366。
[43] Pham,L.、Christadore,L.,Schaus,S.和Kolaczyk,E.D.(2011年)。使用潜在通路识别分析进行基于网络的转录失调源预测。程序。国家。阿卡德。科学。美国108 13347–13352。
[44] Pham,L.M.、Carvalho,L.、Schaus,S.和Kolaczyk,E.D.(2016)。通过对潜在生物途径网络上的基因表达建模进行扰动检测:贝叶斯层次方法。J.艾默。统计师。协会111 73–92·doi:10.1080/01621459.2015.1110523
[45] Pounds,S.和Morris,S.W.(2003)。通过近似和划分p值的经验分布来估计微阵列研究中假阳性和假阴性的发生率。生物信息学19 1236–1242。
[46] Punta,M.、Coggill,P.C.、Eberhardt,R.Y.、Mistry,J.、Tate,J.和Boursnell,C.、Pang,N.、Forslund,K.、Ceric,G.、Clements,J.,Heger,A.、Holm,L.、Sonnhammer,E.L.、Eddy,S.R.、Bateman,A.和Finn,R.D.(2012年)。Pfam蛋白质家族数据库。核酸研究40 D290–D301。
[47] Reguly,T.、Breitkreutz,A.、Boucher,L.、Breitkreutz,B.-J、Hon,G.C.、Myers,C.L.、Parsons,A.、Friesen,H.、Oughtred,R.、Tong,A.、Stark,C.、Ho,Y.、Botstein,D.、Andrews,B.、Boone,C.、Troyanskya,O.G.、Ideker,T.、Dolinski,K.、Batada,N.N.和Tyers,M.(2006年)。酿酒酵母全球交互网络的综合管理和分析。J.Biol.5文章ID 11。
[48] Ren,B.、Robert,F.、Wyrick,J.J.、Aparicio,O.、Jennings,E.G.、Simon,I.、Zeitlinger,J.、Schreiber,J.、Hannett,N.、Kanin,E.、Volkert,T.L.、Wilson,C.J.、Bell,S.P.和Young,R.A.(2000年)。DNA结合蛋白的全基因组定位和功能。科学290 2306–2309。
[49] Roberts,C.J.、Nelson,B.、Marton,M.J.、Stoughton,R.、Meyer,M.R.、Bennett,H.A.、He,Y.D.、Dai,H.、Walker,W.L.、Hughes,T.R.、Tyers,M.、Boone,C.和Friend,S.H.(2000)。全球基因表达谱矩阵揭示了多重MAPK通路的信号和电路。科学287 873–880。
[50] Ryan,C.J.、Cimermani,P.、Szpiech,Z.A.、Sali,A.、Hernandez,R.D.和Krogan,N.J.(2013年)。高分辨率网络生物学:连接序列和功能。Nat.Rev.Genet.14 865–879。
[51] Schäfer,J.和Strimmer,K.(2005a)。大规模协方差矩阵估计的收缩方法及其对功能基因组学的影响。统计应用程序。遗传学。分子生物学4文章ID 32。
[52] Schäfer,J.和Strimmer,K.(2005年b)。推断大规模基因关联网络的经验贝叶斯方法。生物信息学21 754–764。
[53] Schultz,J.、Milpetz,F.、Bork,P.和Ponting,C.P.(1998)。SMART是一种简单的模块化体系结构研究工具:信令域识别。程序。国家。阿卡德。科学。美国95 5857–5864。
[54] Scott,J.、Ideker,T.、Karp,R.M.和Sharan,R.(2006)。检测蛋白质相互作用网络中信号通路的有效算法。J.计算。生物13 133–144·Zbl 1119.92331号
[55] Segal,E.、Wang,H.和Koller,D.(2003)。从蛋白质相互作用和基因表达数据中发现分子途径。生物信息学19(补遗1)i264–i271。
[56] Segal,E.、Shapira,M.、Regev,A.、Peer,D.、Botstein,D.、Koller,D.和Friedman,N.(2003)。模块网络:从基因表达数据中识别调节模块及其条件特异性调节器。《自然遗传学》34 166–176。
[57] Simon,I.、Barnett,J.、Hannett,N.、Harbison,C.T.、Rinaldi,N.J.、Volkert,T.L.、Wyrick,J.J.、Zeitlinger,J.,Gifford,D.K.、Jaakkola,T.S.和Young,R.A.(2001)。酵母细胞周期中转录调控因子的系列调控。牢房106 697–708。
[58] Stark,C.、Breitkreutz,B.-J.、Reguly,T.、Boucher,L.、Breitcreutz、A.和Tyers,M.(2006)。BioGRID:交互数据集的通用存储库。核酸研究34 D535–D539。
[59] Stelniec-Klotz,I.、Legewie,S.、Tchernitsa,O.、Witzel,F.、Klinger,B.、Sers,C.、Herzel,H.、Blüthgen,N.和Schäfer,R.(2012年B)。反向工程致癌KRAS.Mol.Syst.下游的分级调节网络。生物8文章ID 601。
[60] Tresch,A.和Markowetz,F.(2008)。嵌套效应模型中的结构学习。统计应用程序。遗传学。分子生物学7文章ID 9·Zbl 1276.92075号 ·doi:10.202/1544-6115.1332
[61] Vaga,S.、Bernardo-Faura,M.、Cokelaer,T.、Maiolica,A.、Barnes,C.A.、Gillet,L.C.、Hegemann,B.、van Drogen,F.、Sharifian,H.、Klipp,E.、Peter,M.,Saez-Rodriguez,J.和Aebersold,R.(2014)。磷蛋白组学分析揭示了酵母中两条信号通路之间的新的交叉调制机制。摩尔系统。生物10文章ID 767。
[62] Wang,X.、Castro,M.A.、Mulder,K.W.和Markowetz,F.(2012)。从基因扰动的丰富表型推断出的后关联网络和功能模块。PLoS计算机。生物8文章ID e1002566。
[63] Wang,X.、Yuan,K.、Hellmayr,C.、Liu,W.和Markowetz,F.(2014)。利用隐马尔可夫嵌套效应模型重构进化中的信号网络。Ann.应用。统计数据8 448–480·Zbl 1454.62250号 ·doi:10.1214/13-AOAS696
[64] Werhli,A.V.和Husmeier,D.(2007年)。通过将表达数据与多个先验知识源相结合,用贝叶斯网络重建基因调控网络。统计应用程序。遗传学。分子生物学6文章ID 15·Zbl 1166.62373号 ·doi:10.2202/1544-6115.1282
[65] Workman,C.T.、Mak,H.C.、McCuine,S.、Tagne,J.-B.、Agarwal,M.、Ozier,O.、Begley,T.J.、Samson,L.D.和Ideker,T.(2006)。绘制DNA损伤反应路径的系统方法。科学312 1054–1059。
[66] Yates,P.D.和Mukhopadhyay,N.D.(2013年)。生物网络假设测试的推理框架。BMC Bioinform.14文章ID 94。
[67] Yeang,C.-H.,Mak,H.C.,McCuine,S.,Workman,C.,Jaakkola,T.和Ideker,T.(2005)。在物理相互作用网络上验证和完善基因调控途径。基因组生物学。6文章ID R62。
[68] Yip,K.Y.、Alexander,R.P.、Yan,K.-K.和Gerstein,M.(2010)。通过整合敲除和扰动数据改进了硅内基因调控网络的重建。PLoS ONE5文章ID e8121。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。