×

共表达网络的稀疏因子模型,以及使用先前生物知识的应用程序。 (英语) Zbl 1343.92184号

摘要:从高通量表达数据推断基因调控网络是系统生物学当前的主要挑战之一。这种网络对于深入理解基因之间的相互作用非常有见地。由于基因与基因的相互作用通常被视为对已知生物机制的共同贡献,对基因表达之间依赖性的推断预计在一定程度上与可从本体论(GO、KEGG…)衍生的基因的功能特征一致。本文引入稀疏因子模型作为一个通用框架,以说明基因模块对潜在生物过程的联合贡献的先验知识,或推断相应的共表达网络。我们提出了一种(ell{1})正则化EM算法来拟合稀疏因子模型进行相关。我们展示了它如何帮助提取基因模块,更普遍地提高基因聚类性能。在仿真研究中,将该方法与相关网络稀疏因子模型的替代估计方法进行了比较。基于基因本体论(GO)的生物学知识的整合也在为了解鸡的肥胖变异性而生成的肝脏表达数据上进行了说明。

MSC公司:

92立方厘米 系统生物学、网络
92B15号机组 普通生物统计学
62页第10页 统计学在生物学和医学中的应用;元分析
92D10型 遗传学和表观遗传学
94-04 信息和通信理论相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aittokallio,T.和B.Schwikowski(2006):“基于图形的细胞生物学网络分析方法”,简介。生物信息。,7,243-255。;艾托卡利奥,T。;Schwikowski,B.,《基于图形的细胞生物学网络分析方法》,简介。生物信息。,7, 243-255 (2006)
[2] Banerjee,O.、A.El Ghaoui和A.d'Aspremont(2008):“通过稀疏最大似然估计进行模型选择”,J.Mach。学习。第9号决议,第485-516页。;O.班纳吉。;El Ghaoui,A。;d’Aspremont,A.,通过稀疏最大似然估计进行模型选择,J.马赫。学习。第9485-516号决议(2008年)·Zbl 1225.68149号
[3] Blum,Y.、G.Le Mignon、S.Lagarrigue和D.Causeur(2010):“分析基因表达异质性的因子模型”,BMC生物信息学,11,368。;Blum,Y。;Le Mignon,G。;拉加里古,S。;Causeur,D.,分析基因表达异质性的因子模型,BMC生物信息学,11,368(2010)
[4] Buja,A.和N.Eyuboglu(1992):“关于平行分析的评论”,Multivar。行为。决议,27509-540。;布贾,A。;Eyuboglu,N.,平行分析评论,多变量。行为。决议,27509-540(1992)
[5] Butte,A.、P.Tamayo、D.Slonim、T.Golub和I.Kohane(2000):“利用相关网络发现rna表达和化疗敏感性之间的功能关系”,Proc。国家。阿卡德。科学。,97, 12182.; 巴特,A。;Tamayo,P。;斯隆,D。;Golub,T.等人。;Kohane,I.,《利用相关网络发现rna表达和化疗敏感性之间的功能关系》,Proc。国家。阿卡德。科学。,97, 12182 (2000)
[6] Carter,S.、C.Brechbühler、M.Griffin和A.Bond(2004):“基因共表达网络拓扑为细胞状态的分子表征提供了框架”,《生物信息学》,第20期,第2242-250页。;卡特,S。;Brechbühler,C。;格里芬,M。;Bond,A.,基因共表达网络拓扑为细胞状态的分子表征提供了一个框架,生物信息学,202242-2250(2004)
[7] Carvalho,C.M.,J.Chang,J.E.Lucas,J.R.Nevins,Q.Wang和M.West(2008):“高维稀疏因子建模:在基因表达基因组学中的应用”,美国统计协会,103,1438-1456。;卡瓦略,C.M。;Chang,J。;卢卡斯,J.E。;Nevins,J.R。;王,Q。;West,M.,《高维稀疏因子建模:在基因表达基因组学中的应用》,美国统计协会,103,1438-1456(2008)·Zbl 1286.62091号
[8] Dempster,A.、N.Laird和D.Rubin(1977):“通过em算法从不完整数据中获得最大似然”,J.Royal Stat.Soc.B Met。,39, 1-38.; Dempster,A。;莱尔德,N。;Rubin,D.,《通过em算法从不完整数据中获取最大似然》,J.Royal Stat.Soc.B Met。,39, 1-38 (1977) ·Zbl 0364.62022号
[9] Friedman,J.,T.Hastie和R.Tibshirani(2008):“用图形套索进行稀疏逆协方差估计”,生物统计学,9432-441。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,432-441(2008)·Zbl 1143.62076号
[10] Friedman,J.、T.Hastie和R.Tibshirani(2010):“通过坐标下降法实现广义线性模型的正则化路径”,J.Stat.Softw。,33, 1-22.; 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,J.Stat.Softw。,33, 1-22 (2010) ·Zbl 1109.62302号
[11] Friguet,C.、M.Kloareg和D.Causeur(2009):“依赖性下多重测试的因子模型方法”,《美国统计协会期刊》,1041406-1415。;弗里格,C。;Kloareg,M。;Causeur,D.,《依赖性下多重测试的因子模型方法》,美国统计协会,1041406-1415(2009)·Zbl 1205.62071号
[12] Goldenberg,A.、A.-X.Zheng、S.Fienberg和E.-M.Airoldi(2010):“统计网络模型调查”,《机器学习的基础和趋势》,第2129-233页。;Goldenberg,A。;郑,A.-X。;费恩伯格,S。;Airoldi,E.-M.,《统计网络模型调查》,《机器学习的基础和趋势》,第2129-233页(2010年)·Zbl 1184.68030号
[13] Harris,M.-A.,J.Clark,A.Ireland,J.Lomax,M.Ashburner,R.Foulger,K.Eilbeck,S.Lewis,B.Marshall,C.Mungall,J.Richter,G.-MRubin,J.-A.Black,C.Bult,M.Dolan,H.Drabkin,J.-T.Eppig,D.-P.Hill,L.Ni,M.Ringwald,R.Balakrishnan,J.-M.CCherry,K.-R.Christie,M.-C.CCostanzo,S.Dwight,S.Engel,D.-G.Fisk,J.-E.Herschman,E.-L.Hong、R.-S.Nash、A.Sethuraman、C.-L.Theesfeld、D.Botstein、K.Dolinski、B.Feiebach、T.Berardini、S.Mundodi、S.-Y.Rhee、R.Apweiler、D.Barrell、E.Camon、E.Dimmer、V.Lee、R.Chisholm、P.Gaudet、W.Kibbe、R.Kishore、E.-M.Schwarz、P.Sternberg、M.Gwinn、L.Hannick、J.Wortman、M.Berriman、V.Wood、N.de la Cruz、P.Tonellato、,P.Jaiswal、T.Seigfried、R.White和基因本体联盟(2004):“基因本体(go)数据库和信息资源”,Nuc。《酸类研究》,32,D258。;Harris,医学硕士。;克拉克·J。;爱尔兰,A。;洛马克斯,J。;阿什伯恩,M。;Foulger,R。;Eilbeck,K。;刘易斯,S。;马歇尔,B。;蒙加尔,C。;J.Richter。;鲁宾,G.-M。;布雷克,J.-A。;Bult,C。;多兰,M。;Drabkin,H。;Eppig,J.-T。;希尔,D.-P。;Ni,L。;M.Ringwald。;Balakrishnan,R。;Cherry,J.-M。;克里斯蒂·K·R。;科斯坦佐,M.-C。;德怀特,S.-S。;恩格尔,S。;菲斯克,D.-G。;赫希曼,J.-E。;Hong,E.-L。;纳什,R.-S。;Sethuraman,A。;塞斯菲尔德,C.-L。;博茨坦,D。;Dolinski,K。;费尔巴赫,B。;Berardini,T。;蒙多迪,S。;Rhee,S.-Y。;阿普韦勒,R。;巴雷尔,D。;卡蒙,E。;调光器,E。;李,V。;Chisholm,R。;Gaudet,P。;Kibbe,W。;基肖尔,R。;施瓦茨,E.-M。;斯特恩伯格,P。;格温,M。;Hannick,L。;沃特曼,J。;Berriman,M。;木材,V。;德拉克鲁斯,N。;托内拉托,P。;Jaiswal,P。;塞格弗里德,T。;怀特,R,基因本体(go)数据库和信息资源,Nuc。《酸类研究》,32,D258(2004)
[14] Jöreskog,K.(1969):“验证性最大似然因子分析的一般方法”,《心理测量学》,34183-202。;Jöreskog,K.,《验证性最大似然因子分析的一般方法》,《心理测量学》,34183-202(1969)
[15] Langfelder,P.和S.Horvath(2007):“研究共表达模块之间关系的特征基因网络”,BMC系统。生物,1,54。;Langfelder等人。;Horvath,S.,研究共表达模块之间关系的特征基因网络,BMC系统。生物学,1,54(2007)
[16] Langfelder,P.和S.Horvath(2008):“WGCNA:加权相关网络分析的R包”,BMC生物信息学,9559。;Langfelder等人。;Horvath,S.,WGCNA:加权相关网络分析的R包,BMC生物信息学,9559(2008)
[17] Langfelder,P.,B.Zhang和S.Horvath(2008):“从层次聚类树定义聚类:R的动态树切割包”,生物信息学,24719-720。;Langfelder等人。;张,B。;Horvath,S.,《从层次聚类树定义聚类:R的动态树切割包》,生物信息学,24719-720(2008)
[18] Le Mignon,G.,C.Désert,F.Pitel,S.Leroux,O.Demeure,G.Guernec,B.Abasht,M.Douaire,P.Le Roy和S.Lagarrigue(2009):“使用转录组分析来表征鸡5号染色体上的qtl区域,”BMC基因组学,10575。;Le Mignon,G。;Désert,C。;Pitel,F。;勒鲁,S。;德梅里,O。;格内克,G。;阿巴什特,B。;杜艾尔,M。;勒罗伊,P。;Lagarrigue,S.,《利用转录组分析表征鸡5号染色体上的qtl区域》,BMC基因组学,10,575(2009)
[19] Leek,J.和J.Storey(2007):“通过替代变量分析捕捉基因表达研究中的异质性”,《公共科学图书馆·遗传学》。,3, 1724-1735.; Leek,J。;Storey,J.,通过替代变量分析捕捉基因表达研究中的异质性,PLoS Genet。,3, 1724-1735 (2007)
[20] Leek,J.和J.Storey(2008):“多重测试依赖性的一般框架”,Proc。国家。阿卡德。科学。,105, 18718.; Leek,J。;Storey,J.,《多重测试依赖性的一般框架》,Proc。国家。阿卡德。科学。,105, 18718 (2008) ·Zbl 1359.62202号
[21] Miettinen,T.和H.Gylling(2000):“肥胖中的胆固醇吸收效率和甾醇代谢”,《动脉粥样硬化》,153241-248。;Miettinen,T。;Gylling,H.,肥胖中胆固醇吸收效率和甾醇代谢,动脉粥样硬化,153241-248(2000)
[22] Rand,W.(1971):“聚类方法评估的客观标准”,《美国统计协会期刊》,第66期,第846-850页。;Rand,W.,《聚类方法评估的客观标准》,美国统计协会,66,846-850(1971)
[23] Rubin,D.和D.Thayer(1982):“ml因子分析的Em算法”,《心理测量学》,47,69-76。;鲁宾,D。;Thayer,D.,ml因子分析的Em算法,《心理测量学》,47,69-76(1982)·Zbl 0483.62046号
[24] Schäfer,J.和K.Strimmer(2005):“大规模协方差矩阵估计的收缩方法及其对功能基因组学的影响”,Stat.Appl。遗传学。分子生物学,4。;Schäfer,J。;Strimmer,K.,《大规模协方差矩阵估计的收缩方法及其对功能基因组学的影响》,Stat.Appl。遗传学。分子生物学,4(2005)
[25] Stuart,J.、E.Segal、D.Koller和S.Kim(2003):“保守遗传模块全球发现的基因-表达网络”,《科学》,302,249-255。;斯图亚特·J。;西格尔,E。;科勒,D。;Kim,S.,全球发现保守遗传模块的基因表达网络,《科学》,302,249-255(2003)
[26] Sun,Y.,N.-R.Zhang和A.-B.Owen(2012):“针对潜在变量调整的多假设检验,以及AGEMAP基因表达数据的应用”,Ann.Appl。《法律总汇》第6卷,第1664-1688页。;孙,Y。;张,N.-R。;Owen,A.-B.,针对潜在变量调整的多假设检验,应用于AGEMAP基因表达数据,Ann.Appl。统计,61664-1688(2012)·Zbl 1257.62115号
[27] Swierczynski,J.、L.Zabrocka、E.Goyke、S.Raczynska、W.Adamonis和Z.Sledzinski(2003):“肥胖人体脂肪组织中甘油3-磷酸脱氢酶活性增强”,分子细胞。生物化学。,254, 55-59.; 斯维尔钦斯基,J。;扎布罗卡,L。;戈伊克,E。;拉钦斯卡,S。;Adamonis,W。;Sledzinski,Z.,《肥胖人体脂肪组织中甘油3-磷酸脱氢酶活性增强》,分子细胞。生物化学。,254, 55-59 (2003)
[28] Witten,D.,R.Tibshirani和T.Hastie(2009):“惩罚矩阵分解,应用于稀疏主成分和规范相关性分析,”生物统计学,10515-534。;维滕,D。;Tibshirani,R。;Hastie,T.,A惩罚矩阵分解,应用于稀疏主成分和典型相关分析,生物统计学,10,515-534(2009)·Zbl 1437.62658号
[29] Woodbury,M.(1950):“反演修正矩阵”,备忘录报告,42,106。;Woodbury,M.,《反演修正矩阵》,备忘录报告,42,106(1950)
[30] Wu,C.,J.Kang,L.Peng,H.Li,S.Khan,C.Hillard,D.Okar和A.Lange(2005年):“增强肝糖酵解减少肥胖:脂肪生成的差异效应取决于糖酵化调节部位,”Cell Metab。,2, 131-140.; 吴,C。;Kang,J。;彭,L。;李,H。;Khan,S。;希拉德,C。;Okar,D。;Lange,A.,《增强肝糖酵解减少肥胖:脂肪生成的差异效应取决于糖酵化调节位点》,Cell Metab。,2, 131-140 (2005)
[31] Wu,T.和K.Lange(2008):“套索惩罚回归的坐标下降算法”,Ann.Appl。统计,224-244。;Wu,T。;Lange,K.,套索惩罚回归的坐标下降算法,Ann.Appl。统计,224-244(2008)·Zbl 1137.62045号
[32] Zhang,B.和S.Horvath(2005):“加权基因共表达网络分析的一般框架”,Stat.Appl。遗传学。分子生物学。,4, 1128.; 张,B。;Horvath,S.,加权基因共表达网络分析的一般框架,Stat.Appl。遗传学。分子生物学。,4, 1128 (2005) ·Zbl 1077.92042号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。