×

特征KEGG通路中基因表达和共同调控基因模式的相关性。 (英语) 兹比尔1407.92048

摘要:在当前的工作中,人们对基于染色体和途径的基因组学数据分析技术非常感兴趣,以了解疾病的机制。然而,很少有研究涉及机器学习方法在整合路径信息以分析微阵列数据方面的能力。在本文中,我们将随机森林中带外(OOB)的分类错误率与路径信息相结合来识别特征路径。在每个特征路径上,研究基因表达的相关性,并通过挖掘属性剖面(MAP)算法挖掘不同生物条件下的共调控基因模式。利用平均连锁层次聚类技术对发现的共调控基因模式进行聚类。结果表明,同一特征通路上的基因表达是近似的。此外,发现了两条具有共同调控基因模式特征的通路,其中一条含有108个模式,另一条含有一个模式。聚类分析结果表明,聚类的最小相似系数大于0.623,表明在相同的特征路径下,不同生物条件下的共同调控模式更接近。本文讨论的方法可以为微阵列数据的研究提供额外的见解。

MSC公司:

92C40型 生物化学、分子生物学
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿佩拉,E。;C.W,A.,基因毒性应激对p53的翻译后修饰和激活,《欧洲生物化学杂志》。,268, 2764-2772 (2001)
[2] Bolick,D.T.,12/15-lipoxygenase通过激活RhoA和核因子-kB,Arterioscler调节细胞间粘附分子-1的表达和单核细胞对内皮的粘附。血栓。瓦斯克。生物学,252301(2005)
[3] 布列赫林,L。;佛罗伦萨,I。;Gascuel,O。;埃利桑那州马雷查。,用种间保守共表达评估功能注释转移:应用于恶性疟原虫、BMC基因组、。,11, 35 (2010)
[4] Breiman,L.,《建立、使用和理解手册》,《随机森林》,4.0(2003)
[5] 埃格蒙特·佩特森,M。;de Ridder,D。;Handels,H.,神经网络图像处理综述,模式识别,35,10227-2301(2002)·Zbl 1006.68884号
[6] 艾森,M.B.,《全基因组表达模式的聚类分析和显示》,Proc。国家。阿卡德。科学。美国,9514863-14868(1998)
[7] Furey,T.S.,使用微阵列表达数据对癌症组织样本进行支持向量机分类和验证,生物信息学,16906-914(2000)
[8] Gasch,酵母细胞对环境变化反应中的基因组表达程序,分子生物学。细胞,11,12,4241-4257(2000)
[9] Gutin,G。;Yeo,A。;旅行推销员不应该贪婪:TSP离散应用程序贪婪型启发式的支配分析。数学。,117, 81-86 (2002) ·Zbl 1004.68121号
[10] Gyenesei,A.,《无二值化的频繁模式发现:挖掘属性配置文件》,PKDD-Lect。注释Artif。智力。,4213528-535(2006年)
[11] Gyenesei,A.,《挖掘共同调控的基因图谱以检测基因表达数据中的功能关联》,生物信息学,1927-1935年,第23期(2007年)
[12] Hanisch,D。;Zien,A。;Zimmer,R。;Lengauer,T.,生物网络和基因表达数据的共聚类,生物信息学,18,S145-S154(2002)
[13] 郑,H。;Tombor,B。;阿尔伯特·R。;Oltvai,Z.N。;Barabasi,A.L.,《代谢网络的大规模组织》,《自然》,407651-654(2000)
[14] 伊什瓦兰,H,;Rao,J.S.,使用贝叶斯模型选择检测微阵列中差异表达的基因,美国统计协会,98,438-455(2003)·Zbl 1041.62090号
[15] Iida,T.,HIF-1诱导内皮细胞凋亡,基因细胞,7,143-149(2002)
[16] 伊梅尔斯,J。;利维,R。;Barkai,N..,代谢网络中转录控制的原则酿酒酵母,国家生物技术。,22, 86-92 (2003)
[17] Jakubowski,H.,氨酰-tRNA合成酶的翻译准确性:对动脉粥样硬化的影响,美国社会营养杂志。科学。,1312983S-2987S(2001)
[18] Kam,H.T.,决策林构建者比较优势的数据复杂性分析,模式分析。申请。,5, 102-112 (2002) ·Zbl 1002.68715号
[19] Kanehisa,M.,基因组网KEGG数据库,核酸研究,30,42-46(2002)
[20] Kanehisa,M。;Goto,S。;服务端,M。;Aoki-Kinoshita,K.F。;伊藤美诚。;川岛,S。;Katayama,T。;荒木,M。;Hirakawa,M.,《从基因组学到化学基因组学:KEGG的新发展》,核酸研究,34,数据库问题,D354-D357(2006)
[21] Kerachian,M。;库诺耶,D。;周,T.Y.K。;E.J.哈维。;Séguin,C.,地塞米松对人脐静脉内皮细胞的促凝作用:糖皮质激素诱导骨坏死的潜在机制,J.Thromb。止血。,5, 364-372 (2007)
[22] Kharchenko,P.,Church,G.M.和Vitkup,D.,2005年。细胞代谢网络的表达动力学。分子系统生物学。msb4100023-E1-msb4100023-E6。;Kharchenko,P.,Church,G.M.和Vitkup,D.,2005年。细胞代谢网络的表达动力学。分子系统生物学。msb4100023-E1-msb4100023-E6。
[23] Leisch,F.,《k-质心聚类分析工具箱》,计算。统计数据分析。,51, 526-544 (2006) ·Zbl 1157.62439号
[24] 利伯拉蒂,C。;Howe,J.A。;Bozdogan,H.,《利用信息复杂性进行核判别分析中的数据自适应同时参数和核选择》,J.Pattern Recog。第4号决议,189-198年(2009年)
[25] Neeman,G。;布拉纳鲁,M。;布洛赫,B。;克雷默,I。;埃尔米洛夫,M。;雅维特特区。;Heresco-Levy,U.,血浆甘氨酸、丝氨酸和同型半胱氨酸水平与精神分裂症症状和药物类型的关系,《美国精神病学》。协会,1621738-1740(2005)
[26] 奥蒂,M。;Jv Reeuwijk;Huynen,医学硕士。;Brunner,H.G.,候选疾病基因优先顺序的保守共表达,BMC生物信息学。,9, 147-159 (2008)
[27] 庞,H。;Lin,A。;霍尔福德,M。;Enerson,B.E。;卢,B。;劳顿,M.P。;弗洛伊德·E。;Zhao,H.,使用随机森林分类和回归的路径分析,生物信息学,222028-2036(2006)
[28] Ravasz,E。;Somera,A.L。;Mongru,D.A。;Oltvai,Z.N。;Barabási,A.-L.,代谢网络中模块性的层次组织,《科学》,2971551-1555(2002)
[29] Sen,L.,2010年。用于基因、SIRNA、SHRNA载体和其他生物医学诊断和治疗药物及分子的体内细胞内转染的设备和方法,用于治疗大型动物和人类的关节炎和其他骨科疾病。美国专利申请20100004584。;Sen,L.,2010年。用于基因、SIRNA、SHRNA载体和其他生物医学诊断和治疗药物及分子的体内细胞内转染的设备和方法,用于治疗大型动物和人类的关节炎和其他骨科疾病。美国专利申请20100004584。
[30] 泰勒,J。;Tibshirani,R。;Efron,B.,基因表达数据分析的“未命中率”,生物统计学,6,111-117(2005)·Zbl 1069.62104号
[31] Tusher,V.G。;Tibshirani,R。;Chu,G.,应用于电离辐射反应的微阵列显著性分析,PNAS,98,5116-5121(2001)·2014年12月10日
[32] Wang,H。;王,Q。;李,X。;沈,B。;丁,M。;Shen,Z.,走向真核生物物种中基因共表达的模式树,生物信息学,241367-1373(2008)
[33] Welch,W.J.,置换测试的构造,美国统计协会,85,693-698(1990)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。