汗,扎希尔·乌拉;马苏德·海亚特;穆阿扎姆·阿里·汗 结合概率神经网络模型,利用周氏伪氨基酸组成区分酸性和碱性酶。 (英语) Zbl 1314.92069号 J.西奥。生物。 365, 197-203 (2015). 摘要:酶催化是生物体进化出的所有复杂过程中最基本、最引人注目的过程之一。酶是生物催化剂,由于其高度的特异性、选择性和催化效率,在工业应用和医学领域发挥着重要作用。酶的催化效率已成为酶工程中最具挑战性的工作,分为酸性酶和碱性酶。通过实验方法区分酸性和碱性酶是困难的,有时由于缺乏确定的结构而不可能。因此,建立一个计算模型来区分酸性和碱性酶和初级序列是非常必要的。在本研究中,我们使用两种离散样本表示方法伪氨基酸组成开发了一个稳健、准确和高通量的计算模型(PseAAC公司)和分裂氨基酸组成。各种分类算法,包括概率神经网络(PNN公司)将最近邻、决策树、多层感知器和支持向量机应用于酸性和碱性的高精度预测。10倍交叉验证测试和几个统计指标,即准确度、(F)测度和下面积世界车王争霸赛用于评估所提模型的性能。使用两个基准数据集对模型的性能进行了检验,以证明模型的有效性。实证结果表明PNN公司与PseAAC公司与文献中的现有方法相比,它是非常有前途的。它在数据集1上达到96.3%的准确率,在数据集2上达到99.2%。结果表明,所提出的模型可能对基础研究和药物相关应用领域有用。 引用于10文件 MSC公司: 92C45型 生化问题中的动力学(药代动力学、酶动力学等) 92C40型 生物化学、分子生物学 关键词:\(K\)-最近邻;酶工程;伪氨基酸组成 软件:细胞PLoc;iSS-PseDNC公司;Hum-位置;iNuc-PhysChem;EzyPred公司;iSNO-PseAAC公司;iTIS-SeTNC公司;PseAAC-建筑商;iCTX类型;国际RSpot-TNCPseAAC;阿卡普雷德;PseAAC概述;iHyd-PseAAC公司;iNuc-PseKNC;财产;PseKNC公司;伦敦银行支持向量机 PDF格式BibTeX公司 XML格式引用 \textit{Z.U.Khan}等人,J.Theor。生物学365197--203(2015;Zbl 1314.92069) 全文: 内政部 参考文献: [1] 曹,D.S。;徐庆生。;Liang,Y.Z.,Propy:生成周氏PseAAC各种模式的工具,生物信息学,29960-962(2013) [2] Chang,C.C.(张建中)。;Lin,C.J.,LIBSVM:支持向量机库,ACM Trans。智力。系统。技术。,2, 21-27 (2011) [3] Chen,W。;雷,T.Y。;Jin,D.C.,PseKNC:用于生成伪(K)元组核苷酸组成的灵活网络服务器,Ana。生物化学。,456, 53-60 (2014) [4] Chen,W。;冯,P.M。;Lin,H.,iSS-PseDNC:使用伪二核苷酸成分识别剪接位点,生物识别。Res.Int.,623149(2014) [5] Chen,W。;Lin,H。;冯,P.M。;Ding,C.,iNuc-PhysChem:一种基于序列的预测因子,用于通过物理化学性质识别核小体,PLoS One,7,e47843(2012) [6] Chen,W。;冯,P.M。;邓,E.Z。;Lin,H.,iTIS-PseTNC:一种基于序列的预测因子,用于使用伪三核苷酸组成识别人类基因中的翻译起始位点,Ana。生物化学。,14, 281-284 (2014) [7] Chou,K.C.,使用伪氨基酸成分预测蛋白质细胞属性,《蛋白质》,43,246-255(2001) [8] Chou,K.C.,2型糖尿病的分子治疗靶点,蛋白质组研究杂志,31284-1288(2004) [9] Chou,K.C.,《综述:结构生物信息学及其对生物医学科学的影响》,Curr。医药化学。,11, 2105-2134 (2004) [10] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚家族类别,生物信息学,21,10-19(2005) [11] Chou,K.C.,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。生物学,273236-247(2011)·Zbl 1405.92212号 [12] Chou,K.C。;Shen,H.B.,Cell-PLoc:一个用于预测各种生物体中蛋白质亚细胞定位的网络服务器包,《国家协议》。,3, 153-162 (2008) [13] Chou,K.C。;Shen,H.B.,通过融合优化的证据理论K最近邻分类器预测真核蛋白亚细胞位置,《蛋白质组研究杂志》,51888-1897(2006) [14] Chou,K.C。;Shen,H.B.,Hum-PLoc:预测人类蛋白质亚细胞定位的新型集成分类器,《生物化学》。生物物理学。Res.Commun.公司。,347, 150-157 (2006) [15] 丁·H。;邓,E.Z。;袁,L.F。;Liu,L.,iCTX-type:一种基于序列的预测因子,用于识别靶向离子通道中芋螺毒素的类型,Biomed。国际研究,286419(2014) [16] 杜,P。;顾S。;Jiao,Y.,PseAAC-general:为大规模蛋白质数据集快速构建Chou伪氨基酸组成的各种通用形式模式,国际分子科学杂志。,15, 3495-3506 (2014) [17] 杜,P。;王,X。;徐,C。;Gao,Y.,PseAAC构建器:一个跨平台独立程序,用于生成各种特殊的周氏伪氨基酸成分,Ana。生物化学。,425, 117-119 (2012) [18] Dubnovitsky,A.P。;Kapetaniou,E.G。;Papageorgiou,A.C.,《碱性pH的酶适应:磷酸丝氨酸转氨酶的原子分辨率(1.08A)结构》芽孢杆菌嗜碱菌,蛋白质科学。,14, 97-110 (2005) [19] 范,G.L。;李启智。;Zuo,Y.C.,通过将平均化学位移和基因本体信息合并到Chou的PseAAC的一般形式中来预测酸性和碱性酶,《过程生物化学》。,48, 1048-1053 (2013) [20] Fan,Y.N。;萧,X。;Min,J.L.,iNR-Drug:预测药物与细胞网络中核受体的相互作用,国际分子科学杂志。,15, 4915-4937 (2014) [21] Geierstanger,B。;Jamin,M。;沃克曼,B.F。;Baldwin,R.L.,组氨酸24和组氨酸119在形成脱蛋白肌红蛋白pH4折叠中间体中的质子化行为,生物化学,374254-4265(1998) [22] Guo,S.H。;邓,E.Z。;徐立清。;丁·H。;Lin,H.,iNuc PseKNC:一种基于序列的预测因子,用于预测具有伪(k)元组核苷酸组成的基因组中核小体的定位,生物信息学,3011522-1529(2014) [23] 海亚特,M。;Khan,A.,基于Chou的PseAAC的一般形式,使用模糊最近邻算法识别外膜蛋白,Protein Pept。莱特。,11, 411-421 (2011) [24] 海亚特,M。;Khan,A.,使用基于二肽和伪氨基酸组成的复合特征预测膜蛋白类型,IET Commun。,6, 3257-3264 (2012) [25] 海亚特,M。;Iqbal,N.,《通过结合伪平均化学位移和支持向量机识别蛋白质结构类》,J.Compute。方法生物识别程序。,116, 184-192 (2014) [26] 海亚特,M。;A.Khan。;Yeasin,M.,《使用分裂氨基酸组成和集合分类预测膜蛋白》,《氨基酸杂志》,42,2447-2460(2012) [27] 海亚特,M。;塔希尔,M。;Khan,S.A.,使用多贝叶斯轮廓和双粒度概率特征空间的混合空间预测蛋白质结构类,J.Theor。生物,346C,8-15(2013)·Zbl 1412.92243号 [28] 黄,T。;Wang,J。;Cai,Y.D。;Yu,H.,基于丙型肝炎病毒网络的肝细胞性肝硬化和肝癌分类,PLoS One,7,e34460(2012) [29] 约旦,硕士。;McGinness,S。;Phillips,C.V.,《嗜酸菌及其潜在的采矿和环境应用》,Min.Eng.,9,169-181(1996) [31] Kelch,B.A。;伊根,K.P。;Erciyas,F.P。;Humphris,E.L。;托马森。,A.R。;Mitsuiki,S.,《耐酸性的结构和机械探索:动力学稳定性促进极端行为的进化》,J.Mol.Biol。,368, 870-883 (2007) [32] 李碧琴。;黄,T。;刘,L。;Cai,Y.D.,在蛋白质相互作用网络中用mRMR和最短路径识别结直肠癌相关基因,PLoS One,7,e33393(2012) [33] Lin,H。;Chen,W。;Ding,H.,AcalPred:一种用于区分酸性和碱性酶的基于序列的工具,PLoS One,8,1075726(2013) [34] Lin,S.X。;Lapointe,J.,《理论与实验生物学一体化》,J.Biomed。科学。工程(JBiSE),6435-442(2013) [35] 刘,B。;张,D。;Xu,R。;徐,J。;王,X。;Chen,Q.,将从频率剖面提取的进化信息与基于序列的内核相结合,用于蛋白质远程同源性检测,生物信息学,30472-479(2014) [36] Nakhil Nair,美国。;卡尔,A.D。;赵华,选择性催化酶工程,现任。组织化学。,14, 1870-1872 (2010) [37] 邱伟荣。;Xiao,X.,iRSpot-TNCPseAAC:用三核苷酸组成和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 1746-1766 (2014) [38] Rosenblatt,Frank,《神经动力学原理》。感知器和大脑机制理论(1961),斯巴达书籍:斯巴达图书华盛顿特区 [39] 萨雷西,I.P。;Saxena,Y。;卡普尔,A。;夏尔马,M。;夏尔马,S.K。;Gupta,V.,《嗜碱细菌:在工业生物技术中的应用》,J.Ind.Microbiol。生物技术。,38, 769-790 (2011) [40] Shen,H.B。;Chou,K.C.,EzyPred:预测酶功能类和亚类的自顶向下方法,生物化学。生物物理学。Res.Commun.公司。,364, 53-59 (2007) [41] Shirai,T。;铃木,A。;Yamane,T。;阿希达,T。;小林,T。;Hitomi,J.,M-蛋白酶的高分辨率晶体结构:高碱性适应机制的系统发育辅助分析,蛋白质工程,10627-634(1997) [42] Takami,H。;Horikoshi,K.,《从工业角度分析嗜碱芽孢杆菌菌株的基因组》,嗜极菌,499-108(2000) [43] Vapnik,《数据挖掘导论》(2005),Addison-Wesley Longman Publishing Co Inc:Addison-Whesley Longman出版公司,马萨诸塞州波士顿,(©2005) [44] Vapnik,V.,《统计学习理论》(1998),Wiley-Interscience:Wiley-Interscience纽约·Zbl 0935.62007号 [45] Wang,J.F。;魏德清。;陈,C。;李毅。;Chou,K.C.,两个CYP2C19 SNP的分子模型,蛋白质Pept。莱特。,15, 1, 27-32 (2008) [46] Xu,Y。;丁,J。;Wu,L.Y。;Chou,K.C.,iSNO-PseAAC:通过结合位置特异性氨基酸倾向来预测蛋白质中的半胱氨酸(S)-亚硝基化位点,PLoS One,8,8,e55844(2013) [47] Xu,Y。;文,X。;邵晓杰。;Deng,N.Y.,iHyd-PseAAC:通过将二肽位置特异性倾向结合到伪氨基酸组成中来预测蛋白质中的羟脯氨酸和羟赖氨酸,Int.J.Mol.Sci。,15, 7594-7610 (2014) [48] 扎胡尔,J。;Abrar,M。;Hussain,D.M.A.,《使用数据挖掘KNN技术进行季节性至年际气候预测》,第20、40-51页(2008年),斯普林格·弗拉格:斯普林格尔·弗拉格-柏林-海德堡,(IMTIC 2008,CCIS 20,2008年)。©) [49] 张,G。;李,H。;Fang,B.,使用具有二级结构氨基酸组成的随机森林模型鉴别酸性和碱性酶,《过程生物化学》。,44, 654-660 (2009) [50] 张,李,Q。;梁凡,G。;Chun Zuo,Y.,通过将平均化学位移和基因本体信息合并到Chou的PseAAC的一般形式中来预测酸性和碱性酶,《过程生物化学》。,48, 1048-1053 (2013) [51] 郑浩。;魏德清。;张,R。;王,C。;魏,H。;Chou,K.C.,新型阿尔茨海默病激动剂的筛选,医学化学。,3, 488-493 (2007) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。