阿里,法尔曼;哈亚特,马苏德 细胞外特征识别的混合空间学习方法。(英语) Zbl 1343.92007号 J、 理论。生物。 40330-37(2016年). 摘要:细胞外基质(ECM)蛋白是一类重要的蛋白质,由细胞外基质分泌。ECM蛋白具有粘附、分化、细胞迁移和增殖等多种重要功能。此外,还调控胚胎生长和肿瘤生长发育过程中的基因表达。由于ECM蛋白具有巨大的生物学意义和数据库中蛋白质序列的迅速增加,需要引入一种新的高通量计算模型来准确识别ECM蛋白。各种传统的模式已经被开发出来,但它们既费力又乏味。本文提出了一种高效、高通量的ECM蛋白质分类模型。在这个模型中,蛋白质序列是使用氨基酸组成、伪氨基酸组成(PseAAC)和双肽组成(DPC)技术构建的。此外,融合多种特征提取技术,形成混合特征空间。使用了几个分类器。在这些分类器中,K近邻结合PseAAC和DPC的混合特征空间取得了显著的效果。该模型的计算精度为96.76%,是目前文献报道的最高成功率。 理学硕士: B1925号公路 一般生物统计学 第62页 统计学在生物学和医学科学中的应用;元分析 92C40型 生物化学、分子生物学 关键词:细胞外基质;二肽组成;K-最近邻;pseAAC公司 软件:AdaBoost.MH版;自行车;EcmPred公司;ESLpred公司;GPCR-2L型;iDNA防护;因努克PseKNC;iPPI Esml公司;iPro54 PseKNC公司;伊尔斯波特盖恩斯克;iRSpot TNCPseAAC公司;iSS Hyb mRMR;PECM公司;道具;PseAAC公司;PseAAC建筑商;EAPSAC通用;Pse合一 PDF格式 BibTeX公司 XML 引用 \texttit{F.Ali}和\textti{M.Hayat},J.thero。生物。40330--37(2016年;Zbl 1343.92007) 全文: 内政部 参考文献: [1] Ahmad,K.;Waris,M.;Hayat,M.,《通过将二肽成分纳入周氏一般伪氨基酸组成中来预测蛋白质亚软骨位置》,J Membr。生物(2016) [2] Akbar,S.;Hayat,M.;Ahmad,A.,《使用离散小波变换和支持向量机识别指纹》,IJCSI Int.J.Comput。《科学》,11189-199,(2014年) [3] Akkus,A.;Guvenir,H.A.,《特征投影的最近邻分类》,Proc。ICML,96,12-19,(1995年) [4] 结合氨基酸组成,用Haytoho和氨基酸组成进行分类。生物学,384,78-83,(2015年)·Zbl 1343.92006 [5] Anitha,J.;Rejimoan,R.;Sivakumar,K.C.;Sathish,M.,《使用SVMHM分类器预测细胞外基质蛋白质》,IJCA规范期刊Adv。计算机。公社。技术。HPC应用,1,7-11,(2012年) [6] Bhasin,M.;Raghava,G.,Eslpred:基于支持向量机的真核蛋白质亚细胞定位方法,使用二肽成分和PSI-BLAST,核酸研究,32,W414-W419,(2004) [7] 1996年,布尔茨,布尔茨,布尔茨,布尔茨。使用真实三维模型的基于视图的物体识别算法的比较。人工神经网络ICANN 96,Springer,第251-256页。 [8] 布雷曼,L.,随机森林,马赫。学习,45,5-32,(2001)·Zbl 1007.68152号 [9] Cai,Y.D.,一种通过结合基因本体论、生物化学来预测蛋白质亚细胞定位的新杂交方法。生物物理。公社,311743-747,(2003年) [10] Cai,Y.D.;Zhou,G.P.;Chou,K.C.,使用功能域组成预测膜蛋白类型的支持向量机,生物物理学。J、 ,843257-3263,(2003年) [11] Cao,D.-S.;Xu,Q.-S.;Liang,Y.-Z.,Propy:一个生成周氏pseaac各种模式的工具,生物信息学,29960-962,(2013) [12] Chan,J.F.;Lau,S.K.;To,K.K.;Cheng,V.C.;Woo,P.C.;Yuen,K.-Y.,中东呼吸综合征冠状病毒:另一种引起SARS样疾病的人畜共患病betacornavirus,Clin。微生物学。第28-52522015年版 [13] Chen,C.;Chen,L.;Zou,X.;Cai,P.,《利用周氏伪氨基酸组成和支持向量机预测蛋白质二级结构含量》,蛋白质Pept。Lett.,16,27-31,(2009年) [14] 陈永乐,应用改良杂交方法及伪氨基酸组成预测细胞凋亡蛋白质亚细胞位置,理论杂志。生物学,248,2377-381,(2007年) [15] 周国庆,用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。生物信息,43246-255,(2001) [16] 周国庆,蛋白质属性预测与伪氨基酸组成之探讨,理论。《生物学》,273236-247,(2011年)·Zbl 1405.92212 [17] 周国庆;张春堂,蛋白质结构类预测,标准。版次。生物化学。《分子生物学》,30275-349,(1995年) [18] 周国庆;蔡英德,结合两亲效应预测膜蛋白类型,化学杂志。信息模型,45407-413,(2005年) [19] Dehzangi,A.,Khosravi,B.G.,引入新的基于物理化学的特征来提高蛋白质折叠预测的准确性,收录于:2010年国际计算机设计与应用会议论文集(ICCDA),第1卷,IEEE 2010,第1-592-V1-596页。 [20] 德藏,A.,萨塔尔,A.,2013年。蛋白质折叠识别使用基于分割的特征提取模型,智能信息和数据库系统,Springer,第345-354页。 [21] Di Lullo,G.A.;Sweeney,S.M.;Korkko,J.;Ala Kokko,L.;Antonio,J.D.S.,《人类最丰富蛋白质的配体结合位点和疾病相关突变的定位》,J.Biol。《化学》,2774223-4231,(2002年) [22] Du,P.;Gu,S.;Jiao,Y.,Pseaac general:为大规模蛋白质数据集快速构建周氏伪氨基酸组成的各种通用形式模式,《国际分子科学杂志》,15,3495-3506,(2014) [23] Du,P.;Wang,X.;Xu,C.;Gao,Y.,Pseaac builder:一个跨平台的独立程序,用于生成各种特殊的周氏伪氨基酸组成,Anal。生物化学,425117-119,(2012年) [24] Duda,R.O.;Hart,P.E.;Stork,D.G.,模式分类(2012年),John Wiley&Sons California [25] 弗伦德,Y.;夏皮尔,R.E.,《在线学习的决策理论概括及其在提升中的应用》,J.计算机。系统。科学,55,119-139,(1997)·Zbl 0880.68103 [26] 利用奇异小波变换进行指纹分类。科学。第9期,第99-104期,(2012年) [27] Guo,S.-H.;Deng,E.-Z.;Xu,L.-Q.;Ding,H.;Lin,H.;Chen,W.;Chou,K.-C.,Inuc-pseknc:一种基于序列的预测因子,用于用伪K-元组核苷酸组成预测基因组中的核小体定位,生物信息学,(2014),btu083 [28] Gupta,S.;Ansari,H.R.;Gautam,A.;Raghava,G.《识别抗原中用于诱导特定类别抗体的B细胞表位的识别》,Biol。直接,8,27,(2013年) [29] Gurvan,M.;Tonon,T.;Scornet,D.;Mark,J.;Kloareg,B.《硅质外果皮褐藻细胞壁多糖代谢》。真核生物胞外基质多糖进化的见解,新植物志,18882-97,(2010) [30] Guyon,I.;Weston,J.;Barnhill,S.;Vapnik,V.《使用支持向量机进行癌症分类的基因选择》,Mach。学习,46389-422,(2002)·Zbl 0998.68111 [31] Hayat,M.;Khan,A.,通过将复合蛋白质序列特征融合到伪氨基酸组成中来预测膜蛋白类型,J.Theor。生物学,271,10-17,(2011年)·Zbl 1405.92217 [32] Hayat,M.;Khan,A.,使用基于二肽和伪氨基酸组成的复合特征预测膜蛋白类型,IET Common.,63257-3264,(2012) [33] Hayat,M.;Khan,A.;Yeasin,M.,《使用分裂氨基酸和系综分类预测膜蛋白》,氨基酸,422447-2460,(2012) [34] Hensch,T.K.,视觉皮层发育的关键时期机制,Curr。顶部。《生物进化》,69215-237,(2005年) [35] Horton,P.;Nakai,K.,用it K最近邻分类器更好地预测蛋白质细胞定位位点,ISMB,5147-152,(1997) [36] Huang,T.;Niu,S.;Xu,Z.;Huang,Y.,基于杂交特性预测多位点p53突变体的转录活性,PLoS One,6,e22940,(2011) [37] Iqbal,M.;Hayat,M.,“iss-hyb-mrmr”:利用三核苷酸组成和四核苷酸组成的杂交空间识别剪接位点,计算机杂志。方法Prog。生物医学,128,1-11,(2016年) [38] Jennings,N.R.;Sycara,K.;Wooldridge,M.,《代理研发路线图》,Auton。多智能体系统,1,7-38,(1998) [39] Jia,J.;Liu,Z.;Xiao,X.;Liu,B.;Chou,K.-C.,Ippi-esml:一种集成分类器,用于通过将蛋白质的物理化学性质和小波变换合并到pseaac,J.Theor中来识别蛋白质之间的相互作用。生物,377,47-56,(2015年) [40] Jung,J.;Ryu,T.;Hwang,Y.;Lee,E.;Lee,D.《基于独特序列和结构域特征的细胞外基质蛋白质预测》,J.Comput。生物学,17,97-105,(2010年) [41] Kabir,M.;Hayat,M.,Irspot gaensc:通过集成分类器识别重组点,并扩展周氏pseaac的概念,以形成DNA样本,分子遗传学。热那姆(2015) [42] Kalita,M.K.;Nandal,U.K.;Pattnaik,A.;Sivalingam,A.;Ramasamy,G.;Kumar,M.;Raghava,G.P.;Gupta,D.,Cyclinpred:一种基于支持向量机的细胞周期蛋白序列预测方法,PLoS One,3,(2008),e2605_1-e2605_12 [43] Kandaswamy,K.K.;Pugalenthi,G.;Kalies,K.U.;Hartmann,E.;Martinetz,T.,Ecmpred:基于最大相关最小冗余特征选择的随机森林预测细胞外基质蛋白质,J.Theor。生物学,317377-383,(2013年) [44] Karsenty,G.;Park,R.W.,《I型胶原基因表达调控》,国际版。免疫学,12177-185,(1995) [45] Kern,B.;Shen,J.;Starbuck,M.;Karsenty,G.,Cbfa1有助于I型胶原基因的成骨细胞特异性表达,J.Biol。《化学》,2767101-7107,(2001) [46] Kibriya,A.M.,Frank,E.,Pfahringer,B.,和Holmes,G.,2005年。多项式朴素贝叶斯文本分类再论,人工智能2004:人工智能的进展,斯普林格,第488-499页。 [47] 医学诊断的机器学习:历史,艺术和观点,人工制品。因特尔。医学,23,89-109,(2001年) [48] Leslie,C.S.;Eskin,E.;Cohen,A.;Weston,J.;Noble,W.S.《区分蛋白质分类的错配字符串核》,生物信息学,20467-476,(2004) [49] Li,D.Y.;Brooke,B.;Davis,E.C.;Mecham,R.P.;Sorensen,L.K.;Boak,B.B.;Eichwald,E.;Keating,M.T.,《弹性蛋白是动脉形态发生的基本决定因素》,《自然》,393,276-280,(1998) [50] Liao,Y.;Vemuri,V.R.,使用k-最近邻分类器进行入侵检测,计算机。《安全》,第21439-448页,(2002年) [51] Lin,H.;Ding,H.;Guo,F.B.;Zhang,A.Y.;Huang,J.,《利用周氏伪氨基酸组成蛋白质Pept预测分枝杆菌蛋白质的亚细胞定位》。Lett.,15739-744,(2008年) [52] Lin,H.;Deng,E.-Z.;Ding,H.;Chen,W.;Chou,K.-C.,Ipro54-pseknc:一种基于序列的预测因子,用于识别原核生物中具有伪K-元组核苷酸组成的sigma-54启动子,《核酸研究》,4212961-12972,(2014) [53] Liu,B.;Liu,F.;Wang,X.;Chen,J.;Fang,L.;Chou,K.-C.,Pse-in-one:用于生成DNA、RNA和蛋白质序列的各种模式伪组件的web服务器,《核酸研究》,gkv458 [54] Liu,B.,Xu,J.,Lan,X.,Xu,R.,Zhou,J.,Wang,X和Chou,K.-C.,2014年。iDNA-Prot | dis:通过将氨基酸距离对和简化的字母组合纳入一般的伪氨基酸组成来识别DNA结合蛋白。 [55] Mandle,A.K.;Jain,P.;Shrivastava,S.K.,《使用支持向量机进行蛋白质结构预测》,Int.J.Soft Comput.,367-78,(2012年) [56] Mei,S.,用周氏pseaac公式预测植物蛋白质亚细胞多定位的多标记同源知识转移学习,J.Theor。生物学,31080-87,(2012年)·Zbl 1337.92065 [57] Meir,R.,Rätsch,G.,2003年。关于提升和杠杆作用的介绍。机器学习高级讲座,斯普林格,118-183页。·Zbl 1019.68092 [58] Mohabatkar,H.;M.,B.;A.,E.,使用周氏伪氨基酸组成和支持向量机的概念预测GABA(A)受体蛋白质,J.Theor。生物学,281,18-23,(2011年)·Zbl 1397.92215 [59] Mondal,S.;Bhavna,R.;Babu,R.;Ramakumar,S.《芋螺毒素超家族分类的伪氨基酸组成和多类支持向量机方法》,J.Theor。生物学,243252-260,(2006年) [60] Muthukrishnan,S.;Puri,M.;Lefevre,C.,《基于支持向量机(SVM)的多类预测及纤溶酶原激活剂基本统计分析》,BMC Res.Notes,7,63,(2014) [61] Nanni,L.;Lumini,A.,《为亚软骨定位创造周氏伪氨基酸特征的遗传规划》,氨基酸,34653-660,(2008) [62] Nanni,L.;Lumini,A.;Gupta,D.;Garg,A.,《通过融合一组基于chou伪氨基酸组成变体和进化信息的分类器识别细菌毒性蛋白质》,IEEE/ACM Trans。计算机。生物。生物信息,9467-475,(2012年) [63] Peach,R.J.;Hollenbaugh,D.;Stamenkovic,I.;Aruffo,A.《CD44细胞胞外结构域中透明质酸结合位点的鉴定》,J.Cell。《生物学》,122257-264,(1993年) [64] 基因调控;通过基因表达诱导的细胞表型 〔65〕 Qu,W.;Sui,H.;Yang,B.;Qian,W.,《使用多模式BP方法改进蛋白质二级结构预测》,Comput。生物。医学,41946-959,(2011年) [66] Rish,I.,2001年。朴素贝叶斯分类器的实证研究。IJCAI 2001人工智能经验方法研讨会,第3卷。IBM,纽约,第41-46页 [67] Rosenbloom,J.;Abrams,W.R.;Mecham,R.,《细胞外基质4:弹性纤维》,FASEB J.,71208-1218,(1993) [68] Sarangi,A.N.;Lohani,M.;Aggarwal,R.,《通过将各种物理化学特征结合到周氏伪氨基酸组成的一般形式中来预测原核生物中的必需蛋白质,即蛋白质Pept。Lett.,20781-795,(2013年) [69] 施密特,D.C.,克兰纳,C.D.,1996年。半同步/半异步-一种高效且结构良好的并发I/O架构模式 [70] Schölkopf,B.,Burges,C.,Vapnik,V.,1996年。在支持向量学习机中加入不变性。人工神经网络ICANN 96,斯普林格,第47-52页 [71] Schölkopf,B.;Sung,K.-K.;Burges,C.J.;Girosi,F.;Niyogi,P.;Poggio,T.;Vapnik,V.《将高斯核支持向量机与径向基函数分类器进行比较》,IEEE Trans。信号处理,452758-2765,(1997) [72] Shen,H.-B.;Chou,K.-C.,Pseaac:一个用于生成各种蛋白质伪氨基酸组成的灵活web服务器,Anal。生物化学,373386-388,(2008年) [73] Shen,H.;Chou,K.-C.,使用优化的证据理论K-最近邻分类器和伪氨基酸组成预测膜蛋白类型,生物化学。生物物理。公社,334,288-292,(2005年) [74] Shin,P.,Jasso,H.,Tilak,S.,Cotofana,N.,Fountain,T.,Yan,L.,Fraser,M.,Elgamal,A.,使用应变计传感器的自动车型分类。2007年第五届IEEE普及计算和通信研讨会年会论文集。2007年PerCom工作室。IEEE 2007,第425-428页。 [75] Soni,J.;Ansari,U.;Sharma,D.;Soni,S.,《医疗诊断预测数据挖掘:心脏病预测概述》,国际计算机杂志。申请书,17,43-48,(2011年) [76] Sun,X.Y.;Shi,S.P.;Qu,J.D.;Suo,S.B.;Huang,S.Y.;Liang,R.P.,《通过离散小波变换将物理化学性质纳入周氏pseaac的一般形式来识别蛋白质四级结构属性》,Mol.Biosyst.,83178-3184,(2012) [77] Thusberg,J.;Olatubosun,A.;Vihinen,M.《错义变体突变致病性预测方法的表现》,Hum。突变,32358-368,(2011年) [78] Van Dyk,H.;Barnard,E.,《多项式特征的朴素贝叶斯分类器:理论分析:模式识别特别版》,南部Afr。计算机。J、 ,40,37-43,(2008年) [79] Vapnik,V.,《统计学习理论的本质》,IEEE,(1995)·Zbl 0833.62008 [80] 应用结构域和功能结构域预测蛋白质。Crystologr.,42169-173,(2009年) [81] Xiao-B9,和BaiO-by-2011,两种氨基酸结合的蛋白质组分预测 [82] Yang,R.;Zhang,C.;Gao,R.;Zhang,L.,《利用杂交特征识别细胞外基质蛋白质的集成方法》,PLoS One,10,1-21,(2015) [83] Yuan,Z.,使用氨基酸序列的支持向量回归分析更好地预测蛋白质接触数,BMC Bioinform.,6248,(2005) [84] Zahoor,J.;Abrar,M.;Hussain,D.,《使用数据挖掘KNN技术进行季节到跨年度气候预测》,20,40-51,(2008),Springer-Verlag柏林海德堡 [85] Zhang,G.Y.;Fang,B.S.,使用chou的伪氨基酸组成概念预测蛋白质亚细胞定位:一种结合进化信息和von Neumann熵的方法,氨基酸,34565-572,(2008) [86] Zhang,J.;Sun,P.;Zhao,X.;Ma,Z.,PECM:利用周氏伪氨基酸组成概念预测细胞外基质蛋白质,J.Theor。生物,363412-418,(2014年) [87] 周国平;蔡英德,通过基因本体和伪氨基酸组成的杂交预测蛋白酶类型,蛋白质,63681-684,(2006) 此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。尽可能准确地反映出原文中所列参考文献的精确性。