×

物理和化学驱动的人工神经网络,用于预测肽和蛋白质的生物活性及其设计。 (英语) Zbl 1400.92188号

摘要:预测肽和蛋白质的生物活性是药物开发和蛋白质工程中的一个重要挑战。在本研究中,我们引入了一种新的方法,即所谓的“物理和化学驱动的人工神经网络(Phys-Chem ANN)”,来处理这一问题。与受生物神经系统启发而设计的现有ANN方法不同,物理化学ANN方法基于物理和化学原理以及蛋白质的结构特征。在Phys Chem ANN模型中,“隐藏层”不再是虚拟的“神经元”,而是蛋白质和肽的真实结构单元。这是一种混合方法,它将定量结构-活性关系(QSAR)的线性自由能概念与先进的ANN数学技术相结合。物理化学ANN方法采用了迭代和反馈过程,融合了机器学习和人工智能能力。除了比传统QSAR方法更准确地预测蛋白质和肽的生物活性外,物理化学ANN方法还可以比ANN方法更深入地了解生物活性与所涉及结构之间的关系。作为物理化学人工神经网络方法应用的一个例子,提出了一个人类溶菌酶构象稳定性的预测模型。

MSC公司:

92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴尔迪,P。;Brunak,S.,《生物信息学:机器学习方法》(1998),麻省理工学院剑桥出版社·Zbl 0992.92024号
[2] 巴尔迪,P。;Brunak,S.,《生物信息学:机器学习方法》(2001),麻省理工学院剑桥出版社,马萨诸塞州,(自适应计算和机器学习)·Zbl 0992.92024号
[3] 巴瓦,K.A。;格罗米哈,M.M。;Uedaira,H。;Kitajima,K。;Sarai,A.,Protherm,版本4.0:蛋白质和突变体的热力学数据库,核酸研究,32,120-121,(2004),⟨http://gibk26.bse.kyutech.ac.jp/jouhou/protherm/protherm.html
[4] Bokma,F.,人工神经网络可以从分子系统发育中学习估计灭绝率,J.理论。生物学,243449-454,(2006)·Zbl 1447.92506号
[5] Bolon,D.N。;马库斯,J.S。;罗斯,S.A。;Mayo,S.L.,计算蛋白质设计中核心极性残基的谨慎建模,J.mol.biol。,329, 611-622, (2003)
[6] 蔡,Y.D。;Lin,S.L。;Chou,K.C.,预测蛋白质信号序列及其裂解位点的支持向量机,肽,24159-161,(2003)
[7] Chen,K。;Kurgan,L.A.,PFRES:使用进化信息和预测的二级结构进行蛋白质折叠分类,生物信息学,23,2843-2850,(2007)
[8] Chen,K。;洛杉矶库尔干。;Ruan,J.,使用并置氨基酸对从序列预测蛋白质中的柔性/刚性区域,BMC结构。生物学,7,25,(2007)
[9] Chen,K。;洛杉矶库尔干。;阮,J.,使用基于进化搭配的新序列表示预测蛋白质结构类,J.comput。化学。,29, 1596-1604, (2008)
[10] Chen,K。;库尔根,M。;Kurgan,L.,使用置信值的两阶段支持向量回归对相对溶剂可及性进行基于序列的预测,J.biomed。科学。英语,1,1-9,(2008)
[11] Chou,K.C.,使用缩放窗口预测信号肽,肽,221973-1979,(2001)
[12] 周,K.C.,2001b。使用伪氨基酸成分预测蛋白质细胞属性。蛋白质:结构、功能和遗传学(勘误表:同上,2001年,第44卷,60)43,246-255。;周,K.C.,2001b。使用伪氨基酸成分预测蛋白质细胞属性。蛋白质:结构、功能和遗传学(勘误表:同上,2001年,第44卷,60页)43,246-255。
[13] Chou,K.C.,综述:结构生物信息学及其对生物医学科学的影响,当代。医学、化学、。,11, 2105-2134, (2004)
[14] Chou,K.C.,使用两亲性伪氨基酸组成预测酶亚科类别,生物信息学,21,10-19,(2005)
[15] 周,K.C。;Shen,H.B.,Signal CF:一种用于预测信号肽的亚位点偶联和窗口融合方法,Biochem biophys res comm,357633-640,(2007)
[16] 周,K.C。;Shen,H.B.,《综述:蛋白质亚细胞定位预测的最新进展》,Ana。生物化学。,370, 1-16, (2007)
[17] 周,K.C。;Zhang,C.T.,蛋白质结构类预测,生物化学评论。微生物。,30, 275-349, (1995)
[18] 周,K.C。;Shen,H.B.,Cell-ploc:一个用于预测各种生物体中蛋白质亚细胞定位的网络服务器包,《自然》协议,3153-162,(2008)
[19] 克雷默,R.D。;帕特森,D.E。;Bunce,J.D.,比较分子场分析(comfa)。1.形状对类固醇与载体蛋白结合的影响,化学杂志。社会,110,5959-5967,(1988)
[20] Diederichs,K。;弗雷冈,J。;乌姆豪,S。;Zeth,K。;Breed,J.,外膜神经网络预测{β}-链蛋白质拓扑,蛋白质科学。,7, 2413-2420, (1998)
[21] 丁,Y.S。;张,T.L。;Chou,K.C.,用伪氨基酸组成和模糊支持向量机网络预测蛋白质结构类,蛋白质pept。列特。,14, 811-815, (2007)
[22] Dombi,G.W。;劳伦斯,J.,用神经网络分析蛋白质跨膜螺旋区,蛋白质科学。,3, 557-566, (1994)
[23] 杜,Q.S。;刘,P.J。;Mezey,P.,《启发式分子亲脂性势的理论推导:分子溶剂化的量子化学描述》,J.chem。inf.模型,45,347-353,(2005)
[24] 杜,Q.S。;梅西,P。;Chou,K.C.,启发式分子亲脂性电位(HMLP):吡唑及其衍生物分子家族LADH的2D-QSAR研究,J.comp。化学。,26, 461-470, (2005)
[25] 杜,Q.S。;李,D.P。;何文忠。;Chou,K.C.,启发式分子亲脂性势(HMLP):氨基酸侧链的亲脂性和亲水性,J.comput。化学。,27, 685-692, (2006)
[26] 杜,Q.S。;黄,R.B。;魏玉涛。;Wang,C.H。;Chou,K.C.,基于氨基酸残基的物理和化学性质的肽试剂设计,J.comput。化学。,28, 2043-2050, (2007)
[27] 杜,Q.S。;魏玉涛。;庞,Z.W。;周,K.C。;Huang,R.B.,预测表位肽与I类MHC分子HLA-A*0201的亲和力:基于氨基酸的肽预测的应用,蛋白质工程。选择。(PEDS),20417-423,(2007)
[28] 费朗,E.A。;Pflugfelaer,B。;Ferrara,P.,人类蛋白质序列的自组织神经图,蛋白质科学。,3, 507-521, (1994)
[29] 格罗米哈,M.M。;Oobatake,M。;科诺,H。;Uedaira,H。;Sarai,A.,氨基酸特性和蛋白质稳定性之间的关系:埋藏突变,蛋白质化学杂志。,18, 565-578, (1999)
[30] 格罗米哈,M.M。;Oobatake,M。;科诺,H。;Uedaira,H。;Sarai,A.,周围残基对部分埋藏突变蛋白质稳定性的重要性,J.biomol。结构。动态。,18, 1-16, (2000)
[31] Haeri,M。;Asemani,D。;Gharibzadeh,Sh.,《使用人工神经网络进行疼痛建模》,J.theor。生物学,220277-284,(2003)·Zbl 1464.92013年
[32] Hansch,C。;缪尔,R.M。;Fujita,T。;马洛尼,P.P。;盖革,F。;Streich,M.,植物生长调节剂和氯霉素衍生物的生物活性与hammett常数和分配系数的相关性,J.am.chem。《社会学杂志》,85,2817,(1963)
[33] Haykin,S.,《神经网络》(1999),纽约麦克米伦学院出版公司·Zbl 0934.68076号
[34] 北卡罗来纳州贾法尼亚·达班鲁。;哥伦比亚特区麦克勒农。;张,H。;Ayatollahi,A。;Johari-Majd,V.,用于产生HRV信号的改进塞曼模型及其在ECG信号生成中的应用,J.theor。生物学,244180-189,(2007)·Zbl 1450.92045号
[35] 贾汉德德,S。;Abdolmaleki,P。;Jahandideh,M。;Hayatshahi,S.H.S.,用于评估有助于确定蛋白质结构类别的参数的新型混合方法,理论杂志。生物学,244275-281,(2007)·Zbl 1450.92067号
[36] Kenward,B。;Wachtmeister,C.A.公司。;吉尔兰达,S。;Enquist,M.,《斑点和条纹:视觉信号形式中重复的演变》,J.theor。生物学,230,407-419,(2004)·Zbl 1447.92019年
[37] R.D.金(),79-97
[38] Klebe,G。;亚伯拉罕,美国。;Mietzner,T.,《药物分子比较分析中的分子相似性指数,以关联和预测其生物活性》,J.med.chem。,37, 4130-4146, (1994)
[39] 洛杉矶库尔干。;Cios,K.J。;Chen,K.,SCPRED:利用预测序列准确预测曙光区相似序列的蛋白质结构类别,BMC生物信息学,9,226,(2008)
[40] Leach,A.,《分子建模:原理与应用》,ISBN:978-0582382107,(2001),新泽西州普伦蒂斯·霍尔·恩格尔伍德克利夫斯
[41] 泄漏,B。;Anninos,P.A.,连通性对神经网络模型活动的影响,J.theor。生物学,58,337-363,(1976)
[42] Lin,H.,利用Chou的伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.theor。生物学,252350-356,(2008)·Zbl 1398.92076号
[43] 罗曼,R。;施耐德,G。;Behrens,D。;Wrede,P.A.,预测跨膜氨基酸序列的神经网络模型,蛋白质科学。,3, 1597-1601, (1994)
[44] Looger,L.L.公司。;Dwyer,文学硕士。;J.J.史密斯。;Helling,H.W.,具有新功能的受体和传感器蛋白质的计算设计,《自然》,423185-190,(2003)
[45] MacKerell,A.D.,《生物大分子的经验力场:概述和问题》,J.comput。化学。,25, 1584-1604, (2004)
[46] 毛,B。;马吉奥拉,G.M。;Chou,K.C.,环状多肽的质量加权分子动力学模拟,生物聚合物,311077-1086,(1991)
[47] 麦卡蒙·J。;杰林,J。;Karplus,M.,《折叠蛋白质动力学》,《自然》,267,585-590,(1977)
[48] Ripley,B.D.,模式识别和神经网络。剑桥大学出版社。;Ripley,B.D.,模式识别和神经网络。剑桥大学出版社,剑桥·Zbl 0913.68167号
[49] 蒙达尔,S。;巴夫纳,R。;R.M.巴布。;Ramakumar,S.,用于芋螺毒素超家族分类的伪氨基酸组成和多类支持向量机方法,J.theor。生物学,243,252-260,(2006)·Zbl 1447.92309号
[50] 尼尔森,M。;Lunegaard,C。;磨损,P。;劳埃米勒有限公司。;兰伯特,K。;Buus,S。;布鲁纳克,S。;Lund,O.,使用具有新序列表示的神经网络可靠预测T细胞表位,蛋白质科学。,12, 1007-1017, (2003)
[51] Tetko,I.V.,《网上计算化学》,药物发现。今天,1497-1500年10月10日,(2005年)
[52] I.V.Tetko。;Gasteiger,J。;托德斯基尼,R。;Mauri,A。;利文斯顿,D。;Ertl,P。;巴柳林,V.A。;拉德琴科,E.V。;新南威尔士州泽菲罗夫。;马卡伦科,A.S。;V.Y.Tanchuk。;Prokopenko,V.V.,虚拟计算化学实验室设计与描述,J.comput。援助。模具设计。,19, 453-463, (2005)
[53] Tripos,SYBYL版本6.8 2000。密苏里州圣路易斯Tripos Associates。;Tripos,SYBYL版本6.8 2000。密苏里州圣路易斯市Tripos Associates。
[54] 王胜强。;杨,J。;Chou,K.C.,利用叠加泛化法预测基于伪氨基酸组成的膜蛋白类型,J.theor。生物学,242941-946,(2006)·Zbl 1447.92315号
[55] Wildman,S.A.公司。;Crippen,G.M.,《通过原子贡献预测物理化学参数》,化学杂志。inf.计算。科学。,39, 868-873, (1999)
[56] 吴,C。;惠特森,G。;Mclarty,J。;Ermongkonchai,A。;Chang,T.C.,蛋白质分类人工神经系统,蛋白质科学。,1, 667-677, (1992)
[57] Xiao,X。;Chou,K.C.,基于疏水指数的氨基酸数字编码,蛋白质肽。列特。,14, 871-875, (2007)
[58] 张国勇。;Fang,B.S.,基于氨基酸组成分布和Chou的两亲性伪氨基酸组成预测氧化还原酶的辅因子,J.theor。生物学,253,310-315,(2008)
[59] 张,T.L。;丁,Y.S。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:近似熵和疏水性模式,J.theor。生物学,250,186-193,(2008)·Zbl 1397.92551号
[60] 周,Z.H。;姜瑜。;Yang,Y.B。;Chen,S.F.,基于人工神经网络集成的肺癌细胞识别,Artif。英特尔。医学,24,25-36,(2002)
[61] 周,X.B。;陈,C。;李,Z.C。;邹晓勇,利用周氏两亲性伪氨基酸组成和支持向量机预测酶亚科类别,J.theor。生物学,248546-551,(2007)·Zbl 1451.92245号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。