×

基于人群的增量学习预测智人蛋白质二级结构。 (英语) Zbl 1416.92128号

摘要:蛋白质结构预测是基于氨基酸序列对蛋白质三维结构的预测。它是医学、生物学和生物化学等学科的关键组成部分。对智人蛋白质二级结构的预测是其中一个更重要的领域。许多方法被用于结合滑动窗口的前馈神经网络或SVM。该方法的机制过于复杂,无法从中提取清晰直观的物理意义。本文探讨了基于种群的增量学习(PBIL),这是一种将世代遗传算法的机制与简单竞争学习相结合的方法。结果表明,它的准确性与人类物种特别相关。这个新视角揭示了性能改进的许多不同可能性。

MSC公司:

92D20型 蛋白质序列,DNA序列
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Hu,Z.、Scott,H.S.、Qin,G.、Zheng,G.,Chu,X.、Xie,L.、Adelson,D.L.、Oftedal,B.E.、Venugopal,P.和Babic,M.,基于从头算预测、RNA-SEQ和蛋白质组学揭示缺失的人类蛋白质亚型,科学。代表5(2015)10940。
[2] Somody,J.C.、Mackinnon,S.S.和Windemuth,A.,蛋白质组在药物应用中的结构覆盖,药物探索。今天(2017年)。
[3] Fasman,G.D.和Chou,P.Y.,蛋白质构象的预测:后果和期望,生物化学13(2)(1974)222-245。
[4] Rost,B.、Sander,C.和Schneider,R.,Phd-蛋白质二级结构预测的自动邮件服务器,计算机。申请。Biosci.10(1)(1994)53-60。
[5] Bettella,F.、Rasinski,D.和Knapp,E.W.,《麻雀蛋白质二级结构预测》,J.Chem。Inf.Mod.52(2)(2012)545-556。
[6] Yaseen,A.和Li,Y.,基于上下文的特征提高了蛋白质二级结构预测的准确性,J.Chem。Inf.Mod.54(3)(2014)992-1002。
[7] B、 R.,G,Y.和J,L.,预测蛋白服务器,核酸研究。31(13) (2003) 3300.
[8] C、 C.,JD,B.和GJ,B.,jpred 3二级结构预测服务器,核酸研究。36(2008)(Web服务器问题),W197。
[9] Buchan,D.W.A.、Minneci,F.、Nugent,T.C.O.、Bryson,K.和Jones,D.T.,PSIPRED蛋白质分析工作台的可扩展web服务,核酸研究41(2013)(web服务器问题),W349。
[10] Mark,B.、Yucel,A.和Zafer,A.,使用隐藏半马尔可夫模型预测单个序列的蛋白质二级结构,BMC生物信息学7(1)(2006)1-15。
[11] Yao,X.Q.,Zhu,H.和She,Z.S.,蛋白质二级结构预测的动态贝叶斯网络方法,BMC生物信息学9(1)(2008)49。
[12] Malekpour,S.、Naghizadeh,S.,Pezeshk,H.、Sadeghi,M.和Eslahchi,C.,蛋白质二级结构预测的分段半马尔可夫模型,数学。《生物科学》221(2)(2009)130-135·Zbl 1175.92015年
[13] Agarwal,S.、Agarwall,P.和Mendiratta,D.,使用支持向量机预测蛋白质的二级结构(John Wiley&Sons,2004)。
[14] Guo,J.,Chen,H.,Sun,Z.和Lin,Y.,使用双层SVM和剖面预测蛋白质二级结构的新方法,《蛋白质》54(4)(2004)738。
[15] Nguyen,M.N.和Rajapakse,J.C.,蛋白质二级结构预测的两阶段多类支持向量机(2005)。
[16] Presnell,S.R.和Cohen,F.E.,《生物化学序列模式识别的人工神经网络》,年。生物物理学评论。生物模型。结构22(1)(1993)283。
[17] Garnier,J.、Gibrat,J.F.和Robson,B.,《从氨基酸序列预测蛋白质二级结构的GOR方法》,《酶学方法》266(266)(1996)540。
[18] Hua,S.和Sun,Z.,用高片段重叠测度预测蛋白质二级结构的新方法:支持向量机方法,J.Mol.Biol.308(2)(2001)397-407。
[19] Kim,H.和Park,H.,基于改进支持向量机方法的蛋白质二级结构预测,Protein Eng.16(8)(2003)553。
[20] Nguyen,M.N.和Rajapakse,J.C.,蛋白质二级结构预测的两阶段支持向量机,太平洋交响乐团。生物计算机.14(2003)218-227。
[21] Bing Yao,J.,Cheng Jian,W.和Zhen Ya,H.,PBIL算法在时间表问题上的应用,系统工程理论与实践(2000)。
[22] S.Baluja,基于人口的增量学习。基于遗传搜索的函数优化和竞争学习的集成方法(1994)。
[23] C.学习,《基于群体的增量学习:基于遗传搜索的集成方法》(1994年)。
[24] S.Baluja,静态函数优化七种迭代和进化启发式的经验比较(扩展摘要)(1995年)。
[25] S.Baluja和R.Caruana,从标准遗传算法中删除遗传学,卡内基梅隆大学,(1995年)。
[26] Yang,S.和Yao,X.,《动态环境下基于群体的联想记忆增量学习》,IEEE Trans。进化。计算12(5)(2008)542-561。
[27] M.Kouza、E.Faraggi、A.Kolinski和A.Kloczkowski,蛋白质二级结构预测的Gor方法及其作为蛋白质聚集预测工具的应用(2017年)。
[28] Ruan,J.,Chen,K.,Tuszynski,J.A.和Kurgan,L.A.,蛋白质片段三级结构保守性的定量分析,蛋白质J.25(5)(2006)301-315。
[29] Bodén,M.,Yuan,Z.和Bailey,T.L.,基于NMR求解结构的概率模型预测蛋白质连续体二级结构,BMC生物信息学7(1)(2006)68。
[30] Schlessinger,A.和Rost,B.,《从序列预测蛋白质的弹性和刚性》,《蛋白质结构功能和生物信息学》61(1)(2005)115-126。
[31] Yuan,Z.、Kevin,B.、Song,J.和Thomas,H.,使用psi-蛋白质谱和二级结构信息预测蛋白质中的顺式/反式异构化,BMC生物信息学7(1)(2006)124。
[32] P.Fariselli,跨膜螺旋预测为95
[33] Lin,K.,Simosis,V.A.,Taylor,W.R.和Heringa,J.,使用隐藏神经网络的简单快速二级结构预测方法,生物信息学21(2)(2005)152-159。
[34] Weiler,E.W.和Nover,L.,《Allgemeine Und Molekulare Botanik》(斯图加特Georg Thieme Verlag,2008)。
[35] S.Konikkat,《酿酒酵母60s核糖体亚单位组装期间动态重塑事件导致Its2间隔序列的移除》(2016年)。
[36] De,L.C.J.,Karbstein,K.和Woolford,J.L.Jr,核糖体蛋白质在体内真核核糖体组装中的功能,年度。《生物化学评论》84(84)(2015)93。
[37] Samelson,A.J.、Jensen,M.K.、Soto,R.A.、Cate,J.H.和Marqusee,S.,核糖体新生链稳定性的定量测定,Proc。美国国家科学院。科学。美国113(47)(2016)13402。
[38] Cuff,J.A.和Barton,G.J.,《蛋白质二级结构预测的多序列方法的评估和改进》,蛋白质结构功能和生物信息学USA34(4)(1999)508。
[39] Orengo,C.A.、Michie,A.D.、Jones,S.、Jones、D.T.、Swindells,M.B.和Thornton,J.M.、Cath-蛋白质结构的层次分类,Structure5(8)(1997)1093。
[40] Touw,W.G.,Baakman,C.,Black,J.,Beek,T.A.H.T.,Krieger,E.,Joosten,R.P.和Vriend,G.,一系列满足日常需求的PDB相关数据库,《核酸研究》43(2015)(数据库发行)D364。
[41] Kabsch,W.和Sander,C.,《蛋白质二级结构词典:氢键和几何特征的模式识别》,生物聚合物22(12)(1983)2577-2637。
[42] Kinch,L.N.,Li,W.,Monastirskyy,B.,Kryshtafovych,A.和Grishin,N.V.,casp11接触辅助预测评估,蛋白质结构功能和生物信息学84(2016)164-180。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。