×

利用广义混沌博弈表示识别抗癌肽。 (英文) Zbl 1410.92083号

小结:我们将混沌博弈表示(CGR)推广到高维空间,同时保持其双射性,与以往的尝试相比,这种方法具有足够的代表性和数学严密性。我们首先陈述并证明了CGR和我们的广义混沌博弈表示(GCGR)方法的渐近性质。预测结果表明,具有相同子序列但位置不同的序列的相异性将以指数方式降低相同子序列的长度;研究人员并不知道这种效应的发生。现在,我们重点关注它,它从根本上支持(G)CGR作为一种相似性度量或特征提取技术。我们开发了两种特征提取技术:GCGR-Centroid和GCGR-Variance。我们使用GCGR-Centroid通过数据集9 ND5、24 TF和50β-珠蛋白分析蛋白质序列之间的相似性。与以往的研究相比,我们得到了一致的结果,这证明了其重要性。最后,通过使用支持向量机,我们利用GCGR-Centroid和GCGR-Variance训练了抗癌肽预测模型,并通过使用3个研究良好的抗癌肽数据集实现了显著更高的预测性能。

MSC公司:

92D20型 蛋白质序列,DNA序列
92-08 生物问题的计算方法
91A80型 博弈论的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Almeida JS、Carrico JA、Maretzek A、Noble PA、Fletcher M(2001)《混沌博弈表示的基因组序列分析》。生物信息学17(5):429-437
[2] Basu S,Pan A,Dutta C,Das J(1997)蛋白质的混沌博弈表示。J Mol Gr型号15(5):279-289
[3] Chan HS、Dill KA(1989)《紧凑型聚合物》。大分子22(12):4559-4573
[4] Chang CC,Lin CJ(2011)Libsvm:支持向量机库。ACM Trans-Intell系统技术(TIST)2(3):27
[5] Chang G,Wang T(2011)基于共同子串长度分布的蛋白质序列系统发育分析。蛋白质J 30(3):167-172
[6] Chen K,Kurgan L,Rahbari M(2007)利用氨基酸对搭配预测蛋白质结晶。生物化学与生物物理研究通讯355(3):764-769
[7] Chen K,Kurgan LA,Ruan J(2008a)利用新的基于进化搭配的序列表示预测蛋白质结构类。计算机化学杂志29(10):1596-1604
[8] Chen W,Ding H,Feng P,Lin H,Chou KC(2016)IACP:一种基于序列的抗癌肽鉴定工具。目标7(13):16895
[9] Chen YZ,Tang YR,Sheng ZY,Zhang Z(2008b)利用k间隔氨基酸对的组成预测哺乳动物蛋白质中的粘蛋白型o-糖基化位点。BMC生物信息9(1):101
[10] Chou KC(2001a)使用伪氨基酸成分预测蛋白质细胞属性。蛋白质结构功能生物信息43(3):246-255
[11] Chou KC(2001b)利用亚基偶联预测信号肽。蛋白质工程14(2):75-79
[12] Chou KC,Zhang CT(1995)蛋白质结构类预测。生物化学与分子生物学评论30(4):275-349
[13] Cortes C,Vapnik V(1995)支持向量机。马赫学习20(3):273-297·兹比尔08316.8098
[14] Deschavanne P,Tufféry P(2008)《探索蛋白质分类和结构类预测的无对齐方法》。生物化学90(4):615-625
[15] Deschavanne PJ,Giron A,Vilain J,Fagot G,Fertil B(1999a)《基因组特征:通过序列的混沌博弈表示评估物种的特征和分类》。摩尔生物Evolut 16(10):1391-1399
[16] Deschavanne PJ,Giron A,Vilain J,Fagot G,Fertil B(1999b)《基因组特征:通过序列的混沌博弈表示评估物种的特征和分类》。分子生物学进化16(10):1391-1399
[17] Dill KA(1985)球状蛋白的折叠和稳定性理论。生物化学24(6):1501-1509
[18] Dimitriadou E、Hornik K、Leisch F、Meyer D、Weingessel A(2005)统计部其他职能(e1071),图温。R程序包版本第1-5页
[19] Fang G,Bhardwaj N,Robilotto R,Gerstein MB(2010)《基因形态和功能分析入门》。公共科学图书馆计算生物学6(3):e1000-703
[20] Fiser A,Tusnady GE,Simon I(1994)蛋白质结构的混沌博弈表示。J摩尔图12(4):302-304
[21] Fitch WM(1970)区分同源蛋白质和类似蛋白质。系统Zool 19(2):99-113
[22] Ford MJ(2001)转铁蛋白的分子进化:沙门氏菌阳性选择的证据。分子生物学进化18(4):639-647
[23] Hajisharifi Z、Piryaiee M、Beigi MM、Behbahani M、Mohabatkar H(2014)预测含有chous伪氨基酸成分的抗癌肽,并通过ames试验研究其诱变性。《Theor生物学杂志》341:34-40·Zbl 1411.92232号
[24] He P,Li X,Yang J,Wang J(2011)一种新的蛋白质相似性分析描述符。匹配:数学和计算机中的通信。化学65(2):445-458
[25] 何PA,张永平,姚YH,汤YF,楠XY(2010)基于物理化学性质的蛋白质序列的图形表示及其应用。计算机化学杂志31(11):2136-2142
[26] He Pa,Li D,Zhang Y,Wang X,Yao Y(2012)基于灰度码的蛋白质序列的三维图形表示。《Theor生物学杂志》304:81-87·Zbl 1397.92528号
[27] Hoang T,Yin C,Yau SST(2016)DNA序列的混沌博弈表示数值编码及其在相似性比较中的应用。基因组学108(3-4):134-142
[28] Jeffrey HJ(1990)基因结构的混沌博弈表示。核酸研究18(8):2163-2170
[29] Lam W,Bacchus F(1994)《学习贝叶斯信念网络:基于MDL原则的方法》。计算智能10(3):269-293
[30] Li FM,Wang XQ(2016)使用改进的杂交成分识别抗癌肽。科学报告6:33910
[31] Li W,Godzik A(2006)Cd-hit:一个快速程序,用于聚类和比较大量蛋白质或核苷酸序列。生物信息学22(13):1658-1659
[32] Liao B,Liao B,Lu X,Cao Z(2011)蛋白质序列的新型图形表示及其应用。计算机化学杂志32(12):2539-2544
[33] Liu Y,Zhang Y(2010)H5N1禽流感病毒分析的新方法。计算机化学杂志47(3):1129-1144·Zbl 1186.92034号
[34] 罗瑞,冯志平,刘建科(2002)通过氨基酸和多肽组成预测蛋白质结构类别。《欧洲生物化学杂志》269(17):4219-4225
[35] Matsuda S,Vert JP,Saigo H,Ueda N,Toh H,Akutsu T(2005)使用支持向量机预测亚细胞位置的蛋白质序列的新表示。蛋白质科学14(11):2804-2813
[36] Mu Z,Wu J,Zhang Y(2013)蛋白质序列相似性/差异性分析的新方法。Phys A Stat Mech应用392(24):6361-6366
[37] Nakashima H,Nishikawa K(1994)利用氨基酸组成和残对频率区分细胞内和细胞外蛋白质。分子生物学杂志238(1):54-61
[38] Paradis E,Claude J,Strimmer K(2004)《类人猿:r语言的系统发育和进化分析》。生物信息学20(2):289-290
[39] RandićM、NovićM和Vraćko M(2008)《基于氨基酸邻接矩阵的蛋白质新表征》。SAR QSAR环境研究19(3-4):339-349
[40] Robinson O、Dylus D、Dessimoz C(2016)Phylo。io:在web上交互式查看和比较大型系统发育树。分子生物学进化33(8):2163-2166
[41] Sahu SS,Panda G(2010)基于周氏伪氨基酸组成的新特征表示方法,用于蛋白质结构类预测。计算机生物化学34(5):320-327·Zbl 1403.92221号
[42] Saitou N,Nei M(1987)邻接法:重建系统发育树的新方法。分子生物学进化4(4):406-425
[43] Shamim MTA、Anwaruddin M、Nagarajaram HA(2007),使用氨基酸残基和氨基酸残基对的结构属性对蛋白质折叠进行支持向量机分类。生物信息学23(24):3320-3327
[44] 史建业,张世伟,潘清,周GP(2008)利用伪氨基酸组成预测蛋白质亚细胞位置:与氨基酸组成分布接近。氨基酸35(2):321-327
[45] Sievers F、Wilm A、Dineen D、Gibson TJ、Karplus K、Li W、Lopez R、McWilliam H、Remmert M、Söding J等人(2011)使用聚集ω快速、可扩展生成高质量蛋白质多序列比对。分子系统生物学7(1):539
[46] Singh R,Xu J,Berger B(2008)多蛋白相互作用网络的全球比对及其在功能形态检测中的应用。国家科学院学报105(35):12763-12768
[47] Suna D,Xua C,Zhanga Y(2016)蛋白质二维图形表示的新方法及其应用。RNA 18:20
[48] Tanchotsrinon W,Lursinsap C,Poovorawan Y(2015)通过混沌博弈表示和奇异值分解对HPV基因型进行高效预测。BMC生物信息16(1):71
[49] Thompson JD、Higgins DG、Gibson TJ(1994)Clustal w:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性。核酸研究22(22):4673-4680
[50] Tyagi A、Kapoor P、Kumar R、Chaudhary K、Gautam A、Raghava G(2013)用于设计和发现新型抗癌肽的计算机模型。科学代表3:2984
[51] Wang G,Li X,Wang Z(2008)Apd2:最新抗菌肽数据库及其在肽设计中的应用。核酸研究37(增刊-1):D933-D937
[52] Welch P(1967)使用快速傅立叶变换估计功率谱:一种基于短的、修改的周期图上的时间平均的方法。IEEE Transact音频电声15(2):70-73
[53] Wu H,Zhang Y,Chen W,Mu Z(2015)蛋白质一级序列与图形能量的比较分析。Phys A Stat Mech Appl 437:249-262·Zbl 1400.92618号
[54] Xu C,Sun D,Liu S,Zhang Y(2016)将修改后的混沌博弈和物理化学性质纳入周氏一般伪氨基酸组成的蛋白质序列分析。《Theor生物学杂志》406:105-115
[55] Yang JY,Peng ZL,Yu ZG,Zhang RJ,Anh V,Wang D(2009)基于混沌博弈表示的递归量化分析预测蛋白质结构类。《Theor生物学杂志》257(4):618-626·Zbl 1400.92417号
[56] 姚YH,戴Q,李C,何PA,楠XY,张YZ(2008)蛋白质序列的相似性/差异性分析。蛋白质结构功能生物信息73(4):864-871
[57] Yau SST,Yu C,He R(2008)蛋白质图谱及其应用。DNA与细胞生物学27(5):241-250
[58] Yu HJ,Huang DS(2013)归一化特征向量:一种基于相邻氨基酸数量的新型无对齐序列比较方法。IEEE/ACM Trans-Comput Biol Bioninform(TCBB)10(2):457-467
[59] Yu ZG,Anh V,Lau KS(2004)基于详细HP模型的蛋白质序列混沌博弈表示及其多重分形和相关性分析。《Theor生物学杂志》226(3):341-348·兹比尔1439.92148
[60] Zhang L,Liao B,Li D,Zhu W(2009)使用支持向量机预测凋亡蛋白亚细胞定位的新表示。《Theor生物学杂志》259(2):361-365·Zbl 1402.92163号
[61] Zhang Y,Yu X(2010)蛋白质序列相似性分析。2010年IEEE第五届生物灵感计算国际会议:理论与应用(BIC-TA),IEEE,pp 1255-1258
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。