×

双边相似函数:一种新的、通用的生物序列相似性分析方法。 (英语) Zbl 1406.92474号

摘要:本文设计了双向相似函数,用于分析DNA、RNA二级结构或蛋白质等生物序列的相似性。定义的函数可以很好地执行序列之间的综合比较,无论是从两个被比较序列的汉明距离还是相应的位置差异来看。与现有的相似性分析方法相比,相似性/差异性检验表明,所提出的计算复杂度为O(N)的方法对这三类生物序列是有效的,并且具有普遍性。

MSC公司:

92D20型 蛋白质序列,DNA序列
2017年第68季度 问题的计算难度(下限、完备性、近似难度等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bai,F。;朱,W。;Wang,T.,RNA二级结构之间的相似性分析,化学。物理学。莱特。,408,R258-R263(2005)
[2] Bonnet-Herez,J.L。;Lloret-Clament,M.,《测量肌肉组织收缩变化的方法》,生物系统,74,R73-R78(2004)
[3] 陈,C。;Chen,L。;邹,X。;Cai,P.,利用周氏伪氨基酸组成概念和支持向量机预测蛋白质二级结构含量,protein Pept。莱特。,16,R27-R31(2009)
[4] Chou,K.C.,使用伪氨基酸组成预测蛋白质细胞属性,蛋白质:结构。功能。遗传学。,43,R246-R255(2001),(勘误表:同上,2001年,第44卷,第60卷)
[5] Chou,K.C.,《伪氨基酸组成及其在生物信息学、蛋白质组学和系统生物学中的应用》,Curr。蛋白质组学,6,R262-R274(2009)
[6] 杜卢克,S。;Tichit,L.,《RNA二级结构比较:zhang-shasha树编辑算法的精确分析》,Theoret。计算。科学。,306,R471-R484(2003)·Zbl 1060.68027号
[7] 冯,J。;Wang,T.M.,基于混沌游戏表示法的RNA二级结构三维图形表示,化学。物理学。莱特。,454,R355-R361(2008)
[8] Georgiou,D.N。;卡拉卡西迪斯,T.E。;尼托·J·J。;Torres,A.,使用模糊聚类技术和矩阵对氨基酸进行分类及其对Chou伪氨基酸组成的影响,J.Theoret。生物,257,R17-R26(2009)·Zbl 1400.92393号
[9] Gao,J.W。;Zhang,X.P.,基于4D表示的RNA二级结构相似性分析,MATCH Commun。数学。计算。化学。,56,R249-R259(2006)·Zbl 1121.92030号
[10] Hofacker,I.L。;伯恩哈特,S.H.F。;Stadler,P.F.,RNA碱基配对概率矩阵的比对,生物信息学,20,R2222-R2227(2004)
[11] 伊利·L。;Ilie,S.,《相邻种子的快速计算》,生物信息学,25,R822-R823(2009)
[12] Le,S.Y。;Nussinov,R。;Maizel,J.V.,RNA二级结构树图及其比较,计算。生物识别。第22号决议,R461-R473(1989)
[13] 李,M。;Badger,J.H。;陈,X。;Kwong,S。;科尔尼,P。;张华,基于信息的序列距离及其在线粒体基因组系统发育研究中的应用,生物信息学,17,R149-R154(2001)
[14] 李,C。;Wang,A.H。;Xing,L.,RNA二级结构的相似性,J.Compute。化学。,28,R508-R512(2007)
[15] 李,F.M。;Li,Q.Z.,使用周的伪氨基酸组成和改进的杂交方法预测蛋白质亚细胞位置,protein Pept。莱特。,15,R612-R616(2008)
[16] Liao,B。;Wang,T.M.,基于三维图形表示的DNA序列相似性/差异性分析,化学。物理学。莱特。,388,R195-R200(2004)
[17] Liao,B。;Wang,T.,RNA二级结构的3D图形表示,J.Biomol。结构。动态。,21,R827-R832(2004)
[18] Liao,B。;Tan,M。;丁凯,DNA序列二维图形表示的应用,化学。物理学。莱特。,414,R296-R300(2005)
[19] Liao,B。;张,Y。;丁·K。;Wang,T.,基于浓缩曲线表示的DNA序列相似性/差异性分析,J.Mol.Struct。(THEOCHEM),717,R199-R203(2005)
[20] Liao,B。;Tan,M。;Ding,K.,DNA序列的4D表示及其应用,化学。物理学。莱特。,402、R380-R383(2005)
[21] Liao,B。;丁克强。;Wang,T.M.,《关于RNA二级结构的六维表示》,J.Biomol。结构。动态。,22,R455-R463(2005)
[22] Liao,B。;朱,W。;Li,R.F.,无简并的RNA二级结构数学表示,MATCH Commun。数学。计算。化学。,57,R687-R695(2007年)·Zbl 1189.92031号
[23] Lin,H.,利用周氏伪氨基酸组成预测外膜蛋白的改良马氏判别式,J.Theoret。生物,252,R350-R356(2008)·Zbl 1398.92076号
[24] 林,w.Z。;Xiao,X。;Chou,K.C.,GPCR-GIA:通过灰色关联分析识别G蛋白偶联受体及其家族的网络服务器,protein Eng.Des。选择。,22、11、R699-R705(2009)
[25] 刘晓强。;戴,Q。;秀,Z.L。;Wang,T.M.,PNN曲线:DNA序列的新二维图形表示及其应用,J.Theoret。生物,243,R555-R561(2006)·Zbl 1447.92307号
[26] 刘,N。;Wang,T.M.,RNA二级结构快速相似性分析方法,BMC生物信息学,7,R493-R503(2006)
[27] 刘立伟。;Wang,T.M.,《RNA二级结构的三维图形表示及其应用》,J.Math。化学。,42,R595-R602(2007)·Zbl 1127.92022号
[28] 刘,Z。;Liao,B。;Zhu,W.,基于DNA序列的双核苷酸分析相似性的新方法,MATCH Commun。数学。计算。化学。,61,R541-R552(2009)·Zbl 1224.92005年
[29] Lloret-Clacent,M.,系统理论中细胞变化的测量,Kybernetes,28,R1016-R1026(1999)·Zbl 0953.93009号
[30] 罗,J.W。;Liao,B。;李,R.F。;朱伟,RNA二级结构无简并三维图形表示,J.Math。化学。,39,R629-R636(2006)·兹比尔1096.92017
[31] 麦克威廉姆斯,F.J。;斯隆,N.J.A.,《纠错码理论》(1977年),北荷兰:北荷兰阿姆斯特丹·兹比尔0369.94008
[32] 马卡伦科夫,V。;Lapointe,F.,从不完全距离矩阵推断系统发育的加权最小二乘法,生物信息学,20,R2113-R2121(2004)
[33] 莫拉·莫拉,H。;洛特-气候,M。;Vives-Macia,F.,《DNA序列比较的度量方法》,Kybernetes,37,R120-R126(2008)·兹比尔1176.92020
[34] 邱建德。;黄,J.H。;Liang,R.P。;Lu,X.Q.,基于Chou伪氨基酸组成概念的G蛋白偶联受体类别预测:基于离散小波变换的方法,Ana。生物化学。,390,R68-R73(2009)
[35] Randić,M。;弗拉契科,M。;南迪,A。;Basak,S.C.,《DNA初级序列的三维图形表示及其数值表征》,J.Chem。通知。计算。科学。,40,R1235-R1244(2000)
[36] Randić,M。;弗拉契科,M。;莱什,N。;Plavšić,D.,基于新型二维图形表示的DNA序列相似性/差异性分析,化学。物理学。莱特。,371,R202-R207(2003)
[37] Randić,M。;弗拉契科,M。;莱什,N。;Plavšić,D.,DNA序列的新型二维图形表示及其数值表征,化学。物理学。莱特。,368,R1-R6(2003)
[38] Randić,M。;Zupan,J。;Balaban,A.T.,DNA序列的新型二维图形表示及其数值表征,化学。物理学。莱特。,397,R247-R252(2004)
[39] Randić,M。;Butina,D。;Zupan,J.,蛋白质的新型二维图形表示,化学。物理学。莱特。,419,R528-R532(2006)
[40] Randić,M.,《基于氨基酸物理化学性质的蛋白质二维图形表示》,《化学》。物理学。莱特。,444,R176-R180(2007)
[41] Randić,M。;Mehulić,K。;Vukičević博士。;皮桑斯基,T。;Vikić-Topić,D。;Plavšić,D.,蛋白质的四色图图形表示及其数值表征,J.Mol.Graph。型号。,27,R637-R641(2009)
[42] Shapiro,B.,《比较多种RNA二级结构的算法》,计算。申请。生物科学。,4,R387-R393(1988)
[43] 夏皮罗,B。;Zhang,K.,使用树比较比较多个RNA二级结构,计算。申请。生物科学。,6,R309-R318(1990)
[44] Steane,A.M.,量子理论中的纠错码,物理学。修订稿。,77,R793-R797(1996)·Zbl 0944.81505号
[45] 汤普森,J.D。;希金斯,D.G。;Gibson,T.J.,CLUSTAL W:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性,Nucl。《酸类研究》,22,R4673-R4680(1994)
[46] Wang,S.Y。;田福成。;冯伟杰。;Liu,X.,基于符号动力学的DNA序列表示方法的应用,J.Mol.Struct。(THEOCHEM),909,R33-R42(2009)
[47] Xiao,X。;邵,S。;丁,Y。;黄,Z。;黄,Y。;Chou,K.C.,使用复杂性度量因子预测蛋白质亚细胞位置,《氨基酸》,28,R57-R61(2005)
[48] Xiao,X。;Shao,S.H。;丁Y.S。;黄,Z.D。;陈,X。;Chou,K.C.,使用细胞自动机生成生物序列的图像表示,《氨基酸》,28,R57-R62(2005)
[49] Xiao,X。;Shao,S.H。;黄,Z.D。;Chou,K.C.,《使用伪氨基酸组成预测蛋白质结构类别:用复杂性度量因子进行探讨》,J.Compute。化学。,27,R478-R482(2006)
[50] Xiao,X。;Shao,S.H。;丁Y.S。;黄,Z.D。;Chou,K.C.,使用细胞自动机图像和伪氨基酸组成预测蛋白质亚细胞位置,《氨基酸》,30,R49-R54(2006)
[51] Xiao,X。;王,P。;Chou,K.C.,用伪氨基酸组成预测蛋白质结构类:使用细胞自动机图像几何矩的方法,J.Theoret。生物,254,R691-R696(2008)·Zbl 1400.92416号
[52] Xiao,X。;Lin,W.Z。;Chou,K.C.,《使用灰色动态模型和伪氨基酸组成预测蛋白质结构类别》,J.Compute。化学。,29,R2018-R2024(2008)
[53] Xiao,X。;王,P。;Chou,K.C.,通过杂交功能结构域组成和伪氨基酸组成预测蛋白质四级结构属性,J.Appl。结晶器。,42,R169-R173(2009)
[54] Xiao,X。;王,P。;Chou,K.C.,GPCR-CA:预测G蛋白偶联受体功能类别的细胞自动机图像方法,J.Compute。化学。,30、9、R1414-R1423(2009)
[55] Xiao,X。;Lin,W.Z.,蛋白质灰色关联度测度在预测蛋白质四级结构类型中的应用,氨基酸,37,4,R741-R749(2009)
[56] Yao,Y.H。;Nan,X.Y。;Wang,T.M.,基于三维图形表示的DNA序列相似性/非相似性分析,化学。物理学。莱特。,411,R248-R255(2005)
[57] Yao,Y.H。;Liao,B。;Wang,T.M.,《RNA二级结构的二维图形表示及其相似性/差异性分析》,J.Mol.Struct。(THEOCHEM),755,R131-R136(2005)
[58] Yao,Y.H。;Nan,X.Y。;Wang,T.M.,《一种新的二维图形表示——分类曲线和DNA序列的相似性/差异性分析》,J.Mol.Struct。(THEOCHEM),764,R101-R108(2006)
[59] Yao,Y.H。;戴,Q。;李,C。;何,P.A。;Nan,X.Y。;Zhang,Y.Z.,蛋白质序列的相似性/差异性分析,蛋白质:结构。功能。生物信息。,73,R864-R871(2008)
[60] 曾Y.H。;郭义忠。;肖瑞秋。;Yang,L.等人。;Yu,L.Z。;Li,M.L.,J.Theoret,使用增广的周氏伪氨基酸组成,基于自协方差方法预测蛋白质亚线粒体位置。生物,259,R366-R372(2009)·Zbl 1402.92193号
[61] 张,S。;Wang,T.,利用离散傅里叶变换和连续小波变换进行蛋白质结构特征分析,J.Math。化学。,46,R562-R568(2009)·Zbl 1196.92015号
[62] 张,S。;Wang,T.,基于条件LZ复杂性的蛋白质序列系统发育分析,MATCH Commun。数学。计算。化学。,63,R701-R716(2010)
[63] 张,S。;Yang,L.等人。;Wang,T.,《使用信息差异度量来比较蛋白质二级结构》,J.Mol.Struct。(THEOCHEM),909,R102-R106(2009)
[64] Zhang,Y.,《关于RNA二级结构的二维图形表示》,MATCH Commun。数学。计算。化学。,57,R697-R710(2007)·Zbl 1189.92042号
[65] 张,Y。;邱,J。;Su,L.,基于2D图形表示法比较RNA二级结构,化学。物理学。莱特。,458,R180-R185(2008)
[66] 张国勇。;李,H.C。;Fang,B.S.,《通过改进的Chou伪氨基酸组成预测脂肪酶类型》,蛋白质Pept。莱特。,15,R1132-R1137(2008)
[67] 朱,W。;Liao,B。;Ding,K.,RNA二级结构的浓缩三维图形表示,J.Mol.Struct。(THEOCHEM),757,R193-R198(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。