×

一种新的基于简化脉冲耦合神经网络和霍夫曼编码的DNA序列相似性计算方法。 (英语) 兹比尔1400.92398

摘要:提出了一种基于简化脉冲耦合神经网络(S-PCNN)和哈夫曼编码的DNA序列相似度计算新方法。在本研究中,我们提出了一种基于哈夫曼编码的编码方法,其中使用三重码作为编码位将DNA序列转换为数字序列。该方法利用DNA序列中S-PCNN神经元的放电特征来提取特征。此外,该方法可以处理不同长度的DNA序列。首先,根据S-PCNN和DNA一级序列的特点,对后者进行哈夫曼编码,然后利用前者提取编码DNA序列的振荡时间序列(OTS)。同时,获得相关特征,最后利用欧氏距离确定DNA序列的相似度或相异度。为了验证该方法的准确性,使用了不同的数据集进行测试。实验结果表明,该方法是有效的。

MSC公司:

92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Hamori,E。;Ruskin,J.,H曲线,一种新的核苷酸序列表示方法,特别适用于长DNA序列,J.Biol。化学。,258, 1318-1327 (1983)
[2] 何,P.A。;魏杰。;姚明,Y。;Tie,Z.,蛋白质的新型图形表示及其应用,Physica A,391,93-99(2012)
[3] 何,P.A。;李,D。;张,Y。;王,X。;Yao,Y.,基于格雷码的蛋白质序列的三维图形表示,J.Theoret。生物,304,81-87(2012)·Zbl 1397.92528号
[4] Iranmanesh,A。;Nejati,R.,实时PCR图着色的新算法,J.Compute。西奥。纳米科学。,10, 2487 (2013)
[5] 李,C。;马,H。;周,Y。;Wang,X.L。;郑晓秋,基于加权伪谱的DNA序列相似性分析,计算机学报。化学。,32, 675-680 (2011)
[6] 戴奇。;Yan,Z.F。;石振新。;刘晓强。;姚明,Y.H。;He,P.G.,LZ词分布及其在序列比较中的应用研究,定理J。《生物学》,336,52-60(2013)·Zbl 1411.92231号
[7] Wąż,P。;Bieliska-W,D.,DNA序列的三维动态表示,J.Mol.模型。,20, 2141 (2014)
[8] Wąż,P。;Bieliska-Wąż,D.,DNA序列的非标准相似性/差异性分析,基因组学,104,464-471(2014)
[9] 斯坦,C。;Cristescu,C.P。;Scarlat,E.I.,基于混沌博弈表征的DNA序列相似性分析案例研究:白蛋白,J.Theoret。生物学,267,513-518(2010)·Zbl 1414.92203号
[10] 齐晓庆。;Wen,J。;Qi,Z.H.,基于双核苷酸的DNA序列新三维图形表示,J.Theoret。生物学,249681-690(2007)·Zbl 1453.92233号
[11] Nandy,A.,DNA序列结构的新图解表示和分析:I.珠蛋白基因的方法和应用,Current Sci。,66, 309-314 (1994)
[12] Yao,Y.H。;Nan,X.Y。;Wang,T.M.,一种新的二维图形表示-分类曲线和DNA序列的相似性/差异性分析,J.Mol.Struct.:《THEOCHEM》,764101-108(2006)
[13] Liao,B。;项庆林。;蔡立杰。;曹,Z.,DNA序列的新图形编码及其相似性计算,Physica A,392,4663-4667(2013)·Zbl 1395.92105号
[14] Gonzalez,D.L。;Giannerini,S。;Rosa,R.,《遗传密码的非权力模型:解释基因组信息的范例》,Phil.Trans。R.Soc.A,3742063,20150062(2016)·Zbl 1404.92137号
[15] Gonzalez,D.L。;Giannerini,S。;Rosa,R.,奇偶二进制序列中的检测结构,IEEE工程医学生物学。Mag.,25,1,69-81(2006)
[16] Gonzalez,D.L.,遗传密码可以用数学描述吗?,医学科学。莫尼特。国际医学杂志实验临床。第10、4、11-17号决议(2004年)
[17] 彭成凯。;Buldyrev,S.V。;Goldberger,A.L。;哈夫林,S。;西奥蒂诺,F。;西蒙斯,M。;Stanley,H.E.,DNA行走的分形景观分析,Physica A,191,25-29(1992)
[18] Buldyrev,S.V。;北卡罗来纳州多科利安。;Goldberger,A.L.,《使用统计物理方法分析DNA序列》,《物理学A》,249430-438(1998)
[19] Arques,D.G。;Michel,C.J.,蛋白质编码基因中的互补循环码,J.Theoret。《生物学》,182,45-58(1996)
[20] Hou,W.B。;潘,Q.H。;He,M.F.,基于CMI编码的DNA序列的新表示,Physica A,409,87-96(2014)·兹比尔1395.92102
[21] 尹,C.C。;陈,Y。;Yau,S.S.T.,傅里叶变换测量DNA序列相似性及其在层次聚类中的应用,J.Theoret。《生物学》,359,18-28(2014)·Zbl 1412.92252号
[22] Jeong,B.S。;巴里,A.T.M.G。;里兹,M.R。;Jeona,S。;利马,C.G。;Choi,H.J.,DNA序列分析的基于密码的编码,方法,67,373-379(2014)
[23] Zhang,J.H。;Wang,R.H。;Bai,F.L。;Zheng,J.S.,DNA序列相似性分析的准MQ EMD方法,应用。数学。莱特。,24, 2052-2058 (2011) ·Zbl 1229.92036号
[24] Bai,F.L。;Zhang,J.H。;郑建生,基于EMD方法的DNA序列相似性分析,应用。数学。莱特。,24223-237(2011年)·兹比尔1201.92029
[25] Gunasinghea,美国。;Alahakoon,D。;Bedingfield,S.,《提取用于无对齐序列比较的高质量k字》,J.Theoret。《生物学》,358,31-51(2014)·Zbl 1412.92216号
[26] Bai,F.L。;Liu,Y.Z.,DNA初级序列的随机游走表示,数学。生物科学。,209, 282-291 (2007) ·2018年9月11日
[27] 李,C。;于小强。;Helal,N.D.,基于密码子使用的DNA序列相似性分析,化学。物理学。莱特。,459, 172-174 (2008)
[28] Subashini,M.M。;Sahoo,S.K.,脉冲耦合神经网络及其应用,专家系统。申请。,41, 3965-3974 (2014)
[29] 段,X.H。;曹建杰。;Liu,J.,改进PCNN模型在多光谱和全色图像融合中的应用研究,国防部。电子。Tech.,37,3,55-60(2014),(中文)
[30] Fu,J.C。;Chen,C.C。;Chai,J.W。;Wong,S.T.C。;Li,I.C.,脑磁共振成像中基于EM的自适应脉冲耦合神经网络图像分割,计算。医学成像图。,34, 308-320 (2010)
[32] Samir Elons,A。;马格迪·阿布利埃拉(Magdy Abull-ela);Tolba,M.F.,一种用于位置不变三维阿拉伯手语识别的PCNN特征质量优化技术,应用。软计算。,13, 1646-1660 (2013)
[33] Li,H.H。;金,X。;Yang,N。;Yang,Z.,基于PCNN模型和仿射不变矩的着陆飞机识别,模式识别。莱特。,51, 23-29 (2015)
[34] 洪,Q。;Zhang,Y.,用PCNN寻找最短路径的新算法,混沌孤子分形,33,4,1220-1229(2007)·Zbl 1137.90698号
[35] 李晓杰。;马,Y.D。;Feng,X.W.,用于最短路径问题的自适应自动波脉冲耦合神经网络,神经计算,115,63-71(2013)
[36] Wang,Y.N。;葛,J。;张,H。;周,B.W.,基于改进脉冲耦合神经网络的二维Tsallis熵智能注射液颗粒检测仪,工程应用。Artif公司。智力。,24, 625-637 (2011)
[37] 王,Zh。B。;Ma,Y.D。;Cheng,F.Y。;Yang,L.Z.,脉冲耦合神经网络综述,图像视觉。计算。,28, 5-13 (2010)
[38] 美国赛义德。;Kunwar,F。;Iqbal,M.,基于引导自动波脉冲耦合神经网络(GAPCNN)的移动机器人实时路径规划和避障方案,Robot。自动。系统。,62, 474-486 (2014)
[39] Zhao,C.H。;邵,G.F。;Ma,L.J.,基于冗余线性NSWMDA和自适应PCNN的图像融合算法,Optik,125,6247-6255(2014)
[40] 周东明;聂仁灿;赵东风,竞争脉冲耦合神经网络的自波特性分析及其应用,神经计算,722331-2336(2009)
[41] 聂仁康;周东明;He,Min;金,欣;Yu,Jiefu,使用PCNN中的频率图序列提取面部特征,J.Sensors,2016,1-9(2016),文章ID 5491341
[42] 金,欣;聂仁康;周东明;Wang,Quan;何康健,基于NSST和PCNN的多聚焦彩色图像融合,J.Sensors,2016,1-12(2016),文章ID 8359602
[43] Huffman,D.A.,最小冗余码的构造方法,Proc。爱尔兰共和国,40,1098-1101(1952)·Zbl 0137.13605号
[44] 戈林,M。;马修,C。;Young,N.E.,Huffman编码与字母成本:线性时间近似方案,SIAM J.Compute。,41, 3, 684-713 (2012) ·Zbl 1248.94045号
[45] 吴建中。;王义杰。;丁,L.P。;Liao,X.F.,通过霍夫曼编码提高网络隐蔽定时信道的性能,数学。计算。建模,55,69-79(2012)·Zbl 1245.94092号
[46] Liao,B。;Zhang,Y.S。;丁克强。;Wang,T.M.,基于浓缩曲线表示的DNA序列相似性/差异性分析,J.Mol.Struct.:《THEOCHEM》,717199-203(2005)
[47] 杨,X。;Wang,T.,短词线性回归模型:适用于不同长度生物序列的相似距离,J.Theoret。《生物学》,337,61-70(2013)·Zbl 1411.92239号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。