×

一种新的快速蛋白质分类和进化分析方法。 (英语) Zbl 1519.92154号

摘要:在本文中,我们提出了一种新的快速无比对蛋白质序列相似性和进化分析方法。首先根据20种天然氨基酸的理化性质将其分为6组,然后根据氨基酸在每个还原氨基酸序列中的出现频率和平均位置构建12维向量。最后,利用欧氏距离度量蛋白质序列之间的相似性和进化距离。对三个数据集的测试表明,我们的方法能够准确地聚类每个蛋白质序列,这说明了我们方法的有效性。

理学硕士:

92D20型 蛋白质序列,DNA序列
92D15型 与进化有关的问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] K.Katoh,K.Misawa,K.Kuma,T.Miyata,MAFFT:基于快速傅里叶变换的快速多序列比对新方法,《核酸研究》30(2002)3059-3066。
[2] J.D.Thompson,T.J.Gibson,D.G.Higgins,使用ClustalW和ClustalX的多序列比对,Curr。协议。生物信息学。00 (2003) #2.3.
[3] R.C.Edgar,《肌肉:高准确度和高通量的多序列比对》,《核酸研究》32(2004)1792-1797。
[4] S.Vinga,J.Almeida,无对齐序列比较-综述,生物信息学19(2003)513-523。
[5] 潘永华,钱德谦,朱平,蛋白质序列的图形转换和相似性聚类分析,生命科学。第22号决议(2018)191-228。
[6] 张永平,何培安,蛋白质序列的图形表示及其应用,浙江科学杂志。理工大学27(2010)308-314。
[7] 姚永华,严圣杰,徐洪明,韩建南,南晓阳,何培安,戴庆,基于新的类谱图形表示的蛋白质序列的相似性/差异性分析,进化。生物信息学。10 (2014) 87-96.
[8] 吴海燕,张永生,陈文成,穆振中,蛋白质一级序列与图形能量的比较分析,Physica A 437(2013)249-262·Zbl 1400.92618号
[9] 侯文斌、潘庆华、何明富,蛋白质序列的新图形表示及其应用,《物理A 444》(2016)996-1002。
[10] D.D.Sun,C.R.Xu,Y.S.Zhang,蛋白质二维图形表示的新方法及其应用,MATCH Commun。数学。计算。化学。75 (2016) 431-446.
[11] M.Randić、J.Zupan、A.T.Balaban、D Vikić-Topić、D.Plavšić,蛋白质的图形表示,化学。第111版(2011)790-862。
[12] 何培安,徐松南,戴琦,姚永华,CGR表示在蛋白质序列分析和比较中的推广,国际量子化学杂志。116 (2016) 476-482.
[13] J.Li,P.Koehl,氨基酸的3D表示-在蛋白质序列比较和分类中的应用,计算机。结构。生物技术。J.11(2014)47-58。
[14] 胡海良,李振华,董华伟,周天华,基于分形插值的蛋白质序列的图形表示和相似性分析,IEEE/ACM Trans。计算。生物信息学。14 (2017) 182-192.
[15] A.Czerniecka,D.Bieliñska-Waż,P.WaĘ,T.Clark,20D-蛋白质序列的动态表示,《核酸研究》107(2016)16-23。
[16] 周锦川,关于蛋白质属性预测和伪氨基酸组成的一些评论,J.Theor。《生物学》273(2011)236-247·Zbl 1405.92212号
[17] W.Chen,H.Lin,K.C.Chou,伪核苷酸组成或PseKNC:分析基因组序列的有效配方,Mol.BioSyst。11 (2015) 2620-2634.
[18] X.H.Xie,Z.G.Yu,G.S.Han,V.Anh,基于全蛋白质组的氨基酸间距离和条件几何分布树构建,分子系统学。进化。89(2015)37-45。
[19] Y.S.Li、T.Song、J.S.Yang、Y.Zhang、J.L.Yang,基于氨基酸间伪马尔科夫转移概率比较蛋白质序列相似性的无对齐算法,PLoS One 11(2016)#e0167430。
[20] 李永康,田坤,尹春川,何瑞莲,姚S.S.T.,病毒在60维蛋白质空间中的分类,分子系统学。进化。99(2016)53-62。
[21] 何立群,李永康,何瑞林,姚S.S.T.,一种新的无比对载体方法来聚类蛋白质序列,J.Theor。《生物》427(2017)41-52。
[22] Z.C.Mu,J.Wu,Y.S.Zhang,蛋白质序列相似性/差异性分析的新方法,Physica A 392(2013)6361-6366。
[23] L.Salichos,A.Rokas,《推断古代差异需要具有强烈系统发育信号的基因》,《自然》497(2013)327-331。
[24] W.C.Wimley,S.H.White,《膜界面蛋白质的实验测定疏水性尺度》,《自然结构》。生物学3(1996)842-848。
[25] 李国荣,吴敏霞,多元统计分析,科学。出版社,北京,2021。
[26] S.E.Jacobs,D.M.Lamson,K.S.George,T.J.Walsh,人类鼻病毒,临床。微生物。第26版(2013)135-162。
[27] A.C.Palmenberg、D.Spiro、R.Kuzmickas、S.L.Wang、A.Djikeng、J.A.Rathe、C.M.Fraser-Liggett、S.B.Liggett,《所有已知人类鼻病毒基因组的测序和分析揭示结构和进化》,《科学》324(2009)55-59。
[28] Z.C.Mu,G.J.Li,H.Y.Wu,X.Q.Qi,3D-PAF曲线:用于相似性分析的蛋白质序列的新图形表示,MATCH Commun。数学。计算。化学。75 (2016) 447-462.
[29] 吴振英,高若荣,马林斯,张永生,基于谱半径的原序列相似性分析新模型,J.Theor。《生物学》第446期(2018年)第61-70页·Zbl 1397.92545号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。