×

利用香农熵区分DNA的蛋白质编码和非编码RNA片段。 (英语) Zbl 1185.92046号

摘要:为了区分蛋白质编码和非编码RNA片段,对DNA序列的复杂性进行了评估。该方法基于计算序列的香农熵。通过比较原始序列和洗牌序列的熵,我们确定了两个片段之间差异的来源及其对序列的相对贡献。为了证明该方法,分析了艰难梭菌630(G+C=29.1%)和噬菌蛭弧菌B(G+C=50.6%)的DNA序列,这两种细菌分别代表核苷酸含量不平衡和平衡的细菌。结果表明,无论核苷酸含量如何,在这两种细菌中_{r} S公司\)与非编码RNA片段相比,两个熵的相对差异在蛋白质编码区显著更大。

MSC公司:

92C40型 生物化学、分子生物学
94甲17 信息的度量,熵
92D20型 蛋白质序列,DNA序列

关键词:

DNA序列;香农熵
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] DOI:10.1103/PhysRevLett.98.058102·doi:10.10103/PhysRevLett.98.058102
[2] DOI:10.1103/物理版次E.61.5624·doi:10.1103/PhysRevE.61.5624
[3] 内政部:10.1093/nar/gki271·doi:10.1093/nar/gki271
[4] DOI:10.1103/PhysRevE.55.800·doi:10.1103/PhysRevE.55.800
[5] DOI:10.1103/PhysRevE.66.061906·doi:10.1103/PhysRevE.66.061906
[6] Buldyrev S.V.,《电力法》(2006年)
[7] DOI:10.1016/S0375-9601(02)00730-2·兹比尔0997.62091 ·doi:10.1016/S0375-9601(02)00730-2
[8] DOI:10.1103/PhysRevE.66.031906·doi:10.103/物理版本E.66.031906
[9] DOI:10.1016/j.physa.2004.05.070·doi:10.1016/j.physa.2004.05.070
[10] DOI:10.1016/S0378-4371(99)00407-0·doi:10.1016/S0378-4371(99)00407-0
[11] 内政部:10.1007/BF01025996·Zbl 1086.82554号 ·doi:10.1007/BF01025996
[12] 内政部:10.1103/PhysRevLett.74.3293·doi:10.1103/PhysRevLett.74.3293
[13] DOI:10.1103/PhysRevE.70.046217·doi:10.1103/PhysRevE.70.046217
[14] 内政部:10.1093/nar/gki320·doi:10.1093/nar/gki320
[15] 内政部:10.1063/1.2645274·Zbl 1159.37348号 ·doi:10.1063/1.2645274
[16] 内政部:10.1038/35888·doi:10.1038/35888
[17] 内政部:10.1186/1471-2105-2-8·doi:10.1186/1471-2105-2-8
[18] DOI:10.1103/PhysRevE.71.021906·doi:10.1103/PhysRevE.71.021906
[19] Ash R.,信息理论(1965)
[20] 数字对象标识码:10.1002/j.1538-7305.1948.tb01338.x·Zbl 1154.94303号 ·doi:10.1002/j.1538-7305.1948.tb01338.x
[21] DOI:10.1103/PhysRevLett.88.174102·doi:10.1103/PhysRevLett.88.174102
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。