摘要

动机:氨基酸序列比对广泛用于蛋白质结构、功能和进化分析关系。超家族中的蛋白质通常具有相同的功能折叠并具有相关功能。这些结构和功能约束反映在线形守恒模式中。功能和/或结构重要性的职位往往更多保守的。保存位置通常以不同的方式聚集由低保守性序列片段包围的基序。糟糕保守区域也可能由多种对齐算法,从而指示可能的对齐错误。通过定义守恒来量化守恒对每个对齐位置的索引使motif检测更深入方便。将这些保护指数映射到蛋白质上空间结构有助于可视化空间保护特征并预测功能和/或结构重要站点。保护指数分析可能是有用的用于检测潜在错位区域的工具,将有助于多重比对的改进。

结果:我们开发了一个计算保护指数的程序在多序列比对中的每个位置使用方法。即,每个位置的氨基酸频率为并根据这些数据计算保护指数频率。我们使用未加权频率和频率使用两种不同的策略进行加权。三个概念不同的方法(基于熵、基于方差和矩阵基于分数)在算法中实现,以定义保护指数。计算35522的保护指数根据SMART数据库中284条路线的位置,我们证明不同的方法导致高度相关(相关性系数大于0.85)。保护指数显示顺序相邻位置

\(i)
\(i\+\j\)
,其中
\(j)
以及三个窗口上指数的平均值位置是检测模体的最佳位置。有间隙的位置显示出明显较低的保守性。我们比较SMART线形或FSSP结构的守恒性质与ClustalW路线的路线一致。结果表明保护指数应该是一个有价值的调整工具质量评估,并可用作多条路线的细化。

可用性:AL2CO程序的C代码及其多个平台的预编译版本以及详细信息的分析可在ftp://iole.swmed.edu/pub/al2co网站/.

联系人:grishin@chop.swmede.du

*

通信对象演说。

此内容仅以PDF格式提供。