×

基于熵的蛋白质序列保守性措施的几个合适的背景分布。 (英语) Zbl 1403.92201号

摘要:氨基酸背景分布是基于熵的方法从蛋白质多序列比对中提取序列保守性信息的一个重要因素。然而,MSA通常不够大,无法进行可靠的观测背景分布。本文提出了两种新的背景分布估计。一种是观测背景分布和特定位置残差分布的积分,另一种是实测背景频率的归一化平方根。为了验证这些新的背景分布,将其应用于相对熵模型,从蛋白质MSAs中寻找催化位点和配体结合位点。实验结果表明,它们在预测功能重要残基方面优于观测到的背景分布。

MSC公司:

92D20型 蛋白质序列,DNA序列

软件:

氢气AL2CO公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴哈杜尔,D。;Livesay,D.R.,使用系统发育基序改进蛋白质功能位点的位置特异性预测,生物信息学,242308-2316,(2008)
[2] Caffery,D。;索马鲁,S。;休斯,J。;Mintserlis,J。;Hunang,E.,蛋白质-蛋白质界面的序列是否比蛋白质表面的其他部分更保守?,蛋白质科学。,13, 190-202, (2004)
[3] 盖,T。;Thomas,J.,《信息理论的要素》(1991),威利纽约·Zbl 0762.94001号
[4] 卡普拉,J。;Singh,M.,决定蛋白质功能特异性的残基的表征和预测,生物信息学,241473-1480,(2008)
[5] 卡普拉,J。;Singh,M.,《从序列保护中预测功能重要的残基》,生物信息学,231875-1882,(2007)
[6] 唐纳德,J.S。;Shakhnovich,E.I.,《从蛋白质序列确定功能特异性》,生物信息学,212629-2635,(2005)
[7] Dukka,B。;Dennis,R.,使用系统发育基序改进蛋白质功能位点的位置特异性预测,生物信息学,242308-2316,(2008)
[8] del Sol Mesa,A。;帕佐斯,F。;Valencia,A.,《预测功能重要残基的自动方法》,J.mol.biol。,326, 1289-1302, (2003)
[9] 窦,Y.C。;郑晓庆。;Wang,J.,利用立体化学性质的变化预测催化残留物,蛋白质杂志,28,29-33,(2009)
[10] 费舍尔,J.D。;梅耶,C.E。;Söding,J.,通过概率密度估计从序列中预测蛋白质功能残基,生物信息学,24613-620,(2008)
[11] 格里布斯科夫,M。;Robinson,N.,《使用接收机工作特性(ROC)分析评估序列匹配》,计算。化学。,20, 25-33, (1996)
[12] Henikoff,S。;Henikoff,J.,基于位置的序列权重,J.mol.biol。,243, 574-578, (1994)
[13] Innis,C.A。;Anand,美联社。;Sowdhamini,D.,使用保守功能群分析预测蛋白质中的功能位点,J.mol.biol。,337, 1053-1068, (2004)
[14] Lin,J.,基于Shannon熵的散度度量,IEEE trans。信息理论。,37, 145-151, (1991) ·Zbl 0712.94004号
[15] 廖,H。;Yhe,W。;蒋,D。;Jernigan,R。;Lustig,H.,蛋白质序列熵与堆积密度和疏水性密切相关。选择。,8, 59-64, (2005)
[16] 默克尔,R。;Zwick,M.,H2r:通过基于熵的多序列比对分析识别进化重要残基,BMC生物信息学,9,151,(2008)
[17] 马丁,L.C。;格洛尔,G.B。;邓恩,S.D。;Wahl,L.M.,《使用信息理论搜索蛋白质中的协同进化残基》,生物信息学,214116-4124,(2005)
[18] 米哈莱克,I。;Res˘,即。;Lichtarge,O.,按重要性对残留物进行排序的进化-遗传杂交方法家族,J.mol.biol。,336, 1265-1282, (2004)
[19] 米尔尼,L。;Shakhnovich,E.,《蛋白质折叠中普遍保守的位置:阅读关于稳定性、折叠动力学和功能的进化信号》,J.mol.biol。,291, 177-196, (1999)
[20] 尼尔森,m。;Chuang,I.,《量子计算与量子信息》,(2000),英国剑桥大学出版社·Zbl 1049.81015号
[21] Petrova,N。;Wu,C.,使用具有选定蛋白质序列和结构属性的支持向量机预测催化残基,BMC生物信息学,7312,(2006)
[22] 裴,J。;Grishin,N.,AL2CO:蛋白质序列比对中位置保守性的计算,生物信息学,17,700-712,(2001)
[23] 波特,C。;巴特利特,G。;Thornton,J.,《催化位点图谱:使用结构数据在酶中识别的催化位点和残基的资源》,《核酸研究》,32,D129-D133,(2003)
[24] Panchenko,A。;Kondrashov,F。;Bryant,S.,通过序列和结构保守性分析预测功能位点,蛋白质科学。,13, 884-892, (2003)
[25] Reva,B。;安提宾,Y。;Sander,C.,组合熵优化揭示的蛋白质功能的决定因素,Geno。生物,8,R232,(2007)
[26] B.斯特纳。;辛格,R。;Berger,B.,《预测和注释催化残留物:信息论方法》,J.comput。生物学,14,1058-1073,(2007)
[27] Shenkin,P。;Erman,B.L.M.,《信息论熵作为序列变异性的度量》,《蛋白质》,第11期,第297-313页,(1991)
[28] Sander公司。;Schneider,R.,同源衍生蛋白质结构和序列比对的结构意义数据库,蛋白质,9,56-68,(1991)
[29] P.R.史密斯。;Smith,T.F.,在比较蛋白质建模中使用二级结构依赖间隙惩罚的模式诱导多序列比对(PIMA)算法,蛋白质工程,5,35-41,(1992)
[30] Taylor,W.,《氨基酸保护的分类》,J.theor。生物学,119205-218,(1986)
[31] 唐,Y。;盛,Z。;陈,Y。;Zhang,Z.,《酶结构中催化残基的改进预测》,《蛋白质工程设计》。选择。,21, 295-302, (2008)
[32] Valdar,W.,《评分残留物保护》,《蛋白质》,48,227-241,(2002)
[33] 王凯。;Samudrala,R.,《结合背景频率改进基于熵的残留保护措施》,BMC生物信息学,7385,(2006)
[34] Williamson,R.,一类易化转运蛋白之间初级序列结构和配体识别之间关系的信息论分析,J.theor。生物学,174179-188,(1995)
[35] Ye,K。;弗里德·G。;IJzerman,A.P.,《追踪进化压力》,生物信息学,24908-915,(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。