×

兹马思-数学第一资源

基于熵的蛋白质序列保护措施的几种合适的背景分布。(英语) Zbl公司 1403.92201
摘要:氨基酸背景分布是基于熵的方法从蛋白质多序列比对中提取序列保守性信息的一个重要因素。然而,msa通常不够大,无法提供可靠的观测背景分布。本文提出了两种新的背景分布估计方法。一种是观测背景分布与位置比残留分布的积分,另一种是观测背景频率的归一化平方根。为了验证这些新的背景分布,将它们应用到相对熵模型中,从蛋白质MSAs中寻找催化位点和配体结合位点。实验结果表明,它们在预测功能重要残基方面优于观察到的背景分布。
审核人: 评审员(柏林)
理学硕士:
92D20 蛋白质序列,DNA序列
软件:
氧化铝;氢气
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 巴哈杜尔,D。;Livesay,D.R.,利用系统发育基序改进蛋白质功能位点的位置特异性预测,生物信息学,242308-2316,(2008)
[2] 卡弗里,D。;南索马罗。;休斯,J。;明瑟利斯,J。;Hunang,E.,蛋白质-蛋白质界面在序列上是否比蛋白质表面的其他部分更保守?,《蛋白质科学》,第13期,第190-202页,(2004年)
[3] 覆盖,T。;Thomas,J.,《信息理论要素》(1991年),威利纽约
[4] 卡普拉,J。;Singh,M.,《确定蛋白质功能特异性的残基特征和预测》,生物信息学,241473-1480,(2008)
[5] 卡普拉,J。;Singh,M.,预测序列保护中的重要功能残基,生物信息学,231875-1882,(2007)
[6] 唐纳德,J.S。;Shakhnovich,E.I.,从蛋白质序列确定功能特异性,生物信息学,212629-2635,(2005)
[7] 杜卡,B。;Dennis,R.,利用系统发育基序改进蛋白质功能位点的位置特异性预测,生物信息学,242308-2316,(2008)
[8] 德尔索尔梅萨,A。;帕佐斯,F。;巴伦西亚,A.,功能重要残基预测的自动方法,J。分子生物学,3261289-1302,(2003)
[9] 杜,Y.C。;郑某。;Wang,J.,利用立体化学性质变化预测催化残留物,蛋白质J.,28,29-33,(2009)
[10] 费舍尔,J。;梅耶,哥伦比亚特区。;Sö丁,J.,通过概率密度估计预测序列中的蛋白质功能残基,生物信息学,24613-620,(2008)
[11] 格里布斯科夫,M。;Robinson,N.,使用接收器工作特性(ROC)分析评估序列匹配,计算。《化学》,20,25-33,(1996年)
[12] 海尼科夫S。;Henikoff,J.,基于位置的序列权重,J。《分子生物学》,243574-578,(1994年)
[13] 加利福尼亚州伊尼斯。;阿南德,A.P。;Sowdhamini,D.,用保守功能群分析预测蛋白质中的功能位点,J。《分子生物学》,3371053-1068,(2004年)
[14] 林,J.,《基于香农熵的散度测度》,IEEE trans。《基础理论》,37145-151,(1991)·Zbl公司 712.94004
[15] 廖,H。;是的,W。;蒋博士。;杰尼根,R。;蛋白质序列熵与堆积密度和疏水性密切相关,蛋白质工程。第8卷,第59-64页,(2005年)
[16] 梅克尔,R。;Zwick,M.,H2r:通过基于熵的多序列比对分析识别进化重要残基,BMC生物信息学,9151,(2008)
[17] 马丁,洛杉矶。;格洛尔,G.B。;邓恩,S.D。;Wahl,L.M.,利用信息理论寻找蛋白质中的共进化残基,生物信息学,214116-4124,(2005)
[18] 米哈莱克,我。;雷斯˘, i、 。;李奇塔格,O.,一个进化熵杂化方法,用于按重要性排序残基,J。《分子生物学》,3361265-1282,(2004年)
[19] 米尔尼,L。;Shakhnovich,E.,蛋白质折叠中普遍保守的位置:阅读有关稳定性、折叠动力学和功能的进化信号,J。《分子生物学》,29177-196,(1999)
[20] 尼尔森,m。;《量子计算与量子信息》(2000),剑桥大学出版社,英国·Zbl公司 1049.81015
[21] 彼得罗娃,N。;吴,C.用支持向量机预测催化残基的蛋白质序列和结构特性,生物信息学,7312,(2006)
[22] 裴,J。;Grishin,N.,AL2CO:蛋白质序列比对中位置守恒的计算,生物信息学,17700-712,(2001)
[23] 波特,C。;巴特利特,G。;Thornton,J.,《催化位点图谱:利用结构数据确定酶中催化位点和残基的资源》,《核酸研究》,32,D129-D133,(2003)
[24] 潘琴科,A。;康德拉肖夫,F。;Bryant,S.,通过序列和结构守恒分析预测功能位点,蛋白质科学,13884-892,(2003)
[25] 修订版A,B。;安提平,Y。;Sander,C.,组合熵优化揭示的蛋白质功能的决定因素,基因。生物学,8,R232,(2007年)
[26] 斯特纳,B。;辛格,R。;伯杰,B.,预测和注释催化残留物:信息论方法,J。计算机。生物学,141058-1073,(2007年)
[27] 申金,P。;Erman,B.L.M.,信息理论熵作为序列变异性的度量,蛋白质,11297-313,(1991)
[28] 桑德,s。;Schneider,R.,同源衍生蛋白质结构和序列比对的结构意义数据库,蛋白质,9,56-68,(1991)
[29] 史密斯,P.R。;Smith,T.F.,模式诱导多序列比对(PIMA)算法,采用二级结构相关间隙惩罚法用于比较蛋白质建模,蛋白质工程,5,35-41,(1992)
[30] Taylor,W.,《氨基酸保护分类》,J。理论。《生物学》,119205-218,(1986年)
[31] 唐,Y。;盛,Z。;陈,Y。;Zhang,Z.,酶结构中催化残基的改进预测,蛋白质工程设计。第21295-302页,(2008年)
[32] Valdar,W.,评分残留物保存,蛋白质,48227-241,(2002)
[33] 王,K。;Samudrala,R.,合并背景频率改善基于熵的残留物保护措施,BMC生物信息学,7385,(2006)
[34] Williamson,R.,一类易化转运体中一级序列结构与配体识别关系的信息理论分析,J。理论。《生物学》,174179-188,(1995年)
[35] 叶,K。;弗里德,G。;IJzerman,A.P.,追踪进化压力,生物信息学,24908-915,(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。