×

基于HMM的序列过滤器改进蛋白质亚家族分类的数学基础。 (英语) Zbl 1378.92049号

摘要:信息系统发育分析依赖于策划和注释序列的存在。这可以通过同时提供与其相关的经验数据来补充体内功能。因此,混淆的序列与多个功能簇相似,会导致任何分类都是模糊的、主观的和不精确的。在这里,我分析并讨论了一个数学表达式的发展,该表达式可以表征潜在的混杂蛋白质序列。具体来说,计算并评估组合排列的轮廓HMM分数的统计描述符。然后将所得数据并入序列适用性指数。然后,可以建议将该序列包括在内或全部排除。该指数与实验数据无关,可以根据蛋白质序列的一级结构计算得出。这可用于修剪先前分组的序列,并可最终确定训练集的组成或减少待测试序列的搜索空间。

MSC公司:

92D15型 与进化有关的问题
92B10型 数学生物学中的分类学、分支学、统计学
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Chung,D。;Young,J。;Cha,M。;布鲁内基,R。;邦布尔,Y.J。;希梅尔,M.E。;Westpheling,J.,在bescii Caldicellulosiruptor中表达嗜酸热菌纤维素酶E1内切葡聚糖酶可增强其解构结晶纤维素的能力,生物技术。生物燃料,81113(2015)
[2] 福森,F。;Hausinger,R.P.,Alcaligenes eutrophus JMP134“2,4-二氯苯氧乙酸单加氧酶”是一种α-酮戊二酸依赖性双加氧酶,《细菌学杂志》。,175, 2083-2086 (1993)
[3] 霍根,D.A。;奥克通,T.A。;Hausinger,R.P.,酿酒酵母中磺酸盐/α-酮戊二酸双加氧酶的克隆和表征,细菌杂志。,181, 5876-5879 (1999)
[4] Jones,D.T.,GenTHREADER:一种高效可靠的基因组序列蛋白质折叠识别方法,《分子生物学杂志》。,287, 797-815 (1999)
[6] 卡特,S。;Mohanty,D.,《AMPylating酶的电子鉴定及其差异进化研究》,科学代表,5,10804(2015)
[7] Kundu,S.,2-氧戊二酸依赖性加氧酶中催化结构域的分布和预测,BMC Res.Notes,5,410(2012)
[8] Kundu,S.,《多样性中的统一,通过2-酮戊二酸依赖性加氧酶调节植物细胞生理的系统方法》,Front。植物科学。,6, 98 (2015)
[9] 昆都,S。;Sharma,R.,《植物类别C GH9内切葡聚糖酶的电子鉴定和分类分布》,Front。植物科学。,7, 1185 (2016)
[11] Letunic,I.,基于SMART域的序列注释资源的最新改进,核酸研究,30,242-244(2002)
[13] Sonnhammer,E.L。;Eddy,S.R。;伯尼,E。;贝特曼,A。;Durbin,R.,Pfam:蛋白质结构域的多重序列比对和HMM图谱,《核酸研究》,26,320-322(1998)
[14] Urbanowicz,B.R。;加泰罗尼亚,C。;欧文,D。;Wilson,D.B。;Ripoll,D.R。;Rose,J.K.,一种番茄内β-1,4-葡聚糖酶,SlCel9C1,代表一个独特的亚类,含有一个新的碳水化合物结合模块家族(CBM49),J.Biol。化学。,282, 12066-12074 (2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。