SCOP域超族的函数注释
克里斯汀·沃格尔1,2
1MRC公司剑桥CB2 2QH希尔斯路分子生物学实验室,英格兰
2细胞和分子研究所德克萨斯大学奥斯汀分校生物学,2500 Speedway,MBB 3.210,美国德克萨斯州奥斯汀78712
*信函:cvogel at mail utexas教育
本文档描述了域超家族。领域包括结构、功能和形成蛋白质的进化单位。共同祖先的领域被归为超家族。域和域超家族的定义和描述见结构蛋白质分类数据库,SCOP[1,2]。此函数领域超家族的注释已经出版在[3,4]之前,我们恳请您引用我们如果你使用它描述了这些论文中使用的注释过程如下所示。近期工作[5]更新了功能方案,修订了真核超家族注释,并将其扩展到所有SCOP类一到克.
更新 克里斯汀·沃格尔(Christine Vogel)延长了她对SCOP 1.73超级家族的功能注释。1.73注释在中可用范围注释1.73.txt文件。功能注释方案未更改。剩余部分参考SCOP 1.69注释。
功能方案“函数”的确切定义蛋白质或结构域仍然存在争议,可能会有所不同取决于确切的上下文。在我们的工作中,我们注释了域超家族在蛋白质、特定的途径或在细胞/有机体中。因此,我们的对“函数”的理解有点混合了“生物过程”和“分子功能”的定义在基因本体[6]注释中。
我们准备了一个50人的详细计划映射到7个更通用功能的功能类别类别,类似于COG中使用的方案[7]。映射在详细功能类别和更一般功能类别之间是中描述的表1和scope.larger.categories范围更大类别文件。功能的一般类别为:
i)问询处:存储,保持遗传密码;DNA复制/修复;一般的转录/翻译
ii)法规:法规基因表达和蛋白质活性;信息处理响应环境输入;信号转导;一般的调节或受体活性
iii)新陈代谢:合成代谢和分解代谢过程;细胞维持/内环境稳定;第二的新陈代谢
iv)内部-蜂窝式的过程; 细胞运动/分裂;细胞死亡;细胞内转运;分泌物
v)细胞外过程:细胞间、细胞外过程,例如细胞粘附;生物体的过程,如凝血、免疫系统
vi)概述:概述和多功能;与蛋白质/离子/脂质/小分子的相互作用分子
vii)其他/未知:未知功能,病毒蛋白/毒素我们知道,一些超家族,尤其是大家族,可能有多种功能。例如,免疫球蛋白结构域参与细胞粘附、肌肉结构、细胞外基质和免疫系统。此处的功能类别旨在描述每个超家族的主导和最广泛的功能,就目前所知。
注释方案我们注释了SCOP类一到克手动使用功能上述方案。注释基于信息来自SCOP[2]、InterPro[8,9]、,Pfam[10],瑞士保护银行[11]和文学。
作为控制,我们使用了自动注释InterPro中的GO过程、功能和Pfam域的位置[8]. Pfam域被映射到SCOP域超家族基于序列相似性。这为647提供了注释,分别为667和343个结构域超家族。手动域注释与基因生物学基本一致Pfam[12]域的注释[6]及其到SUPERFAMILY[13]中描述的域。这个大型超家族的注释。即发生在在至少一种常用的,真核生物完全测序,由不同的研究人员[5]。我们还就他们的关于著名超家族功能的知识。在特别感谢Matthew Bashton[14]、Cyrus Chothia和Madan Mohan Babu感谢他们的宝贵意见。
根据我们在此方面的工作经验注释,我们估计错误率小于10%超家族,所有超家族<20%。如果您使用函数注释,请不要犹豫联系我们如果你注意错误或不适当的注释。
域函数注释位于这个范围注释1.69.txt文件。
域的分布功能
图1显示了SCOP中领域超家族的功能。域代谢超家族,例如酶是最重要的种类丰富。接近一半超家族(448)具有代谢相关功能,而每个超家族其他类别中包含的域名不到15%超家族。在人类中,三分之一的超家族是代谢(339/950),映射到所有域的六分之一(3212/19225)[13]. 大约10%的超家族(122)有未知函数。
图1。域的分布功能.域函数的分布超家族类一到克SCOP版本中1.69[2].
表1。之间的映射详细和更一般的功能类别。
该表列出了50个详细功能类别映射到7个更通用的功能类别。这个注释文件中使用了一个或两个字母的代码。米/桶-新陈代谢和运输。
一般功能
|
详细功能
|
代码
|
新陈代谢
|
能源
|
C
|
新陈代谢
|
光合作用
|
CB(断路器)
|
概述
|
小分子结合
|
哈
|
概述
|
离子结合
|
HB公司
|
概述
|
脂质/膜结合
|
HC公司
|
概述
|
配体结合
|
高等教育
|
概述
|
概述
|
R(右)
|
概述
|
蛋白质相互作用
|
第三方
|
概述
|
结构蛋白
|
装货单
|
问询处
|
质结构
|
B类
|
问询处
|
翻译
|
J型
|
问询处
|
转录
|
K(K)
|
问询处
|
DNA复制/修复
|
L(左)
|
问询处
|
RNA加工
|
LB(磅)
|
问询处
|
核结构
|
Y(Y)
|
新陈代谢
|
电子转账
|
加利福尼亚州
|
新陈代谢
|
氨基酸m/tr
|
电子
|
新陈代谢
|
氮气m/tr
|
每个
|
新陈代谢
|
核苷酸m/tr
|
F类
|
新陈代谢
|
碳水化合物m/tr
|
G公司
|
新陈代谢
|
多糖m/tr
|
通用航空公司
|
新陈代谢
|
保管部
|
GB(英国)
|
新陈代谢
|
辅酶m/tr
|
H(H)
|
新陈代谢
|
脂质m/tr
|
我
|
新陈代谢
|
单元格包络m/tr
|
M(M)
|
新陈代谢
|
次生代谢
|
问
|
新陈代谢
|
氧化还原
|
无线电高度表
|
新陈代谢
|
转移酵素
|
皇家银行
|
新陈代谢
|
其他酶
|
钢筋混凝土
|
其他
|
未知函数
|
S公司
|
其他
|
病毒蛋白
|
沙特阿拉伯
|
细胞外过程
|
细胞粘附
|
妈妈
|
细胞外过程
|
免疫应答
|
重新
|
细胞外过程
|
血液凝结
|
RG公司
|
细胞外过程
|
毒素/防御
|
某人
|
细胞内过程
|
细胞周期,细胞凋亡
|
D类
|
细胞内过程
|
磷脂m/tr
|
IA公司
|
细胞内过程
|
细胞运动
|
N个
|
细胞内过程
|
贩卖/分泌物
|
纳
|
细胞内过程
|
蛋白质修饰
|
O(运行)
|
细胞内过程
|
蛋白酵素
|
办公自动化
|
细胞内过程
|
离子m/tr
|
P(P)
|
细胞内过程
|
运输
|
射频
|
法规
|
RNA结合,m/tr
|
A类
|
法规
|
DNA绑定
|
洛杉矶
|
法规
|
激酶/磷酸酶
|
观察
|
法规
|
信号转导
|
T型
|
法规
|
其他监管职能
|
助教
|
法规
|
受体活性
|
高清
|
N_年
|
未注释
|
NONA公司
|
工具书类
1.Murzin AG、Brenner SE、Hubbard T、,Chothia C(1995)SCOP:蛋白质的结构分类层序和结构调查数据库。J摩尔生物学247:536-540。摘要[] 2.安德列娃A、霍沃斯D、布伦纳SE,Hubbard TJ、Chothia C等(2004)2004年SCOP数据库:精细化集成了结构和序列家族数据。核(Nucleic)《酸类研究》32:D226-229。摘要[] 3.Vogel C、Berzuini C、Bashton M、GoughJ、 Teichmann SA(2004)超域-更大的进化单元而不是单个蛋白质结构域。分子生物学杂志336:809-823。摘要[] 4.Vogel C、Teichmann SA、Pereira-Leal JB(2005)域复制与重组。分子生物学杂志346:355-365。摘要[] 5.Vogel C,Chothia C.(2006)蛋白质家族扩张与生物学复杂性。公共科学图书馆计算生物学。5月;2(5):e48。Epub 2006年5月26日。摘要[] 6.Harris MA、Clark J、Ireland A、Lomax J、,Ashburner M等人(2004)基因本体(GO)数据库和信息资源。核酸研究32:D258-261。摘要[] 7.Tatusov RL、Fedorova ND、Jackson JD、,Jacobs AR、Kiryutin B等人(2003)COG数据库:更新这个版本包括真核生物。BMC生物信息学4:41。摘要[] 8.Mulder NJ、Apweiler R、Attwood TK、,Bairoch A、Barrell D等人(2003),InterPro数据库,2003年带来了更多的覆盖面和新功能。核酸研究31:315-318.摘要[] 9.Mulder NJ、Apweiler R、Attwood TK、,Bairoch A、Bateman A等(2005)《InterPro,进展与现状》2005年。核酸研究33:D201-205。摘要[] 10.Finn路,Mistry J,Schuster-Bockler B,Griffiths-Jones S、Hollich V等(2006)《家庭金融管理委员会:宗族、网络》工具和服务。核酸研究34:D247-251。摘要[] 11.Boeckmann B、Blatter MC、Famiglietti五十、 Hinz U、Lane L等(2005)蛋白质种类和功能多样性:生物背景下的瑞士-普罗特注释。C R公司生理学328:882-899。摘要[] 12.贝特曼A,硬币L,德宾R,芬恩RD,Hollich V等人(2004),Pfam蛋白质家族数据库。核酸研究32:D138-141。摘要[] 13.Madera M、Vogel C、Kummerfeld SK、,Chothia C,Gough J(2004)2004年的超级家族数据库:添加和改进。核酸研究32:D235-239。摘要[] 14.Bashton M(2004)功能分析领域组合【博士】。英国剑桥大学剑桥。
|