摘要

瑞亚(http://www.rhea-db.org)是一个全面的、非冗余的专家管理的生化反应资源,用于酶的功能注释和代谢网络的描述。Rhea使用ChEBI(生物感兴趣的化学实体)小分子本体论中的实体描述了涵盖IUBMB酶命名表的酶催化反应以及其他反应,包括自发发生的反应。在这里,我们描述了自上次在《核酸研究》数据库期刊上发表报告以来Rhea的发展。其中包括第一次实现反应的简单分级分类,通过持续的专家管理改进IUBMB酶命名列表和其他反应的覆盖范围,以及开发一个新的网站来为改进后的数据集提供服务。

简介

瑞亚(http://www.rhea-db.org)是一个全面的、非冗余的专家管理的生化反应资源,用于酶的功能注释和代谢网络的描述(1). Rhea涵盖IUBMB酶命名委员会(以下简称“EC”)分级酶分类的反应(2,)以酶为代表(4)和IntEnz(5)以及文献中描述的其他酶和运输反应以及自发发生的反应。

Rhea反应由参与者和特定的反应方向定义。Rhea代表小分子和大分子的官能团,如使用ChEBI本体中的化学实体的蛋白质(6),在7.3的任意pH下为每个ChEBI实体选择主要的微观物种(质子化状态),并相应地平衡质量和电荷的所有反应。小分子数据的管理是Rhea管理工作流程的一个组成部分,Rhea管理员在其开发期间向ChEBI提交了数千种新化合物。每组反应参与者都与四个潜在方向相关:从左到右(LR,=>)、从右到左(RL,<=)、双向(BI,<=>)和未定义(UN,<?>),每个方向都有自己独特的反应标识符。Rhea反应可用于注释知识库中实验表征的酶反应的首选方向(=>、<=、<=>),描述代谢网络和衍生模型,其中反应通量没有先验定义(<?>),并将知识库和模型联系起来。使用Rhea注释酶和代谢物数据的知识库包括瑞士脂质体脂质生物学知识库(7),EBI酶门户(8),代谢组学数据的MetaboLights存储库(9)和IntEnz(5). 使用Rhea注释代谢网络和模型的资源包括MetaNetX(10,11)和显微镜(12). Rhea还提供了与其他代谢物和途径数据库(如KEGG)的链接(13)、MetaCyc(14)和Reactome(15). 有关Rhea反应及其使用的更多信息,请参阅我们以前的出版物(1,16).

在以下章节中,我们总结了自上次出版以来Rhea的最新发展(1). 其中包括首次实现反应的简单分级分类,通过持续的专家管理和开发新网站来服务于此增强的数据集,提高已知酶活性和其他反应的覆盖率。

RHEA的当前发展

Rhea反应分类

EC根据单个代表性反应(以下称为“IUBMB的代表性反应”),使用四个级别的层次结构对酶活性进行分类。Rhea(与其他反应数据库一样)旨在全面覆盖IUBMB的所有代表性反应以及文献中描述的其他额外反应(无论这些反应是否与EC编号相关)。

为了使用Rhea改进酶功能的注释和分类,我们最近引入了一个简单的层次反应分类,其中包括IUBMB的代表性反应以及这些附加反应。此反应分类使用“是一个将“子”反应与其(更通用的)“父”反应联系起来的关系,并允许任何数量的水平,以便以对生物学家有意义的方式对现存和祖先的酶功能进行分类。这可能包括引入介于现有EC水平和当前“压缩”到EC第四水平的相关反应的细粒度分类之间的反应类别。

1说明了使用Rhea反应层次对与酶活性1-磷酸腺苷醛缩酶相关的反应进行分类(酶代码EC4.1.2.27)。IUBMB对该酶的代表性反应是“1-磷酸鞘氨醇=磷酸乙醇胺+棕榈醛”(RHEA:18596),该反应由智人以及其他物种中的同源酶(17). 1-磷酸鞘氨醇是一类磷酸化鞘氨醇碱基的成员,其链长、饱和度和分支都不同。其他相关反应(EC参考列表中未提及())以该类别的其他成员为特征,例如1-磷酸鞘氨醇(18)(RHEA:33510),主要磷酸化鞘氨醇碱智人以及15-甲基十六烷基沥青宁-1-磷酸盐(RHEA:34746)和15-甲基十八烷基沥青宁-1-磷酸盐(RHEA:34722)(19),两个磷酸化鞘氨醇碱秀丽隐杆线虫和假定的底物秀丽线虫SPGL1同源物第1部分.共同的祖先功能智人SPGL1和秀丽隐杆线虫spl-1可概括为“鞘氨醇-1-磷酸裂解酶”,它是“醛解酶”的特化(EC分类的第三级,EC 4.1.2)和“鞘氨酰胺-1-磷酸醛缩酶”的泛化(第四级和最后一级,EC 4.12.27)。因此,这种共同的祖先功能存在在级别之间在大黄中,使用新定义的代谢物“1-磷酸鞘氨醇”(CHEBI:76941)和现有代谢物类别的分组类别,创建了分组反应“1-磷酸类鞘氨醇=脂肪醛+磷酸乙醇胺”(Rhea:40002)。这种分组反应将IUBMB的代表性反应与这些额外的相关反应联系起来。它可以用来注释这个同源群的现存成员以及系统发育树中的祖先功能(20)其精确度高于通用“乙醛裂解酶”注释EC 4.1.2。

Rhea反应分类。IUBMB酶分类(左)描述了对Rhea:18596(蓝色)反应进行催化的酶活性1-磷酸鞘氨醇醛缩酶(酶代码EC4.1.2.27)。该反应以及其他反应,包括Rhea:33510、Rhea:34720和Rhea:34446(粉红色),是更通用的反应Rhea:40002(灰色)的特定形式,位于酶代码EC4.1.2和酶代码EC.4.2.27之间。为了清晰起见,省略了酶。
图1。

Rhea反应分类。IUBMB酶分类(左)描述了对Rhea:18596(蓝色)反应进行催化的酶活性1-磷酸鞘氨醇醛缩酶(酶代码EC4.1.2.27)。该反应以及其他反应,包括Rhea:33510、Rhea:34720和Rhea:34446(粉红色),是更通用的反应Rhea:40002(灰色)的特定形式,位于酶代码EC4.1.2和酶代码EC.4.2.27之间。为了清晰起见,省略了酶。

Rhea反应分类于2016年7月引入。当前版本(2016年7月30日第75版)包含600多个专家策划的反应关系。我们目前正在开发使用ChEBI本体中的策划关系计算遗留数据的反应关系的方法(6)化学结构和反应相似性的计算方法(21——23). 我们预计,随着我们继续检查和验证计算的关系,反应关系的数量在不久的将来会显著增加。

Rhea含量

自上次报告以来,Rhea通过对ChEBI中新化学实体的专家管理和同行评审文献中的反应稳步增长(参见http://www.rhea-db.org/统计信息)。在撰写本文时,Rhea(2016年7月30日第75版)包含9273个独特反应(不考虑方向),涉及8124个独特反应参与者,自上次发布(2014年7月53日发布)以来,增加了2152个独特反应和2094个独特反应参与者。Rhea涵盖了94%以上的EC编号和规定的反应(5124个EC编号中的4794个),并提供了4479个附加反应。这些额外反应中的许多都是为了支持瑞士脂质资源中脂质库的生成(7).

Rhea引用了8905个PubMed唯一标识符,自上次发布以来增加了6142个。策展文献数量的大幅增加是为了将UniProtKB/Swiss-Prot中描述的所有酶活性映射到Rhea(包括IUBMB的代表性反应和其他反应)(见“未来方向”一节)。在此过程中,Rhea馆长审查了UniProtKB/Swiss-Prot的现有文献,并在必要时将其整理到Rhea。

Rhea网站

自上次发布以来,我们开发并部署了一个新网站http://www.rhea-db.org。此网站提供与前一版本相同的交互式和编程访问选项(1). 用户可以从外部交叉引用资源中搜索反应和化合物标识符和名称、EC编号、UniProtKB/Swiss-Prot登录号、书目引用和标识符,网址为http://www.rhea-db.org/advancedsearch反应数据可以在BioPax2中下载(24)、RXN和RD(25)格式位于http://www.rhea-db.org/下载,它还以制表符分隔的形式提供对新引入的反应关系(如上所述)的访问。通过向URL模板添加所需的标识符,可以为单个反应添加书签http://www.rhea-db.org/反应?id=,如本例所示:http://www.rhea-db.org/反应?id=10499BioPax2中的反应数据(24)、RXN(25)和CML反应(26)还可以使用RESTful web服务在http://www.rhea-db.org/webservice.

讨论

UniProt财团将从2017年末/2018年初开始使用Rhea作为UniProtKB中酶活性注释的词汇。为此,我们继续通过专家管理新反应来增加Rhea的报道,包括IUBMB的代表性反应和同行评审文献中描述的其他反应。我们还计划开发一个自动化管道,通过识别和优先排序基因组规模代谢模型MetaNetX资源中的候选反应,帮助Rhea反应管理(10,11). 更直接的发展集中在Rhea数据的新RDF表示上。这将在由Vital-IT基础设施托管的专用SPARQL端点上提供(https://www.vital-it.ch网站/),它当前维护许多SPARQL端点,例如http://sparql.uniprot.org/http://snorql.netprot.org.

鸣谢

作者感谢SIB Swiss-Prot小组的Jerven Bolleman和Sebastien Gehant对许多开发领域的讨论,包括RDF和数据库设计,以及EMBL-EBI网络制作团队的Simone Badoer,他们提供了宝贵的技术援助。我们还要感谢欧洲生物信息研究所的化学信息学和代谢团队在维护和开发ChEBI方面所做的宝贵工作。我们感谢ChemAxon的软件贡献[https://www.chemason.com/products/marvin/].

基金

瑞士联邦政府通过教育、研究和创新国务秘书处(SERI);瑞士系统生物学倡议SystemsX.ch的瑞士脂质项目(部分);欧洲工商管理学院。开放存取费用的资金来源:SERI。

利益冲突声明。未声明。

参考文献

1

摩加特
答:。
,
阿克塞尔森
K.B.公司。
,
伦巴多特
T。
,
阿尔坎塔拉
R。
,
艾莫
L。
,
泽拉拉
M。
,
尼科内贾德
答:。
,
贝尔达
E.公司。
,
海卡·努斯皮克尔
N。
,
Coudert公司
E.公司。
.
Rhea的更新——一种人工策划的生物化学反应资源
.
核酸研究。
2015
;
43
:
D459号
——
D464号
.

2

麦当劳
美国政府。
,
蒂普顿
K.F.公司。
.
酶分类55年:进展与困难
.
FEBS J公司。
2014
;
281
:
583
——
592
.

三。

麦当劳
美国政府。
,
博伊斯
美国。
,
蒂普顿
K.F.公司。
.
ExplorEnz:IUBMB酶列表的主要来源
.
核酸研究。
2009
;
37
:
D593型
——
D597型
.

4

贝罗奇
答:。
.
2000年的ENZYME数据库
.
核酸研究。
2000
;
28
:
304
——
305
.

5

弗莱什曼
答:。
,
达尔索
M。
,
杰格佳连科
英国。
,
弗莱什曼
西。
,
博伊斯
美国。
,
阿克塞尔森
K.B.公司。
,
贝罗奇
答:。
,
朔姆堡
D。
,
蒂普顿
K.F.公司。
,
阿普维勒
R。
.
IntEnz,集成的关系型酶数据库
.
核酸研究。
2004
;
32
:
D434号
——
D437号
.

6

黑斯廷斯
J。
,
欧文
G.公司。
,
德克尔
答:。
,
埃尼斯
M。
,
卡莱
N。
,
穆图克里希南
五、。
,
特纳
美国。
,
斯温斯顿
N。
,
门德斯
第页。
,
斯坦贝克
C、。
.
2016年中国循证医学研究院:改进服务和扩大代谢物收集
.
核酸研究。
2016
;
44
:
D1214号
——
D1219号
.

7

艾莫
L。
,
利希蒂
R。
,
海卡·努斯皮克尔
N。
,
尼科内贾德
答:。
,
格莱兹
答:。
,
戈茨
L。
,
库兹涅佐夫
D。
,
大卫
F.P.公司。
,
范德古特
F.G.公司。
,
雷兹曼
H。
.
瑞士脂质生物学知识库
.
生物信息学
.
2015
;
31
:
2860
——
2866
.

8

阿尔坎塔拉
R。
,
Onwubiko公司
J。
,
H。
,
马托斯
第页。
,
查姆
J.A.公司。
,
雅各布森
J。
,
霍利迪
G.L.公司。
,
费希尔
J.D.(医学博士)。
,
拉赫曼
美国。
,
贾萨尔
B。
.
EBI酶门户
.
核酸研究。
2013
;
41
:
D773号
——
D780型
.

9

豪格
英国。
,
萨拉克
相对湿度。
,
科内萨
第页。
,
黑斯廷斯
J。
,
德马托斯
第页。
,
Rijnbeek公司
M。
,
马亨德拉克
T。
,
威廉姆斯
M。
,
诺依曼
美国。
,
罗卡·塞拉
第页。
.
MetaboLights-代谢组学研究和相关元数据的开放存取通用存储库
.
核酸研究。
2013
;
41
:
D781型
——
D786型
.

10

莫雷蒂
美国。
,
马丁
O。
,
范杜Tran
T。
,
答:。
,
摩加特
答:。
,
帕尼
M。
.
MetaNetX/MNXref重新调节代谢物和生化反应,以整合基因组规模的代谢网络
.
核酸研究。
2016
;
44
:
D523型
——
D526型
.

11

伯纳德
T。
,
答:。
,
摩加特
答:。
,
莫雷蒂
美国。
,
塞纳里奥斯
一、。
,
帕尼
M。
.
代谢网络中代谢物和生化反应的协调
.
简要生物信息。
2014
;
15
:
123
——
135
.

12

瓦伦内
D。
,
贝尔达
E.公司。
,
卡尔托
答:。
,
克吕韦耶
美国。
,
恩赫伦
美国。
,
拉瑞
答:。
,
勒费维尔
F、。
,
朗金
C、。
,
莫尼科
D。
,
罗氏公司
D。
.
显微镜–用于基因组和代谢数据的管理和比较分析的集成微生物资源
.
核酸研究。
2013
;
41
:
第636页
——
D647号
.

13

卡内希萨
M。
,
佐藤
年。
,
川岛
M。
,
古道
M。
,
塔纳比
M。
.
KEGG作为基因和蛋白质注释的参考资源
.
核酸研究。
2016
;
44
:
D457号
——
D462号
.

14

卡斯皮
R。
,
比林顿
R。
,
费雷尔
L。
,
福斯特
H。
,
富尔彻
首席执行官。
,
凯斯勒
腹腔注射。
,
科塔里
答:。
,
克鲁梅纳克
M。
,
拉丁德斯
M。
,
米勒
洛杉矶。
.
代谢途径和酶的MetaCyc数据库以及途径/基因组数据库的BioCyc集合
.
核酸研究。
2016
;
44
:
D471号
——
D480型
.

15

法夫雷加特
答:。
,
西迪罗普洛斯
英国。
,
加拉帕蒂
第页。
,
吉莱斯皮
M。
,
豪斯曼
英国。
,
唧唧
R。
,
贾萨尔
B。
,
朱佩
美国。
,
科宁格
F、。
,
麦凯
美国。
.
反应途径知识库
.
核酸研究。
2016
;
44
:
D481号
——
D487号
.

16

阿尔坎塔拉
R。
,
阿克塞尔森
K.B.公司。
,
莫尔加特
答:。
,
贝尔达
E.公司。
,
考德特
E.公司。
,
答:。
,
H。
,
德马托斯
第页。
,
埃尼斯
M。
,
特纳
美国。
.
Rhea–一种人工管理的生化反应资源
.
核酸研究。
2012
;
40
:
D754号
——
D760型
.

17

赖斯
美国。
,
奥斯库阶
B。
,
J。
,
古普塔
五、。
,
Sooriyakumaran公司
第页。
,
凯莉
美国。
,
E.公司。
,
美林
A.H.公司。
年少者
,
萨巴
J.D.(医学博士)。
.
鞘氨醇磷酸裂解酶增强应激诱导的神经酰胺生成和凋亡
.
生物学杂志。化学。
2004
;
279
:
1281
——
1290
.

18

布里苏埃拉
L。
,
阿德尔
一、。
,
马泽罗莱斯
C、。
,
博奎特
M。
,
马拉沃
B。
,
屈维利耶
O。
.
人类肿瘤中鞘氨醇1-磷酸裂解酶蛋白表达和活性下调的首次证据:前列腺癌耐药的意义
.
摩尔癌症治疗。
2012
;
11
:
1841
——
1851
.

19

孟德尔
J。
,
海涅克
英国。
,
费斯特
H。
,
萨巴
J.D.(医学博士)。
.
鞘氨醇磷酸裂解酶的表达对秀丽隐杆线虫的正常发育至关重要
.
生物学杂志。化学。
2003
;
278
:
22341
——
22349
.

20

高德特
第页。
,
锂铁矿
医学硕士。
,
刘易斯
瑞典。
,
托马斯
P.D.公司。
.
基因本体联盟中基于系统发育的功能注释传播
.
简要生物信息。
2011
;
12
:
449
——
462
.

21

拉赫曼
美国。
,
托伦斯
G.公司。
,
巴尔达奇
L。
,
马丁内斯·库斯塔
美国。
,
芬宁格
F、。
,
戈帕尔
N。
,
乔杜里
美国。
,
五月
J.W.公司。
,
霍利迪
G.L.公司。
,
斯坦贝克
C、。
.
反应解码器工具(RDT):从化学反应中提取特征
.
生物信息学
.
2016
;
32
:
2065
——
2066
.

22

Giri公司
五、。
,
西瓦库马
电视。
,
K.M.公司。
,
基姆
时间。
,
巴杜里
答:。
.
RxnSim:比较生化反应的工具
.
生物信息学
.
2015
;
31
:
3712
——
3714
.

23

拉赫曼
美国。
,
库斯塔
S.M.公司。
,
弗纳姆
N。
,
霍利迪
G.L.公司。
,
桑顿
J.M.公司。
.
EC-BLAST:自动搜索和比较酶反应的工具
.
自然方法
.
2014
;
11
:
171
——
174
.

24

杰米尔
E.公司。
,
卡里
M.P.(医学博士)。
,
佩利
美国。
,
福田
英国。
,
莱默
C、。
,
瓦斯特里克
一、。
,
G.公司。
,
德尤斯塔奇
第页。
,
谢弗
C、。
,
卢西亚诺
J。
.
路径数据共享的BioPAX社区标准
.
自然生物技术。
2010
;
28
:
935
——
942
.

25

达尔比
答:。
,
努斯语
J.G.公司。
,
Hounshell公司
W.D.公司。
,
古斯赫斯特
A.K.I.公司。
,
格里尔
D.L.公司。
,
利兰
文学学士。
,
劳弗
J。
.
分子设计有限公司开发的计算机程序使用的几种化学结构文件格式的说明
.
化学杂志。通知。计算。科学。
1992
;
32
:
244
——
255
.

26

霍利迪
G.L.公司。
,
穆雷-鲁斯特
第页。
,
热帕
H.S.公司。
.
化学标记、XML和万维网。CMLReact,一个用于化学反应的XML词汇表
.
化学杂志。信息模型
.
2006
;
46
:
145
——
157
.

这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/4.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。

评论

0条评论
提交评论
您输入了无效代码
感谢您对本文发表评论。您的评论将由期刊自行审核和发表。请通过电子邮件查看更多通知。