KEGG标记语言

KEGG标记语言(KGML)是KEGG图形对象的交换格式,尤其是手动绘制和更新的KEGG路径图。KGML能够自动绘制KEGG途径,并为蛋白质网络和化学网络的计算分析和建模提供便利。

背景

KEGG通路图是表示负责特定细胞功能的相互作用分子网络的图形图像地图。KEGG途径有两种类型:

KGML文件包含有关图形对象及其在KEGG路径中的关系的计算机化信息,以及有关KEGG基因数据库中同源基因分配的信息。

在KGML中通路元素使用进入元素作为其节点关系反应元素作为其边。关系和反应元素分别表示KEGG通路中矩形(基因产物)的连接模式和圆形(化合物)的连接方式。由入口和关系元素组成的图对象和由入口和反应元素构成的图对象分别称为蛋白质网络和化学网络。由于代谢途径可以被视为蛋白质(酶)网络和化合物网络,KEGG途径的另一个区别是:

概述

下图显示了KGML的概述。

路径元素是根元素,在KGML中为一个路径图指定了一个路径元素。条目、关系和反应元素指定图形信息,其他元素用于指定有关图形节点和边的更详细信息。

通路

通路元件

pathway元素指定存储在KEGG路径图中的图形信息。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
名称 凯吉德类型 该路径图的KEGGID 必修的
组织 地图组织类型 ko/ec/[org前缀] 必修的
地图编号.类型 该路径图的图号 必修的
标题 字符串类型 该路径图的标题 暗指的
形象 url类型 该路径图图像文件的资源位置 暗指的
链接 url类型 该路径图信息的资源位置 暗指的
name属性

name属性包含此路径图的KEGG标识符。

属性值 解释
路径:ko*****
路径:[组织前缀]*****
该路径图的KEGGID
例如)
name=“路径:ko00010”
name=“path:hsa00010”

此处*****表示路径图编号,[org prefix]是KEGG中三位字母的物种代码。

org属性

org属性指定此路径图的分类。根据属性值区分不同生物体的参考路径和路径。

属性值 解释
让开 KO标识符表示的参考路径图
电子商务 ENZYME标识符表示的参考路径图
[组织前缀] “org”的有机体特定路径图
数字属性

number属性指定五位数的路径映射编号。

属性值 解释
五位数整数 ex)编号=“00030”
title属性

title属性指定此路径映射的标题。

属性值 解释
一串 ex)title=“戊糖磷酸途径”
图像属性

image属性指定KEGG Web服务中此路径映射的图像文件的资源位置。

属性值 解释
统一资源定位地址 例如)image=“http://www.kegg.jp/kegg/pathway/ko/ko00010.png"
链接属性

link属性指定KEGG Web服务中有关此路径图的信息的资源位置。

属性值 解释
统一资源定位地址 ex)链接=“http://www.kegg.jp/kegg-bin/show_pathway?ko00010"

入口

入口元素

entry元素包含有关路径节点的信息。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
身份证件 id类型 路径图中此条目的ID 必修的
名称 凯吉德类型 此条目的KEGGID 必修的
类型 条目类型类型 此条目的类型 必修的
链接 url类型 有关此条目的信息的资源位置 暗指的
反应 keggid类型 相应反应的KEGGID 暗指的
id属性

id属性指定此条目的标识号。pathway元素中的每个entry元素都是根据这个id属性值唯一指定的。

属性值 解释
正整数 此条目的标识号
name属性

name属性包含该条目的KEGG标识符,其格式通常为db:accession,其中db是数据库名称,accession是登录号。

属性值 解释
路径:(加入) 路径图
例如)name=“path:map00040”
ko:(加入) KO(正交组)
ex)name=“ko:E3.1.4.11”
欧共体:(加入)
例如)name=“ec:1.1.3.5”
rn:(加入) 反应
例如)name=“rn:R00120”
cpd:(加入) 化合物
例如)name=“cpd:C01243”
gl:(加入) 聚糖
例如)name=“gl:G00166”
[组织前缀]:(加入) 特定生物体的基因产物
例如)name=“eco:b1207”
组:(加入) KO综合体
如果加入未定义,则指定“未定义”。
例如)name=“group:ORC”
type属性

type属性指定此条目的类型。请注意,当路径映射链接到另一个映射时,链接的路径映射被视为节点,即KEGG Web服务中的可单击图形对象(圆形矩形)。

属性值 解释
正交曲线 该节点是一个KO(正交群)
节点是一种酶
反应 节点是一个反应
基因 节点是一种基因产物(主要是一种蛋白质)
节点是基因产物的复合体(主要是蛋白质复合体)
复合 节点是一种化合物(包括聚糖)
地图 节点是一个链接的路径图
英国人 节点是链接的brite层次结构
其他 节点是未分类类型
链接属性

link属性指定KEGG Web服务中有关此条目的信息的资源位置。在有机体特定路径中,如果有机体没有条目(基因),则不定义该属性。

属性值 解释
统一资源定位地址 ex)链接=“http://www.kegg.jp/dbget-bin/www_bget?eco网站+b1207英寸
反应属性

反应属性指定KEGG LIGAND数据库中相应化学反应的KEGGID。

属性值 解释
rn:(加入) ex)反应=“rn:R02749”

图形元素

图形元素是entry元素的子元素,指定有关图形对象的图形信息。

属性名称 数据类型 解释 要求/暗示
名称 字符串类型 此图形对象的标签 暗指的
x个 数字.类型 此图形对象的X轴位置 暗指的
数字.类型 此图形对象的Y轴位置 暗指的
坐标 字符串类型 折线坐标 暗指的
类型 图形.类型 此图形对象的形状 暗指的
宽度 数字.类型 此图形对象的宽度 暗指的
高度 数字.类型 此图形对象的高度 暗指的
fgcolor(荧光粉颜色) graphics-颜色.type 此图形对象使用的前景色 暗指的
bgcolor(背景色) graphics-颜色.type 此图形对象使用的背景色 暗指的
name属性

name属性包含与此图形对象关联的标签。当在同一个条目元素中指定两个或多个名称属性时,将第一个属性作为属性值。当entry元素的type属性值为“gene”时,为该属性值指定基因名称。

属性值 解释
一串 此图形对象的标签
例如)
name=“1.1.1.43”
name=“甲烷代谢”
x属性

x属性指定手动绘制的KEGG路径地图中此图形对象的x坐标值。

属性值 解释
正整数 x=“190”
y属性

y属性指定手动绘制的KEGG路径地图中此图形对象的y坐标值。

属性值 解释
正整数 例如)y=“51”
坐标属性

coords属性指定一组坐标,x1,y1,x2,y2,。。。,对于line对象。

属性值 解释
一串 ex)坐标=“573729573779”
type属性

type属性指定此对象的形状。默认值为“矩形”。

属性值 解释
矩形 形状是一个矩形,用于表示基因产物及其复合体(包括直系群)。
圆圈 形状是一个圆形,用于指定任何其他分子,如化合物和聚糖。
圆形矩形 形状是一个圆形矩形,用于表示链接的路径。
线 形状是一条多段线,用于表示反应或关系(以及基因或直系群)。
宽度属性

width属性指定此对象的宽度。默认值为“45”。

属性值 解释
正整数 例如)宽度=“73”
高度属性

height属性指定此对象的高度。默认值为“17”。

属性值 解释
正整数 ex)高度=“34”
fgcolor属性

fgcolor属性指定此对象的前景色。它适用于帧和字符串。默认值为“#000000”。

属性值 解释
数字RGB 例如)fgcolor=“#000000”
bgcolor属性

bgcolor属性指定此对象的背景色。默认值为“#FFFFFF”。基因产物的背景色为“#BFFFBF”。

属性值 解释
数字RGB 例如)fgcolor=“#BFFFBF”

组件元素

组件元素是entry元素的子元素,当entry元素是复杂节点时使用;即,当entry元素的type属性值为“group”时。构成复合体的节点由循环调用指定。例如,当复合体由两个节点组成时,将指定两个组件元素。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
身份证件 idref.类型 作为复合体一部分的组件的ID 必修的
id属性

id属性指定此组件的标识号。“group”类型的条目元素由一组完整的组件元素指定。

属性值 解释
正整数 该部件的识别号

关系

关系元素

关系元素指定了两个蛋白质(基因产物)或两个KO(直系群)或蛋白质和化合物之间的关系,由连接KEGG路径中两个节点的箭头或线表示。关系元素有一个子元素,名为subject元素。当子类型元素的name属性值是具有方向性(如“activation”)的值时,交互的方向是从entry1到entry2。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
条目1 idref.类型 定义此关系的第一个(from)条目 必修的
条目2 idref.类型 定义此关系的第二个(到)条目 必修的
类型 关系类型类型 此关系的类型 必修的
entry1属性

entry1属性指定第一个entry元素的id属性值。

属性值 解释
正整数 参与此关系的节点的ID
entry2属性

entry2属性指定第二个entry元素的id属性值。

属性值 解释
正整数 参与此关系的节点的ID
type属性

type属性指定了三种类型的关系中的一种,即KEGG中的广义蛋白质相互作用,以及用于蛋白质和化合物之间相互作用的额外PCrel,以及用于蛋白和映射之间链接的maplink。maplink关系用于指定映射中的蛋白质与另一个蛋白质之间的相互作用。

属性值 解释
ECrel公司 酶-酶关系,表明两种酶催化连续反应步骤
PPrel公司 蛋白质相互作用,如结合和修饰
GErel公司 基因表达相互作用,指示转录因子与靶基因产物的关系
PCrel公司 蛋白质-化合物相互作用
地图链接 链接到其他地图

子类型元素

子类型元素指定有关交互或关系性质的更详细信息。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
名称 子类型名称类型 互动/关系信息 必修的
价值 子类型值类型 交互/关系属性值 必修的
名称和值属性

name属性指定了三种类型的广义蛋白质相互作用中的每一种的子类别和/或附加信息。关系元素的类型属性(ECrel、PPrel或GErel)与子类型元素的名称和值属性之间的对应关系如下所示。

名称 价值 ECrel公司 PPrel公司 GErel公司 解释
复合 复合的入口元素id属性值。 * * 与两个连续反应(ECrel)或两个相互作用蛋白的中间体(PPrel)共享
隐藏化合物 隐藏化合物的条目元素id属性值。 * 与两个连续反应共享,但未显示在路径图中
激活 --> * 可能与以下分子信息相关的积极和消极影响
抑制 --| *
表达 --> * 通过DNA结合的相互作用
压制 --| *
间接影响 ..> * * 无分子细节的间接效应
状态更改 ... * 状态转换
绑定/关联 --- * 联想与分离
离解 -+- *
缺少交互作用 -/- * * 由于突变等而缺失相互作用。
磷酸化 +第页 * 分子事件
去磷酸化 -第页 *
糖基化 +克 *
泛素化 +u个 *
甲基化 +米 *

反应

反应元件

反应元素规定了底物和产品之间的化学反应,用KEGG路径中连接两个圆圈的箭头表示。反应元素具有底物元素和产物元素作为子元素。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
身份证件 idref.类型 此反应的ID 必修的
名称 keggid类型 该反应的KEGGID 必修的
类型 反应类型.类型 这种反应的类型 必修的
id属性

id属性指定此反应的标识号。

属性值 解释
正整数 该反应的识别号
name属性

name属性包含REACTION数据库的KEGG标识符。

属性值 解释
rn:(加入) ex)反应=“rn:R02749”
type属性

type属性指定可逆和不可逆反应的区别,这由KEGG路径中的双向和单向箭头指示。注意,术语“可逆”和“不可逆”并不一定反映每个反应的生化特性。它们只是指示从教科书和文献中提取的路径图上绘制的反应方向。

属性值 解释
可逆的 可逆反应
不可逆的 不可逆反应

基板元件

底物元素指定此反应的底物节点。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
身份证件 idref.类型 此基板的ID 必修的
名称 凯吉德类型 基板节点的KEGGID 必修的
id属性

id属性指定此基板的标识号。

属性值 解释
正整数 这个基板的识别号
name属性

name属性包含COMPUND数据库或GLYCAN数据库的KEGG标识符。

属性值 解释
cpd:(加入)
gl:(加入)
出厂价:C05378
编号:G00037

产品元素

product元素指定此反应的product节点。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
身份证件 idref.类型 此产品的ID 必修的
名称 keggid类型 产品节点的KEGGID 必修的
id属性

id属性指定此产品的标识号。

属性值 解释
正整数 此产品的标识号
name属性

name属性包含COMPUND数据库或GLYCAN数据库的KEGG标识符。

属性值 解释
cpd:(加入)
gl:(加入)
例如)cpd:C05378
编号:G00037

alt元素

alt元素指定其父元素的可选名称。该元素的属性如下。

属性名称 数据类型 解释 要求/暗示
名称 凯吉德类型 节点的KEGGID 必修的
name属性

name属性包含COMPUND数据库或GLYCAN数据库的KEGG标识符。

属性值 解释
cpd:(加入)
gl:(加入)
例如)cpd:C05378
编号:G00037

访问方法

每个KGML文件都可以通过KEGG API获得(仅限学术用户)。

拥有KEGG FTP订阅的学术用户可以获得整套KGML文件。

非学术用户需要获得许可协议。请参阅以下页面。

发布历史记录

KGML v0.7.2
2016年8月29日发布
--------------------------------------------------------------------------------
KGML v0.7.1
2010年4月1日发布
--------------------------------------------------------------------------------
KGML v0.7
2009年10月1日发布
--------------------------------------------------------------------------------
KGML v0.6.1
2006年4月25日发布
--------------------------------------------------------------------------------
KGML v0.6
2005年3月1日发布
--------------------------------------------------------------------------------
KGML v0.5
2004年12月10日发布
--------------------------------------------------------------------------------
KGML v0.4
2004年4月1日发布
--------------------------------------------------------------------------------
KGML v0.3
2003年10月1日发布
--------------------------------------------------------------------------------
KGML版本0.2
2003年4月1日发布
--------------------------------------------------------------------------------
KGML v0.1
发布日期:2003年1月1日
-------------------------------------------------------------------------------