跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
分子细胞蛋白质组学。2015年4月;14(4): 1137–1147.
2015年2月3日在线发布。 数字对象标识:10.1074/mcp。O114.042259号
预防性维修识别码:PMC4390258型
PMID:25648531

xiNET:具有残差分辨率的交叉链接网络图*

摘要

xiNET是用于探索交联/质谱结果的可视化工具。它生成的交叉链接网络的交互式地图是一种节点链接图。在这些图谱中,xiNET显示:(1)残基解析位置信息,包括连接位点和连接肽;(2) 各类交联反应产物;(3) 模糊结果;以及,(4)额外的序列信息,例如域。xiNET在浏览器中运行,并导出矢量图形,这些图形可以在通用绘图包中编辑,以创建出版物质量的图形。可用性:xiNET是开源的,根据Apache版本2许可证发布。可以通过将数据上传到来查看结果http://crosslinkviewer.org/或从下载软件http://github.com/colin-combe/crosslink-viewer并在本地运行。

交联/质谱(CLMS)1揭示了大型多蛋白复合物中的蛋白质-蛋白质相互作用(1),小型网络(2)和复杂混合物(). 当观察到交联时,它们定义了一对在空间上很近的残基,这样不仅揭示了相互作用蛋白质的身份,而且还确定了相互作用区域或结构域及其方向。CLMS研究的一个共同特征是识别许多单独的交联,这些交联累积支持域级特征的存在。如果查看大量CLMS数据,则很难在剩余距离约束网络和域级特征之间建立这种连接。可视化分析突出蛋白质序列中的交联簇非常有用。正如我们将看到的(“节点布局”),并非所有网络可视化都允许这样做。

网络可视化有两种类型:节点链接图和邻接矩阵。每种方法都有其优点和缺点。节点链接图保留了网络的局部细节,但伸缩性不好。相邻矩阵避免了使大型节点链接图不可读的边交叉,但使理解非直接连接节点之间的关系变得困难(4). 西巴赫等。(5)显示作为邻接矩阵可视化的CLMS数据。在这里,我们将重点放在将CLMS数据可视化为节点链接图,并介绍xiNET,这是一个专门为使用CLMS数据而设计的网络可视化工具。

类似软件

2010年,Gehlenborg等。(6)综述了系统生物学中用于“组学”数据的最新可视化工具。他们首先指出,所有这些工具都由相同的主要视觉隐喻控制:以节点链接图显示的图形。他们的综述本质上是对节点链接图在生物学中的应用的综述。他们继续确定两大类部分重叠的可视化工具——路径工具和网络工具。路径工具显示一个图形,表示状态随时间的变化;网络工具显示的图形不一定包含状态更改信息。

CLMS可以提供蛋白质内构象变化的数据,因此状态变化是该数据的一个方面。然而,我们将通过专注于不代表状态变化的网络工具来缩小我们在这里的关注范围。格伦堡等。提出了与三种主要类型的高通量实验相对应的网络工具的第二分类。这些类别包括:用于研究蛋白质相互作用的工具、用于研究基因表达谱的工具和用于研究代谢谱的工具。他们列出了27个专门用于研究蛋白质相互作用网络的软件包,该列表自2010年以来一直在增长。在这27个人中,他们推荐两个细胞扫描(7)和大脑(8).

CytoScape可能是生物学中最流行的网络可视化工具。CytoScape软件提供了一个插件架构,允许扩展和定制。例如,可以添加新的节点布局算法。Cerebral是一个CytoScape插件,它使用额外的注释信息,特别是亚细胞位置,来指导节点的布局。其目的是生成更接近于“传统”信号通路/系统图的相互作用网络图,其中细胞外蛋白和膜受体位于页面顶部,向下穿过细胞质中的适配器蛋白,核蛋白和路径调控基因位于底部。

在生物学中,节点链接图通常使用节点来表示整个分子(4). Gehlenborg中关于蛋白质-蛋白质相互作用工具的大部分讨论等。2010年的综述侧重于根据分子组成的高阶结构(络合物和络合物群)来排列代表分子的节点。与此相关的是显示层次图的方法,其中表示单个分子的节点可以折叠成表示更高阶分组的单个元节点。这种软件的一个例子是Visant(9).

在讨论组学数据网络可视化的未来方向时,Gehlenborg等。重点介绍了大型网络的改进导航方法、基于web的工具的趋势以及数据格式标准化的需要。PSI-MI标准(10)强调了交互数据的标准化。然而,在他们的综述中没有讨论过将分子级节点分解成更小的部分。

将整个生物分子表示为节点的另一种方法是使用不同的节点来表示不同的残基,并且有工具可以做到这一点。它经常出现在来自蛋白质数据库(PDB)的残基相互作用网络(RIN)分析工具中(11)模型。RINalyzer公司(12)就是这样一个工具的例子。它用于分析构象变化(例如,突变导致的构象变化),或在观察长程残基关系(信息通过结构的路径,例如变构效应)。RINalyzer使用三维PDB模型指导二维网络图中节点的布局。尽管晶体结构或模型在CLMS数据的背景下是有趣的,但对于大多数蛋白质,我们不持有这样的数据,事实上大约三分之一的序列空间是非结构化的。RINalyzer目前无法导入其他类型的数据,如交联。同样,RINalyzer是作为CytoScape插件实现的。与RINalyzer大致相当的是RING(13)它还从PDB文件生成RIN,并通过CytoScape插件将其可视化。RING缺乏RINalyzer使用PDB模型指导CytoScape中节点布局的能力。我们发现值得一提的第三个RIN工具是ResMap(14). ResMap不是一个CytoScape插件,而是一个独立的应用程序,它沿着代表蛋白质序列(或其部分)的轴显示相互作用的残基。然而,ResMap仅允许可视化PDB模型的任意两个子单元之间的交互(即,它只能显示两个轴),因此受到了限制。

这些RIN工具与我们可视化CLMS数据的需求最为相似,因为CLMS数据提供的是一个相互作用残基网络。抛开将CLMS数据导入现有RIN工具的实际问题不谈,这些工具仍然不能满足我们对这些数据可视化的需求。为了理解原因,有必要更详细地研究节点布局问题。

节点布局

我们注意到,CLMS数据的一个典型生物用例正在从许多单独确定的交联中得出关于域级特征的结论。CLMS实验的剩余距离约束形成了一个无向图,并且有许多可用的二维网络可视化工具可以用于显示这种图。然而,可视化有特定的要求,可以看到蛋白质序列中的连锁残基簇,从而解释域级特征的位置。

如图所示图1,其中显示了相同CLMS数据的六个节点链接表示。为了简单起见,我们只使用这个数据集中的蛋白质间交联,忽略了自链接(链接回同一类型的蛋白质)。数据来自陈等。(1)研究了RNA聚合酶II-TFIIF复合物的结构。对他们的结论至关重要的是,CLMS证明了Tfg1和Tgf2之间的二聚结构域的位置。

保存图片、插图等的外部文件。对象名称为zjw0041550060001.jpg

相同CLMS数据的六个不同节点链路图。数据来自Chen等人。(1),一个,是该论文的摘录,旨在展示CLMS证据如何支持Tfg1和Tfg2之间的二聚化结构域的定位。B–F,显示使用D3生成的可选节点连接图(仅蛋白质间连接)(20).B类,显示了节点链接图在生物学中的典型用法,其中节点表示整个分子(线宽用于表示链接的数量)。C类,使用不同的节点表示链接的残基,这是RIN工具(如RINalyzer)的典型特征(12). 在缺乏其他信息指导布局的情况下,C类,使用强制定向布局。D类,试图通过将节点排列在圆形周围来给布局带来一些秩序。电子,同样使用圆形布局,但这一次节点在周长上的位置是由链接残基在蛋白质序列中的位置决定的。F类,显示HivePlot(16)其中类别(轴)代表三种蛋白质中的每一种,沿着轴的距离由序列中的残基位置决定。一个电子F类成功地将单个交叉链接与域级功能联系起来:B类C类、和D类不要。为了实现这种关联,有必要使用连接残基在整个蛋白质序列中的位置来指导节点的位置。

图1A是陈纸张。其目的是以图形方式描述这些区域位置的证据。这是一种节点连接图,它将蛋白质序列表示为带编号的条,将交联表示为沿着这些条的点结束的线。然而,还有许多其他可能的节点排列方式,其中一些将实现类似于图1一个.

图1B类以生物学中最常见的方式显示了TFIIF的CLMS数据,节点代表整个分子。不出所料,它完全无法描述蛋白质序列中二聚体结构域的位置,因为缺少残余水平信息。然而,有交叉研究确实以这种方式可视化了其结果(215). 出于某些目的,在这个抽象级别上可视化数据是合适的。CLMS数据面临的一个特殊挑战是存在两个层次的信息关联残基和关联蛋白,因为两者都可能是图中的节点。

将整个生物分子表示为节点的另一种方法是使用不同的节点来表示不同的残基,如RINalyzer和RING中所示。图1C类以这种样式显示了我们的示例TFIIF CLMS数据。每个链接残基是一个单独的节点,但没有用于指导节点布局的PDB模型(如RINalyzer所使用的)。这无助于指示蛋白质序列中二聚体结构域的位置。这种方法不能很好地工作的部分原因是,源于当前交联数据的残基网络的连接密度远低于源于PDB数据的网络。

一般来说,图1C类由于节点在无意义的坐标空间中的任意定位而失败(16). 除了缩放问题外,这是节点链接图中另一个众所周知的问题,节点的位置极大地影响了数据的感知方式(4). 节点的位置图1C类可以进行更改,以达到与图1一个,通知我们域的位置。要做到这一点,用于定位节点的函数必须考虑它们在整个蛋白质序列上下文中表示的链接残基。要查看此信息,请比较图1D类图1电子。两者都将链接的剩余节点排列在一个圆上,但仅图1电子是关于蛋白质序列中连接的位置的信息。定位节点时,图1电子考虑它们在整个蛋白质序列中的位置,而图1D类没有。

图1F类显示HivePlot(16)TFIIF数据。它符合在安排节点时使用整个蛋白质序列中链接残基的位置的标准。因此,它成功地将CLMS证据与蛋白质内二聚结构域的位置联系起来。在HivePlot中,轴是节点的类别;在里面图1F类这些类别代表数据中包含的三种蛋白质,沿着每个轴的位置的排序函数基于序列中的残基位置。当有三个以上的类别(即三个以上轴,或者在我们的具体例子中,三个以上蛋白质)时,HivePlot工作得不太好。

像ResMap那样,沿着代表蛋白质序列的轴排列链接残基(尽管ResMap仅限于显示两个亚基之间的相互作用),是我们发现对CLMS数据有用的可视化模式。图1一个,陈的摘录et(等)al.(1),可以被认为是HivePlot(如上所述构造),但轴会四处移动和旋转。

xiNET的优点

在这里,我们介绍了xiNET,它是一个自动工具,用于生成节点链接图的“编号栏”样式的交互版本(参见图1一个). 例如,这种编号的条形布局经常在CLMS论文中使用(1171819). 这并不是可视化此数据的唯一方法,它可以显示许多交叉链接如何支持域级功能的位置。还有其他方法,其中一些可以实现为CytoScape插件。然而,编号条方法在视觉上很简洁,不需要为每个链接的剩余节点使用不同的符号,并且允许轴的相对定位具有灵活性。这些图表使用这种灵活性来强调紧密相连的区域。

通过显示整个蛋白质序列上下文中的链接残基,xiNET解决了使用CLMS数据时的一个重要生物学用途。然而,除此之外,xiNET还有其他功能,可以帮助提高科学理解。

xiNET表示不明确的交叉链接。例如,如果已识别的交联肽属于搜索空间中的多个蛋白质,则可能会出现关于链接位点的模糊。这种模棱两可的链接可能包含潜在的重要结构信息,但如果没有明确表示,可能会造成混淆或误导。

xiNET还代表并区分了所有交联产品类型。除了交联肽外,交联反应还产生连接剂修饰的肽和内部连接的肽。所有三种产品类型都包含结构信息。连接蛋白修饰肽的位置(“蛋白质涂布”)显示了蛋白质的哪些区域是溶剂可及的。如果预期区域中缺少连接物修饰肽,则表明表面被遮挡。内部连接的肽提供了进一步的残基距离限制,然而,这些连接的结构重要性不同于交联肽,因此应在可视化中加以区分。已知内部连接的肽来自分子内交联。大多数两种肽都来自同一蛋白质的交联肽可以是分子内或分子间的。然而,有一部分交联肽在蛋白质序列中重叠,这些肽被称为分子间肽。xiNET还区分了这些链接——只能从同源多聚体衍生的自链接。

CLMS论文中数字条表示法流行的另一个原因是,它允许在其他剩余分辨率序列信息(如域)的上下文中显示链接。xiNET自动检索此类注释(或者可以手动指定)并将其合并到图表中。这些进一步的上下文信息有助于假设生成。

我们注意到,节点表示整个分子的节点链接图也是CLMS数据的常见网络表示,并且这种抽象级别可能适用于某些目的。xiNET允许将这两种形式混合在一起:数据可以折叠到蛋白质级别(一个节点代表整个蛋白质),也可以展开以显示沿着编号条的链接残基。这允许用户选择以或多或少的细节显示网络的哪些部分。

所有这些前面的功能都在结果部分中进行了演示。最后,xiNET促进了CLMS数据的通信。它通过基于网络、易于共享交互式图形以及提供可用于创建出版物质量图形的矢量图形输出来实现这一点。这种增强的交流本身可以帮助促进科学理解。

实施

xiNET是用JavaScript编写的,并在网页中操作可缩放向量图形(SVG)元素。嵌入在网页中的交互式地图可以很容易地共享。SVG输出可以在常见的矢量绘图包(如Inkscape或Illustrator)中编辑。

我们使用了D3.js(20)作为一个实用程序库,用于满足常见的可视化需求,例如颜色方案。xiNET代码具有面向对象的设计,以下对象类型构成了模型:Match(表示匹配的频谱);残基链接(一对残基之间所有匹配的聚合);蛋白质链(两种蛋白质之间所有残基链的聚合);和蛋白质。

图2提供了xiNET工作流的概述。交联图的输入数据集为:交联数据;蛋白质序列数据;以及注释数据(可选)。如果UniProtKB,则可以省略序列数据(21)登录号用作蛋白质标识符,在这种情况下,将使用UniProt提供的网络服务自动检索蛋白质序列1。如果使用UniProtKB登录号,则还将从此web服务和SuperFamily检索注释数据(22)分布式注释系统(23)服务器2一旦数据被加载到xiNET中,就可以交互式地探索CLMS网络,并且可以导出矢量图形以用于图形。

保存图片、插图等的外部文件。对象名称为zjw004155006002.jpg

xiNET工作流概述。三个数据集构成xiNET映射的输入:交叉链接数据(必需);蛋白质序列数据(如果使用UniProtKB登录号,则可以省略);和注释数据(可选,如果UniProtKB登录号用于蛋白质标识符,则会自动下载)。可以通过网络共享交互式地图或将其导出为矢量图形来传播结果,矢量图形可以编辑以用于出版物。

通过将数据上传到我们的网站或下载软件并在本地运行,可以将数据加载到xiNET中。下面的结果部分中包含的案例研究中给出了这两种用法的分步示例。当在本地使用时,xiNET不会通过网络传输用户的任何数据。因此,将xiNET集成到其工作流中的实验室可以保留对所有使用的数据以及是否或何时公开数据的控制。

要将xiNET用作web服务,需要将数据文件上载到http://crosslinkviewer.org/upload.html,(此处给出了文件格式的完整说明和详细信息)。用户被重定向到显示其数据的唯一URL。然后,共享交互式图形就像共享URL一样简单。

CLMS数据的xiNET输入文件格式是逗号分隔值(CSV)文件。我们将xiNET使用的特定CSV格式称为“CLMS-CSV”http://crosslinkviewer.org/upload.html#CLMS-CSV公司。它遵循数据表的结构,通常在交联纸附带的补充信息中找到,例如参见(1219). 它也类似于Xlink:DB的制表符分隔的输入格式(24)和XQuest的输出格式(25). CSV文件是当前的事实上的CLMS数据的标准和不同的文件格式可以很容易地相互转换。然而,所有这些和类似工具的符合标准的输入和输出将是PSI-MI(10)我们正在努力使用这种输入。

xiNET被设计为允许将其用作一个组件,实验室可以通过将其直接链接到自己的CLMS数据库,将其集成到工作流程中。本质上,可以通过迭代数据库结果并生成对名为“addProtein”和“addMatch”的JavaScript函数的调用,将数据加载到xiNET中

结果

使用xiNET,我们提供了一个工具,可以在交互式地图中总结CLMS结果。该工具是GitHub的一个开源项目,因此可以由任何相关方使用和进一步开发。该工具可以通过网页直接使用,网址为http://crosslinkviewer.org或在本地使用而不传输数据。交互式地图的用户控件(平移、缩放、重新排列图形元素)如所示表一.

表一

xiNET链接映射上的用户控件(版本1.0.0)
行动控制
在条形和圆形图形形式之间切换蛋白质左键点击蛋白质
缩放背景上的鼠标滚轮
平移在背景上单击并拖动鼠标左键
移动蛋白质点击并拖动蛋白质
循环通过不同的条形长度(最大长度显示蛋白质序列)Shift+左键单击
旋转栏当鼠标移到附近时,单击并拖动蛋白质条末端出现的手柄
灰显/显示蛋白质(并隐藏/显示其所有链接)右键单击蛋白质
隐藏两个特定蛋白质之间的链接右键单击这些蛋白质之间的任何链接
显示所有隐藏的链接右键单击背景
显示自链接的条的反面右键单击自链接
选择蛋白质或链接(更多详细信息显示在网页的单独面板中)左旋蛋白质或链接
清除所选内容在背景上单击鼠标左键
蛋白质详细信息(ID、名称)鼠标悬停在蛋白质上(工具标签)
蛋白质链接详细信息(ID、唯一链接位点对的数量、支持匹配的总数)鼠标悬停在蛋白质链接上(工具标签)
残基水平链接详细信息(ID、支持匹配的总数、链接肽)鼠标悬停在残基水平链接上(工具标签和链接的肽以条形突出显示)

在本节中,我们提供了创建xiNET映射的详细说明,方法是将数据上传到网站(将数据上传至网站),或者使用本地工具(本地使用)将所有数据完全控制在用户的控制范围内。我们展示了这些映射,然后(进一步的示例)简要介绍了演示xiNET所有功能所需的其他示例。图3显示了xiNET的默认图例,该图例用于显示的输出中。

保存图片、插图等的外部文件。对象名称为zjw004155006003.jpg

xiNET图形的默认键。代表链接的任何一条线都可以用虚线表示,以表明链接对于链接站点是不明确的。请注意,对于自联是分子内还是分子间的,它们可能是模棱两可的。用户/开发人员可以修改默认密钥,使其适应其特定的表示需求。通常,此类修改涉及将线颜色分配给交联的属性,例如量化或置信属性。

将数据上传到网站

创建如中所示的图形图1一个在绘图工具中手动操作是一个费力的过程;xiNET删除了此手动操作。在下文中,我们描述了如何自动生成交互式版本的图1一个根据原始出版物附带的补充数据,并用其中描述的域对其进行注释。Chen等人(1)总结了.xls文件中已识别的连锁位点对,省略了肽序列信息。

为了从.xls文件中重新创建图形,我们按照以下方式创建了一个CLMS-CSV文件

  1. 在电子表格软件中打开.xls文件,
  2. 删除包含低置信度链接或TFIIF以外链接的行,因为这些未在原始图中显示,
  3. 将结果保存为CSV文件,
  4. 编辑列标题(第1行)以匹配http://crosslinkviewer.org/upload.html#CLMS-CSV公司
  5. 在文本编辑器中使用find-and-replace将非正式的蛋白质名称替换为UniProtKB登录号。

因为文件使用登录号作为标识符,所以不需要提供序列数据。第5步的替代方法是在包含用作标识符的非正式名称的FASTA文件中提供序列数据。域注释数据从原始论文的文本中提取,并以CSV格式记录,如http://crosslinkviewer.org/upload.html#注释.

然后上传CLMS-CSV文件和注释CSV文件。结果如所示图4。在线交互式版本可从http://crosslinkviewer.org/figure4.html获得。

保存图片、插图等的外部文件。对象名称为zjw0041550060004.jpg

TFIIF二聚结构域。这里我们看到xiNET显示来自图1,这次包含了自我链接。xiNET使用与各种交叉链接出版物中相同的编号条表示法(1171819). 数据集中出现了一个同质多聚体链接(红色),xiNET强调了这一点——这个链接实际上并没有帮助支持原始论文的结论,它可能是一个错误的识别。可以在以下位置查看交互式图形http://crosslinkviewer.org/figure4.html.

中的输出图4显示了xiNET的另一个功能-识别同质多元链接。数据中有一个链接(从Tfg2,残基279到Tfg2,279),如果是真的,它只能是分子间的,只能来自同多聚体。xiNET认识到了这一点并予以强调。

本地使用

Bui公司等。(19)用CLMS研究人类核孔复合体。他们为我们提供了XQuest(25)关于该复合物的输出用作示例数据,该数据包含所有三种交联反应产物类型。

与XQuest输出格式相比,我们更喜欢CLMS-CSV格式,因为CLMS-CVS将肽序列和肽中的链接位置存储为单独的列。XQuest输出将这些信息连接在一起,并将其记录为标识符。然而,为了方便XQuest用户,xiNET直接读取XQuest输出,因为它与自己的CLMS-CSV格式非常相似。图5描述了不同的产品类型是如何记录在CLMS-CSV中的,尽管它们也可以直接从XQuest输出中读取。

保存图片、插图等的外部文件。对象名称为zjw0041550060005.jpg

以xiNET的CLMS-CSV文件格式对交联反应产物类型进行编码。xiNET显示并区分所有三种交联反应产物类型,它们是:一个,连接物修饰肽;B类,内链肽;和,C类,交联肽。表中显示了上面示例的输入数据。在输入数据中,产品类型由第二个蛋白质和第二个链接位置的信息是否存在表示。xiNET还识别了交联肽的子集,D类同源多聚体连接,其中肽在蛋白质序列中重叠。重叠区域以红色突出显示。表中还包括省略肽序列信息的示例,在这种情况下,LinkPos1和LinkPos2列给出了蛋白质序列中链接位点的绝对位置。为了记录不明确的链接站点,所需列中的值被制成以逗号分隔的备选列表。注意,肽水平的模糊性必须根据产品类型是否是内部连接的肽而不同地处理,B类或交联肽,C类.

以下内容描述了在保持交联数据机密的同时生成交互式图形的过程

  1. 从下载xiNET项目https://github.com/colin-combe/crosslink-viewer/archive/master.zip
  2. 解压缩,
  3. 将CSV文件放在demo/data/MyData.CSV中,
  4. 将demo/demo.html第140行中给出的文件名从“demo/data/PolII.csv”更改为“demo.data/MyData.csv“
  5. 在浏览器中打开demo/demo.html(可能需要更改浏览器的安全设置才能从本地磁盘读取文件,如果文件由本地运行的web服务器提供,则此安全限制不适用)。

下载序列和注释时会生成网络流量,但交联数据不会离开本地计算机。结果如所示图6,其中我们看到xiNET显示并区分所有三种产品类型。该图的实时版本位于http://crosslinkviewer.org/figure6.html.

保存图片、插图等的外部文件。对象名称为zjw004155006006.jpg

包含所有三种产品类型的示例。数据与人类核孔复合体有关,见Bui等。(19)和xiNET区分数据中存在的三种不同产品类型。还要注意,圆形节点的大小与蛋白质序列的长度成比例,因此将蛋白质长度加倍将导致圆形面积加倍。可以在以下位置查看交互式图形http://crosslinkviewer.org/figure6.html.

更多示例

为了涵盖前面“xiNET的优点”一节中描述的xiNET所有功能,现在显示了另外两个示例。

图7显示了xiNET中显示的不明确数据。虚线用于指示不明确的链接,鼠标悬停时的突出显示显示了可能的替代项。图7编号栏已展开(请参见表一用于用户控制),直到蛋白质的序列可见。当xiNET有关于肽序列的信息时,它会在鼠标悬停上突出显示链接和链接的肽。因此,在图7我们可以看到特定的反复出现的肽,这是歧义的来源。(交互式图形位于http://crosslinkviewer.org/figure7.html.)

保存图片、插图等的外部文件。对象名称为zjw0041550060007.jpg

CLMS结果不明确的示例。例如,如果已识别的交联肽属于搜索空间中的多个蛋白质,则可能会出现关于链接位点的模糊。xiNET使用虚线表示不明确的链接站点,而鼠标悬停上的突出显示用于显示可能的替代项。示例数据显示微管和人类动粒-斯卡复合体之间的交联(18). SKA1与Tubulinβ-3链亚型TBB3和TBB2B的110-120范围内的残基之间的联系都不明确;两种亚型中都存在相同的识别肽(以橙色突出显示)。从SKA1到TBB3和TBB2B中约160个残基的链接都是明确的;对于这些连接,所有鉴定的肽都含有残基155,这是TBB3和TBB2B的区别。在交互式图形中(例如http://crosslinkviewer.org/figure7.html),当鼠标移动到链接上时,连接到特定交联的肽以橙色突出显示,突出显示伴随着一个工具标签,该标签给出蛋白质名称或ID、链接残基数和支持肽谱匹配的数量。

图8说明了xiNET表示这样一个域的序列特征的另一个方面。(交互式图形位于http://crosslinkviewer.org/figure8.html.)当蛋白质显示为数字条时,域标记为沿着该条的有色区域。当节点折叠成圆形时,域注释信息在这些圆形节点上显示为扇区,扇区的起点和终点角度与域的起点和端点残差相对应。由于这些扇区是根据其域名进行彩色编码的,因此同源蛋白质可以通过其彩色扇区中的类似模式识别。

保存图片、插图等的外部文件。对象名称为zjw0041550060008.jpg

xiNET在其他序列信息的上下文中显示CLMS数据。结构域或其他带注释的区域显示为条形图的彩色编码段或代表蛋白质的圆圈的彩色编码部分。扇区的起始角和结束角对应于域的起始残基和结束残基(残基1在12点钟)。数据是来自的数据的子集Herzog等人。(2). 包含整个数据集的实时示例可以在http://crosslinkviewer.org/figure8.html.

讨论

xiNET用户界面的一个关键特性是它能够在条形(显示残基)和圆形(聚合到蛋白质水平的交互)之间切换交互器节点。这允许用户选择网络的哪些部分被简化,哪些部分显示了更多细节。因此,xiNET的一个方面是它提供了层次图。这与Visant类似(9)尽管Visant没有使用表示定位剩余级别节点序列的轴。

我们希望我们的工作将简化和加强研究人员探索和共享这类实验提供的信息的方式,从而促进CLMS作为一种分析技术的传播。这包括将交互式图形作为包含xiNET的页面的html地址发送给同事和期刊的可能性。我们渴望创造一种通用的视觉语言来传达CLMS结果。xiNET的开放可用性增加了它的使用甚至可能成为整个领域标准的可能性,避免了重复开发工作,这将把资源从我们寻求回答的生物问题上转移开。

当可视化CLMS数据的各个方面时,xiNET并不能满足我们的所有需求。CLMS出版物中常见三种类型的图形:为人类检查而注释的光谱、三维结构上可视化的交联以及已识别交联的二维图形摘要。这些对应于CLMS数据可视化和下游分析的完整系统中所需的三种类型的视图。xiNET是一个提供这些视图之一的组件,即已识别交联的摘要。用于可视化已有注释光谱的软件,例如MSViewer(26)和xiSPEC,网址:http://spectrumviewer.org/.Xlink:数据库(24)包含用于CLMS数据的三维结构查看器。xiNET提供了一种非常有效的导航CLMS数据的方式,因此我们预计它将在一个集成平台中发挥核心作用,使CLMS实验的各个方面都能以互联的方式进行探索。

xiNET显示的地图可以进一步开发,以包括不同类型的生物分子,如DNA、RNA或小分子。在条形和圆形之间切换聚合物相互作用物表示的技术可以应用于任何实验数据的可视化,在这些数据中,序列的特定区域之间可以识别相互作用。这两件事都扩大了分子类型和实验数据类型的范围,是将xiNET开发为生物分子相互作用通用查看器的一部分,请参阅http://interactionviewer.org.

致谢

我们感谢Jimi-Carlo Bukowski-Wills就项目的网络实施进行的讨论,感谢Tatsiana Auchynikava对手稿的评论,感谢我们实验室的所有成员在开发xiNET期间提出建议和反馈。

脚注

贡献者

作者贡献:C.W.C.、L.F.和J.R.设计的研究;C.W.C.进行研究;C.W.C.贡献了新试剂或分析工具;C.W.C.和J.R.分析数据;C.W.C.和J.R.撰写了论文;C.W.C.编写了该软件。

*威康信托基金会通过向J.R.提供高级研究奖学金(084229103139)、中心核心赠款(092076)和工具赠款(091020)慷慨资助了这项工作。我们还要感谢对GitHub项目的首次贡献。

竞争性财务利益:作者声明没有财务利益。

1.位于的web服务http://www.uniprot.org/uniprot/,例如:http://www.uniprot.org/uniprot/P12345.txt.

2.位于的web服务http://supfam.org/SUPERFAMILY(超级家庭)/,例如:http://supfam.org/SUPERFAMILY/cgi-bin/das/up/features?segment=第12345页.

1使用的缩写如下:

循环管理系统
交叉链接/质谱
CSV公司
逗号分隔
PDB公司
蛋白质数据库
PSI-MI标准
蛋白质组学标准倡议——分子相互作用
RIN公司
残留物相互作用网络
SVG公司
可缩放矢量图形。

参考文献

1Chen Z.A.、Jawhari A.、Fischer L.、Buchen C.、Tahir S.、Kamenski T.、Rasmussen M.、Lariviere L.、布可夫斯基-威尔J.C.、Nilges M.、Cramer P.、Rappsilber J.(2010)交联和质谱显示RNA聚合酶II–TFIIF复合物的结构.欧洲工商管理硕士J.29, 717–726[PMC免费文章][公共医学][谷歌学者]
2Herzog F.、Kahraman A.、Boehringer D.、Mak R.、Bracher A.、Walzthoeni T.、Leitner A.、Beck M.、Hartl F.U.、Ban N.、MalmströM L.、Aebersold R.(2012)蛋白质磷酸酶2a网络的化学交联和质谱结构探测.科学类 337, 1348–1352 [公共医学][谷歌学者]
三。郑C.、杨L.、胡普曼M.R.、Eng J.K.、Tang X.、Weisbrod C.R.、Bruce J.E.(2011)体内蛋白质复合物拓扑的交叉测量.分子细胞。蛋白质组学 10,M110.006841–M100.006841[PMC免费文章][公共医学][谷歌学者]
4Gehlenborg N.,Wong B.(2012)观点:网络.自然方法 9, 115. [公共医学][谷歌学者]
5Seebacher J.、Mallick P.、Zhang N.、Eddes J.S.、Aebersold R.、Gelb M.H.(2006)使用质谱、同位素编码交联剂和集成计算数据处理进行蛋白质交联分析.蛋白质组研究杂志.5, 2270–2282 [公共医学][谷歌学者]
6Gehlenborg N.、O'Donoghue S.I.、Baliga N.S.、Goesmann A.、Hibbs M.A.、Kitano H.、Kohlbacher O.、Neuweger H.、Schneider R.、Tenenbaum D.、Gavin A.C.(2010)系统生物学组学数据可视化.自然方法 7,S56–S68系列[公共医学][谷歌学者]
7Shannon P.、Markiel A.、Ozier O.、Baliga N.S.、Wang J.T.、Ramage D.、Amin N.、Schwikowski B.、Ideker T.(2003)Cytoscape:生物分子相互作用网络集成模型的软件环境.基因组研究.13, 2498–2504[PMC免费文章][公共医学][谷歌学者]
8Barsky A.、Gardy J.L.、Hancock R.E.、Munzner T.(2007)大脑:一个细胞景观插件,用于使用亚细胞定位注释布局生物网络并与之交互.生物信息学 23, 1040–1042 [公共医学][谷歌学者]
9胡志明、梅勒尔·J·、吴杰、卡内希萨·M·、斯图亚特·J·M·和德莉丝·C·(2007)朝向单元格的可缩放多维映射.自然生物技术.25, 547–554 [公共医学][谷歌学者]
10Hermjakob H.、Montecchi Palazzi L.、Bader G.、Wojcik J.、Salwinski L.、Ceol A.、Moore S.、Orchard S.、Sarkans U.、Von Mering C.、Roechert B.、Poux S.、Jung E.、Mersch H.、Kersey P.、Lappe M.、Li Y.、Zeng R.、Rana D.、Nikolski M.、Husi H.、Brun C.、Shanker K.、Grant S.G.、Sander C.、Bork P.、Zhu W.、Pandey A.、Brazma A.、Jacq B.、Vidal M。,Sherman D.、Legrain P.、Cesareni G.、Xenarios I.、Eisenberg D.、Steipe B.、Hogue C.、Apweiler R.(2004)HUPO PSI的分子相互作用格式——蛋白质相互作用数据表示的社区标准.自然生物技术.22, 177–183 [公共医学][谷歌学者]
11Berman H.M.、Westbrook J.、Feng Z.、Gilliland G.、Bhat T.N.、Weissig H.、Shindyalov I.N.和Bourne P.E.(2000)蛋白质数据库.核酸研究.28, 235–242[PMC免费文章][公共医学][谷歌学者]
12Doncheva N.T.、Assenov Y.、Domingues F.S.、Albrecht M.(2012)生物网络和蛋白质结构的拓扑分析和交互式可视化.自然协议.7, 670–685 [公共医学][谷歌学者]
13Martin A.J.、Vidotto M.、Boscariol F.、Di Domenico T.、Walsh I.、Tosatto S.C.(2011)RING:蛋白质结构中相互作用残基、进化信息和能量学的网络化.生物信息学 27, 2003–2005 [公共医学][谷歌学者]
14Swint-Kruse L.,Brown C.S.(2005)Resmap:高分子界面作为二维网络的自动表示.生物信息学 21, 3327–3328 [公共医学][谷歌学者]
15Lasker K.、Förster F.、Bohn S.、Walzthoeni T.、Villa E.、Unverdorben P.、Beck F.、Aebersold R.、Sali A.、Baumeister W.(2012)综合法测定26S蛋白酶体全复合物的分子结构.程序。国家。阿卡德。科学。美国 109, 1380–1387[PMC免费文章][公共医学][谷歌学者]
16Krzywinski M.、Birol I.、Jones S.J.、Marra M.A.(2011年)蜂巢图——可视化网络的理性方法.生物信息学简介 13, 5. 英国广播公司069–644[公共医学][谷歌学者]
17Jennebach S.、Herzog F.、Aebersold R.、Cramer P.(2012)交联-MS分析揭示了RNA聚合酶I结构域结构和rRNA裂解的基础.核酸研究.40,5591–5601[PMC免费文章][公共医学][谷歌学者]
18Abad M.A.、Medina B.、Santamaria A.、Zou J.、Plasberg-Hill C.、Madhumalar A.、Jayachandran U.、Redli P.M.、Rappsilber J.、Nigg E.A.、Jeyaprakash A.A.(2014)人类动粒-斯卡复合体识别微管的结构基础.国家公社.5, 2964.[PMC免费文章][公共医学][谷歌学者]
19Bui K.H.、von Appen A.、DiGuilio A.L.、Ori A.、Sparks L.、Mackmull M.T.、Bock T.、Hagen W.、Andrés-Pons A.、Glavy J.s.、Beck M.(2013)人核孔复合支架的整体结构分析.单元格 155, 1233–1243 [公共医学][谷歌学者]
20Bostock M.、Ogievetsky V.、Heer J.(2011)D3:数据驱动文档.IEEE跨可视化计算机图形学 17, 2301–2309 [公共医学][谷歌学者]
21UniProt财团(2013年)2013年Universal Protein Resource(UniProt)活动更新.核酸研究.41,D43–D47[PMC免费文章][公共医学][谷歌学者]
22Gough J.、Karplus K.、Hughey R.、Chothia C.(2001年)使用代表所有已知结构蛋白质的隐马尔可夫模型库分配基因组序列的同源性.分子生物学杂志.313, 903–919 [公共医学][谷歌学者]
23Dowell R.D.、Jokerst R.M.、Day A.、Eddy S.R.、Stein L.(2001)分布式注释系统.BMC生物信息学 2, 7.[PMC免费文章][公共医学][谷歌学者]
24Zheng C.、Weisbrod C.R.、Chavez J.D.、Eng J.K.、Sharma V.、Wu X.、Bruce J.E.(2013)xlink:DB:用于存储和可视化蛋白质相互作用拓扑数据的数据库和软件工具.蛋白质组研究杂志.12, 1989–1995[PMC免费文章][公共医学][谷歌学者]
25Rinner O.、Seebacher J.、Walzthoeni T.、Mueller L.N.、Beck M.、Schmidt A.、Muelle M.、Aebersold R.(2008)从大序列数据库中鉴定交联肽.自然方法 5, 315–318[PMC免费文章][公共医学][谷歌学者]
26Baker P.R.、Chalkley R.J.(2014)MS-viewer:基于网络的蛋白质组学结果光谱查看器.分子细胞。蛋白质组学 13, 1392–1396[PMC免费文章][公共医学][谷歌学者]

文章来自分子和细胞蛋白质组学:MCP由以下人员提供美国生物化学和分子生物学学会