跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2011; 2011年:酒吧042。
2011年9月29日在线发布。 doi(操作界面):10.1093/数据库/bar042
PMCID公司:项目经理3294423
PMID:21959866

3DSwap:涉及3D域交换的蛋白质的精选知识库

摘要

三维结构域交换是一种独特的蛋白质结构现象,蛋白质低聚物中的两条或多条蛋白质链在各个链之间共享一个共同的结构段。这种现象在寡聚体构象的蛋白质结构阵列中观察到。交换构象中的蛋白质结构发挥着不同的功能作用,也与人类的沉积病有关。我们进行了深入的文献管理和结构生物信息学分析,以开发涉及3D域交换的蛋白质的集成知识库。3D域交换的特点是存在不同的结构段,例如铰链和交换区域。我们策划了文学作品来描绘这些地区的边界。此外,我们定义了几个新概念,如“次要主界面”,以表示因3D域交换而产生的界面属性,以及结构中“交换程度”的新定量度量。3DSwap知识库中报告的蛋白质目录是通过结构可视化和序列-结构-功能分析,使用数据库搜索、文献整理的集成结构生物信息学工作流生成的。当前版本的3DSwap知识库报告了293个蛋白质结构,对这种蛋白质结构概要的分析将进一步了解驱动3D域交换的分子因素。

数据库URL: http://caps.ncbs.res.in/3dswap

介绍

蛋白质结构是生物体的基本形式和功能单位。蛋白质的结构性质可以用一级、二级、三级和四级结构的概念来全面解释(1–5). 蛋白质通过与细胞内各种各样的微分子和大分子相互作用来实现其特定功能。其中一些相互作用是由蛋白质的齐聚作用介导的(6–10). 一般来说,蛋白质低聚物是由蛋白质单体亚基聚合成二聚体或高阶低聚物形成的。蛋白质低聚物可大致分为两类:同型低聚物(由相同亚基的低聚物形成)和异型低聚物(由非相同亚基低聚物构成)。一些关键的分子功能依赖于这种蛋白寡聚物与细胞中其他分子参与者之间的分子相互作用(11–13).

3D结构域交换是一种蛋白质结构现象,其中两条或多条蛋白质链通过在单体之间交换相同的结构元素而形成二聚体或更高的低聚物(14–16). 单体结构中的几种天然(自然/生理)分子内相互作用被交换寡聚构象中的蛋白质结构的分子间相互作用所取代(17). 虽然术语“3D结构域交换”最初被定义为描述白喉毒素的结构,但在40多年前,在对带有部分敲除活性位点的核糖核酸酶(RNaseA)二聚体的实验中,预测了类似的结构现象(18–22). 3D结构域交换被认为是解释蛋白质从单体构象向寡聚构象进化以调节特定功能的重要机制。不同“铰链”和“交换”区域的存在是3D域交换构象中蛋白质结构的特征。据报道,交换构象中的结构具有多种功能,与沉积疾病(如神经退行性疾病、淀粉样变性和阿尔茨海默病)有关的蛋白质在3D域交换构象上也有报道(23–28). 人们提出了几种机制来解释寡聚物的形成和蛋白质聚集(29–31). 这些先前的研究大多集中在数量有限的蛋白质分子上。为理解3D域交换背后的分子机制而进行的具体实验和计算研究提出了诸如大分子拥挤等各种特征(27),蛋白质浓度(32),进化限制,对铰链区残基的突变效应(32,33)以及与pH值相关的变化(27,34)与现象相关。已在属于不同折叠、源生物体、蛋白质结构域家族和不同次级结构元件的各种蛋白质结构中观察到。然而,三维结构域交换的生物学意义和结构基础仍不明确。第一个是关于3D域交换的精心策划的数据库,“3DSwap”是一个有用的资源,可以对其进行分析,以回答有关3D域交换顺序、结构和功能含义的特定问题。3DSwap中编译的固化数据和函数注释可用于开发算法,该算法可以根据序列或结构数据预测各个方面(例如铰链和交换区域),并能够对高阶残基相互作用和各种结构属性进行比较分析。

早期对3D域交换的研究主要集中在从实验中理解这一现象(35–45)和计算视角(46–54),但还没有基于它开发出综合数据库或生物信息学资源。通过汇编与此机制相关的大量蛋白质数据集,对蛋白质中的3D结构域交换进行集体研究,将是理解控制这一现象的各种因素的重要一步,从分子水平到其在沉积疾病中的关键作用以及通过交换介导的其他功能(K.Shameer和R.Sowdhamini,未发表的结果)。3DSwap数据库中报告的蛋白质目录是使用数据库搜索、文献整理、结构可视化和后续分析的集成管道生成的。

3D域交换的特点

一些早期的研究定义了3D域交换的不同结构和功能方面。为了建立一个通用框架来理解蛋白质结构中的交换,各种关键术语,如“真正的域交换”“准域交换”、“交换区域”和“铰链区域”在前面介绍过(27,34). 涉及3D结构域交换的蛋白质结构分为两大类(15,34):真正的域交换和准域交换(55). 善意的结构域交换是指分子的单体和二聚体以稳定形式存在,二聚体采用结构域交换构象,单体采用闭合构象的结构。真正的结构域交换类别中的蛋白质结构示例包括白喉毒素(18,34)、RnaseA(16,56),参与T细胞粘附的分化簇2(CD2)(57),第0阶段产孢蛋白A(spo0A)参与调控产孢反应(58)准结构域交换是指一些蛋白质在没有已知闭合单体的情况下形成结构域交换低聚物时形成的结构。如果这些蛋白质具有已知为封闭单体的同源物,则这些低聚物被视为“准结构域交换”。准结构域交换蛋白质结构的例子包括晶体(59)、信息素/气味结合/转运蛋白(60)晶体蛋白(59)、信息素/气味结合/转运蛋白(60)、RYMV(病毒衣壳蛋白)(61)和人胱抑素C(蛋白酶抑制剂)(62). 图1(PDB ID:11BG)显示了真正的域交换蛋白质结构的示例,图2(PDB ID:1CKS)提供了准域交换蛋白结构。发生这种现象的结构的两个基本特征是交换区域和铰链区域。交换区被定义为球状结构域或短结构元素,与寡聚构象中的其他蛋白质链交织在一起。铰链区是连接交换区和蛋白质剩余核心的短链氨基酸,主要是环状构象。牛精液核糖核酸酶的铰链和交换区域在图1和2。2交换区可以是一些蛋白质中的一个小环,也可以是其他一些蛋白质中的一个完整结构域。因此,我们引入了一组由四个新术语组成的术语,即“主域间接口”、“次域间界面”、“次要次要区域”和“次要主要区域”(定义见“方法”一节),以使用称为“交换范围”(ES)的度量来量化整个结构的交换。

保存图片、插图等的外部文件。对象名为bar042f1.jpg

真正的结构域交换结构示例:牛精液核糖核酸酶(PDB ID:11BG)的3D结构域交换构象,带有突出的铰链和交换区域。单个链条的颜色为青色和绿色。铰链区域用红色表示,交换区域用咖啡色表示。

保存图片、插图等的外部文件。对象名为bar042f2.jpg

准域交换结构示例:人类CksHs2的六聚体组装(PDB ID:1CKS)。六条单独的链条有不同的颜色(黄色、青色、紫色、蓝色、绿色、灰色)。铰链区域用红色表示,交换区域用咖啡色表示。

方法

3DSwip数据库采用多步骤文献管理方法,结合结构分析、结构映射和功能注释集成进行开发。

三维域交换结构中二次界面区域的概念

我们将“主要域间界面”定义为蛋白质单体形式的域之间的链接。主要界面是单体中的天然界面,主要由分子间相互作用介导,由于3D域交换,这些相互作用被分子内相互作用所取代二级畴间界面”被定义为存在于域交换二聚体中但不存在于单体中的附加界面。与相邻链的另一个结构域交换的整个结构域或蛋白质链的一部分称为“次要区域”或“来宾”。与次要次要区域相互作用的区域称为“次要主要区域”或“宿主”。3D域交换的各种结构特征的图形描述如所示图3.

保存图片、插图等的外部文件。对象名为bar042f3.jpg

3D域交换不同功能的示意图。

互换范围(ES)

由于观察到结构域交换对蛋白质结构的寡聚体构象有不同的影响,我们引入了交换范围(ES),这是一种新的测量方法,通过比较“次要主区域”和“次要次要区域”中的残基来量化交换对整个寡聚物结构的影响。例如,对于具有两条链的蛋白质X(X)Y(Y),ES使用以下公式计算为百分比:

方程式图像
(1)

哪里R(右)医疗保险 = 第二主界面中的残基数量,R(右)惯性矩 = 次要界面中的残留物数量。在距离为7度的炮弹内进行了搜索C类α次级次级界面上所有残基的原子(R(右)惯性矩)回收二级主界面中的残留物(R(右)医疗保险)使用自定义FORTRAN脚本(请参见图3用于各种结构特征的示意图表示)。R(右)链条:X =链中残留物X(X)R(右)链条:Y=链中的残留物Y(Y)根据ES值,3DSwap中的蛋白质结构可分为三大类,即“广泛交换”、“适度交换”和“最小交换”。阈值是使用序列-结构同源性的黄昏区概念定义的(63,64). 我们假设,如果低聚结构受到其整个长度的35%以上的影响,则由于结构域交换可能会产生显著的结构影响。因此,广泛交换是指低聚物结构,观察到ES在35–100%范围内。适度交换是指观察到ES在15-35%范围内的低聚物结构,最小交换是指观测到ES<15%的低聚体结构。不同类别的“ES”,具有代表性的示例如下所示图4[广泛交换:63.87%-1DXX(65); 适度交换:27.64%-1O4W(66); 最小交换量:8.5%-1BL9(67)]. 大量蛋白质被观察到属于“广泛交换”类别(图5)这表明3D结构域交换对寡聚体构象的影响在大多数交换的蛋白质中是显著的。需要进一步分析以确定ES和几个结构类别之间的相关性。

保存图片、插图等的外部文件。对象名为bar042f4.jpg

不同类别的“ES”以及代表性示例(PDB ID:1BL9、O4W和1DXX)。单个链条的颜色为青色和绿色。铰链(红色)和交换区域(棕色)以不同的颜色映射。

保存图片、插图等的外部文件。对象名为bar042f5.jpg

基于ES的数据集中的蛋白质分布。

基于文献的蛋白质结构调控方法

我们以迭代的方式将基于文献的结构信息挖掘和手动结构可视化方法相结合,以识别和映射三维域交换到结构的特征。我们将这种方法定义为“基于文献的蛋白质结构管理”。在蛋白质数据库(PDB)的高级搜索界面中,使用文本挖掘搜索获得初始条目列表(68). 我们使用了与3D域交换相关的基本关键字(“域交换”、“域切换”、“3D域交换”和“3D域切换”)及其派生词在主数据库PDB中进行初始搜索。使用基本搜索实用程序,我们获得了PDB标识符(PDB ID)的初始池以及报告关键字的相应PubMed标识符(PMID)。在PubMed中进行了类似的搜索,检索到PubMeds条目的ID,在标题、摘要或全长研究文章中使用这些关键字集。使用PDB高级搜索界面将PMID进一步映射到PDB ID。生成了非冗余PDB ID及其各自PMID的索引列表。对于每对ID,下载了相应的PDB文件,并获得了可用的全文文献。报道蛋白质结构测定方法和生物化学性质的文献数据被用作识别蛋白质结构中铰链和交换区的指南。

数据库搜索是使用“域交换”及其衍生工具和所做条目列表进行的对PDB和PubMed数据库进行关键字搜索。此外,使用PDB中提供的派生数据手动检查这些条目(69),PDB总和(70)和PQS数据库(11). 还使用域识别算法(DIAL服务器)评估了结构(71,72)了解蛋白质的结构域结构和边界。使用PyMOL(PyMOL-Molecular Graphics System,Version 1.2r3pre,Schrödinger,LLC)对确认的3D域交换案例的结构进行可视化,并分析各种3D域交换结构特征。此外,还进行了文献整理,以获得铰链和交换结构域中残基的详细信息。处理确认的结构条目以获得各种特征。提取了具有明确铰链和交换区域的蛋白质结构的所有特征,并将其报告在数据库中。

生物和生物医学文本挖掘方法有助于使用自动化方法识别各种实体之间的假定关系,如基因、蛋白质、小分子和文献中定义的疾病(73,74). 这种自动文本挖掘方法不适合管理3D域swap相关特征。使用“PDB高级搜索界面”和随后的结构可视化来确定3D域交换中涉及的蛋白质结构的初始列表是一项相当简单的任务。但是,开发3DSwap的挑战在于将铰链和交换区的残基结构映射到参与交换的蛋白质结构。摘要中没有关于铰链或交换区域或这些区域的相应位置的信息。在大多数情况下,这是在主文本、图形图例或表格中提供的,因此不可能对摘要进行自动文本挖掘。此外,由于与PDB中存储的原始数据相关的几个已知问题,铰链和交换区域中残基的映射具有挑战性。例如,链断裂、缺失残基、残基重新编号和缺失原子记录,通常会阻碍从文献到蛋白质结构的信息一对一映射。由于这些原因,在许多情况下,文献中提到的残基数量与结构并不直接匹配,因此需要借助可视化工具手动绘制残基地图,以管理铰链和交换区域。

总之,根据工作流程,3DSwap知识库中的条目以有效的PDB ID开始。PDB ID用于根据PDB中集成的PubMed ID获取与结构相关的关键文献。手动查阅文献,以确定铰链和交换区域中的残留物。借助可视化工具,这些残留物被识别并映射到结构上。此外,序列和结构用于编译数据库中报告的各种特征。删除了模棱两可的情况,当前版本的3DSwap中不包括铰链或交换区域信息不完整的几个结构。流程图中总结了与3DSwap中包含的蛋白质结构管理相关的各种步骤(图6).

保存图片、插图等的外部文件。对象名为bar042f6.jpg

3DSwip知识库开发中涉及的管理步骤的示意图。

用于基于文献的蛋白质结构管理的工具

使用以下工具和数据库进行基于文献的蛋白质结构管理:PDB(68),PQS服务器(11)、PDBe(75),PDB总和(70)、PyMOL(76)、RasMol(77,78)和拨号(71,72). 使用PDB、PQS Server和PDBe获得PDB格式的结构坐标、四元结构坐标和寡聚体形式的生物组装。使用PyMOL和RasMol进行结构可视化,以确认文献中铰链和交换区域的三维域交换和映射。DIAL服务器用于识别蛋白质的结构域定义的架构。在基于文献的蛋白质结构管理和结构生物信息学分析后,获得的涉及3D域交换的蛋白质列表信息已被编译成一个新的知识库“3DSwap”。数据管理步骤之后(图6),为3DSwap中报告的条目计算各种结构和序列特征。

技术细节

3DSwip知识库的web界面是使用HTML和JavaScript开发的。Perl-CGI程序用于开发搜索、查询和检索系统。后台数据使用MySQL存储。用于解析PDB和附件文件的脚本、搜索工具以及各种特性的计算都是用Perl编写的。JOY软件包用于计算各种结构特征。SEQPLOT是根据AAINDEX数据库中的Perl和氨基酸指数开发的(79)用于生成绘图。通过使用ScanProsite扫描参与交换的蛋白质结构序列,确定了铰链区、交换区和全序列的功能模式(80)使用PROSITE(81)2010年11月下载的数据。

结果

三维结构域交换报道的蛋白质结构包括各种折叠、源生物体、家族和各种初级和次级结构。

在3DSwap中搜索和浏览实用程序

用户可以使用“3DSwap中的完整条目列表”在3DSwab中浏览,该列表提供了当前版本3DSwamp中可用的蛋白质结构的动态表。用户可以使用列标题对3DSwap数据库中的表进行排序。用户还可以使用根据ES值分类为三个不同组的结构来浏览3DSwap知识库。中提供了浏览界面的屏幕截图图7.

保存图片、插图等的外部文件。对象名为bar042f7.jpg

浏览3DSwap的界面。

3DSwap的搜索界面提供了一种方便的方法,通过使用关键字、来自PDB(PDB ID和PDB头)的元数据、SCOP域、SCOP fold、Pfam域、GO注释和CDD注释的搜索访问数据库。基本局部对齐搜索工具(BLAST)(82)提供了基于序列搜索的界面,用于在数据库中搜索涉及结构域交换、铰链区和交换结构域的全长蛋白质。这将使用户能够使用序列数据查询3DSwap知识库并检索序列同源物。BLAST接口设计用于对三个不同的数据库执行搜索:全长序列数据库、铰链和交换区域。搜索界面的截图见图8.

保存图片、插图等的外部文件。对象名为bar042f8.jpg

搜索3DSwap的界面。

交换线段和铰链区域的交互式可视化

分子可视化工具在蛋白质分子的结构分析中发挥着重要作用。为了支持域交换中蛋白质结构的交互式可视化和分析,我们提供了使用Jmol进行蛋白质可视化的选项(83)和RasMol(84). Jmol是一个基于Java的web小程序,它使用户能够在web浏览器中直观地分析分子结构。加载了结构的Jmol小程序可以从Jmol徽标获得。RasMol是一个独立的分子可视化应用程序,可以安装在不同的操作系统上。我们提供RasMol脚本,用于对本地机器中的结构进行交互式分析。中提供了屏幕截图图9PDB ID 11BG的基于Jmol的可视化。突出显示铰链和交换区域,以便对此类残留物进行视觉探索。

保存图片、插图等的外部文件。对象名为bar042f9.jpg

使用Jmol在3DSwap中突出显示可视化效果的屏幕截图。

二维打印:带注释的拓扑图

我们从PDBSum中获得了二维二级结构拓扑图;这些拓扑图被注释以定义铰链和次要次要区域。这样的2D图可以用于快速可视化铰链区域、交换区域和次级主界面,以了解交换对整个蛋白质结构的影响。

氨基酸图

氨基酸图是指根据铰链和交换区域内蛋白质序列的氨基酸组成以及参与3D域交换的蛋白质的完整结构得出的条形图集合。这些轮廓将提供铰链和交换区域中涉及的残基的组成的预览。这些剖面图将是比较不同地区组成的一个有用选项。EMBOSS包中的“pepstats”程序用于计算蛋白质属性的统计数据。

3DSwap中报告的结构特征

使用JOY软件包获得了氢键、溶剂可及性、二级结构和基于JOY的表征(85)用于数据库中的所有条目。还为数据库中报告的每个条目提供了JOY文件。JOY包生成的可解析文本文件(扩展名为.tem)也可用于全寡聚物结构、铰链和交换区域。该文件提供了各种结构衍生数据[二级结构和φ角、溶剂可及性、主链CO的氢键、主链NH的氢键,另一侧链/杂原子的氢键,顺式-肽键、氢键到异源、共价键到异种、二硫化物、主链到主链氢键(酰胺)、主链-主链氢链(羰基)、DSSP(86),正φ角,可达性百分比和Ooi数]。提供了基于结构特征的附件文件,以便用户利用数据库和文件进行进一步分析。中提供了描述3DSwap中编译的各种结构特征的屏幕截图图10.

保存图片、插图等的外部文件。对象名为bar042f10.jpg

3DSwap中的结构特征。

功能注释

来自基因本体注释(GOA)的功能注释信息(87)和Pfam数据库(88)[使用SIFTS倡议中基于结构的功能注释数据(89)]提供了。函数注释数据作为交叉引用链接提供,以检索3DSwap中的所有条目。例如,用户可以单击一个特定的GO ID或Pfam ID来查看带有3DSwap中特定注释的所有蛋白质结构。为了描述3DSwap中蛋白质的功能多样性,我们使用SIFTS资源将3DSwab中的PDB ID映射为GO ID,并计算生物过程类别中每个GO ID的频率,并使用REVIGO在树形图中可视化(90) (图11). 树图显示了当前版本的3DSwap中由蛋白质介导的生物过程的多样性。注释数据与Pfam交叉引用(88),阿美哥(91)和CDD数据库(92–94)检索有关蛋白质结构域或GO术语的更多信息。

保存图片、插图等的外部文件。对象名称为bar042f11.jpg

使用3DSwap中使用生物过程类别注释的蛋白质频率导出树状图。

3DSwap中的序列分析

3DSwap的序列分析部分提供了两组功能。SEQPLOT使用户能够生成氨基酸指数(AAINDEX)数据库中报告的任意三种氨基酸指数的绘图(95,96),在单个窗口中。AAINDEX是一个包含各种氨基酸物理化学性质、取代矩阵和统计蛋白质接触电位的数据库。516个氨基酸指数被整合到当前版本的SEQPLOT中。SEQPLOT将帮助用户了解编码在蛋白质不同区域(铰链、交换和全序列)的氨基酸的各种物理化学性质。3DSwap知识库中的“PROSITE模式”链接提供了与使用ScanProsite识别的全序列、铰链和交换区域相关的功能基序的信息(80,97)算法。该选项将帮助用户探索参与3D结构域交换的蛋白质不同区域中存在的功能基序。

牛精液核糖核酸酶:来自3DSwap的一个示例结构描述

为了说明3DSwap知识库的各种特征,我们以牛精液核糖核酸酶(一种来自Bos金牛(PDB ID:11BG)。11BG的3DSwap页面截图见图12.

保存图片、插图等的外部文件。对象名称为bar042f12.jpg

PDB ID:11BG的3DSwap知识库屏幕截图。

3DSwap数据库的第一部分提供了文献和公共结构生物信息学和功能注释数据库中有关3D域交换的文献信息。11BG公司(56)是牛精液核糖核酸酶蛋白的结构,在两条链(A,B)之间观察到3D结构域交换生物单元”是指可以形成生物活性单元的蛋白质的低聚物状态。11BG的寡聚体状态为“同二聚体”,并在3DSwap中提供,3DSwamp源自PQS和PDBe数据库(75). 从文献整理开始,然后仔细检查结构,获得关于铰链和交换区域中残基的信息。例如,在11BG[44]中,铰链区域涉及七个残基(GLY16-SER22)。在11BG中,在交换片段中观察到15个残基(LYS1-SER15)。由于该二聚体的ES值为35.5%,因此被归类为“广泛交换”类蛋白质的成员。访问序列数据的链接提供各种结构派生的序列数据,包括FASTA格式的铰链区域(次要次要区域)、次要主要区域、交换区域和完整序列数据。提供了访问交互式可视化工具的链接,用于分析3D域交换中涉及的蛋白质结构。11BG的GO注释分为两类:分子功能(核酸结合、催化活性、核酸酶活性、内切酶活性、胰腺核糖核酸酶活性、水解酶活性)和细胞成分(细胞外区域)。11BG的单个链中存在单个胰腺核糖核酸酶结构域(RnaseA结构域,Pfam ID:PF00074)。“氨基酸剖面”部分给出了铰链和交换区域的氨基酸剖面图以及基于PepStat的完整蛋白质序列数据,随后是各种结构分析工具和下载文件的输出。

3DSwap-数据库统计

截至2010年11月,当前版本的3DSwap包含293个结构,其中包括有关3D域交换的文献整理和信息集成,以及来自GO、Pfam和SCOP的注释。共有293个结构映射到4099个GO注释。其中包括细胞成分类别中的59个独特GO术语、生物过程类别中的244个独特术语和分子功能类别中的139个独特术语。在当前版本的3DSwap中,共报告了826个Pfam域注释,其中有175个唯一的Pfam域。从结构角度来看,当前版本的3DSwap中的条目映射到757个SCOP条目,其中具有代表性的成员来自107个SCOP褶皱、127个SCOP超家族、151个SCOP家族和176个SCCP域(图13).

保存图片、插图等的外部文件。对象名为bar042f13.jpg

SCOP类中3DSwap中蛋白质结构的分布。

当前版本3DSwap中包含的各种注释的覆盖范围如下:当前版本的3DSwap97.66%的蛋白质结构蛋白链包含CDD注释。CDD注释是使用3DSwap中编译的蛋白质结构的单个蛋白质链导出的。共有729条蛋白质链用于查询CDD数据库,712条蛋白质链用至少一个CDD域进行注释。238个结构(81.22%)可检索SCOP注释,278个结构可检索Pfam注释(94.88%),196个结构(66.89%)可检索GO注释。

讨论

PDB是结构生物信息学社区可用的各种蛋白质结构数据库中的主要资源。基于PDB衍生的蛋白质结构坐标开发了几个二级数据库。3DSwap是一个二级数据库,使用来自PDB的蛋白质结构数据开发,用于收集和记录参与3D域交换的蛋白质的各种特征。生物固化(98,99)由于需要整合多种数据资源,再加上文献证据和基于生物信息学的预测,以了解新的分子联系,如果没有这种整合,这些联系就不明显,因此在生物学中越来越重要。通过将数据汇编到公开可用的数据库中,使生物数据的解释和基于知识的推断得到增强,已管理的数据库对生物知识的传播做出了重大贡献(100–106). 我们相信,像3DSwap这样的管理工作可以为现有的生物学知识领域增加更多的知识,并且可以从开放获取的学术出版物中受益匪浅。映射到SCOP类的3DSwap中蛋白质结构的数据库统计数据表明,3D域交换结构在8个不同的SCOP类中报告(图13). 当前版本的3DSwap中没有报告属于SCOP中的线圈蛋白、低分辨率结构和肽类的结构。用于在3DSwap中编译蛋白质结构的策展策略“基于文献的蛋白质结构策展”可以作为未来结构策展研究的通用蛋白质结构策策展策略。

硫化蛋白质数据库,如保守域数据库(CDD)(94)它建立了由3D结构和SCOP指导的对齐搜索模型,对于理解蛋白质家族的结构、功能和分类方面非常有用。在3DSwap数据库中编译的文本化数据可用于深入分析3D域交换的各个方面。例如,在我们早期的尝试中,我们使用3DSwap中报告的蛋白质序列,通过结构和序列衍生的特征来预测3D域交换(107)以及使用随机森林从序列信息预测3D域交换的算法(108). 我们还利用这些数据对涉及3D结构域交换的蛋白质进行了详细的meta分析,并了解了交换蛋白质的功能作用(K.Shameer和R.Sowdhamini和K.Shamier、Prashant S.和R.sowdhamoni,手稿准备中)。我们预计3DSwap知识库及其功能,例如集成可视化工具和各种序列和结构分析结果,将有利于结构生物信息学社区,并使研究人员能够对涉及3D域交换的蛋白质进行全面分析和分类。

在3DSwap中编译的精选数据和序列、结构和功能数据将支持大规模分析3D域交换;例如,用户可以下载并利用溶剂可访问性来分析在参与3D域交换的蛋白质低聚物的各个区域中可访问的残基百分比。因此,我们相信3DSwap将成为主要的数据资源,以获得对3D域交换的顺序、结构和功能方面的一些新见解。

未来的工作和更新

由于参与3D域交换现象的蛋白质在结构、功能和调控方面发挥着重要作用,未来版本的3DSwap将定期发布,具体取决于PDB中大量3D域交换结构条目的相对可用性。由于铰链和交换区域的识别和映射需要手动管理,因此目前无法进行自动更新。然而,我们相信,在这份手稿之后,社区将努力在报告涉及交换构象的蛋白质结构的出版物摘要中记录诸如结构域交换等有价值的数据。这将极大地促进未来的自动化。3DSwap数据库的当前版本侧重于开发一个主要资源,该资源记录了3D域交换的各种主要功能。次要特征,如3D域交换中涉及的结构分类为准域或真实交换,以及同系物信息,将在3DSwap的未来更新中引入。还应注意的是,当前版本的3DSwap仅包含来自多个SCOP超家族和CDD数据库超家族的各种SCOP类的代表性结构,这些SCOP类涉及3D域交换,并不全面涵盖这些超家族。将采取进一步措施,将3DSwap中的数据集成到各种结构生物信息学资源和生物维基(如GeneWiki)中(109),PDBWiki公司(110)和WikiPathways(111). 将整理数据纳入蛋白质序列、结构和功能相关的生物维基将提高3DSwap中编译的文学整理数据的可访问性和使用性。还将努力将注释和交叉引用扩展到其他重要的蛋白质序列、结构和功能数据库,如PDBSum(70),GeneWiki(109),WikiPathways(111)、CATH(112),字符串(113),智能(114)和生物全球定位系统(115)在将来的更新中。

结论

我们开发了一个由公共领域提供的涉及3D域交换的蛋白质知识库。可以修改用于识别蛋白质中3D结构域交换特征的文献挖掘方法,并将调控策略应用于蛋白质结构调控的不同背景。3DSwap数据库的当前版本提供了参与3D结构域交换的蛋白质的各种序列、结构和功能特征。定量测量“ES”的定义是量化寡聚物结构中交换的大小。我们设想,3DSwap数据库的可用性及其管理的内容和与域交换相关的信息,将成为对详细研究3D域交换感兴趣的研究团体最有用的资源之一。

基金

印度国家生物科学中心(TIFR)和生物技术部(R.S.和K.S);英国威康信托基金会(Wellcome Trust,UK),R.S.开放获取费用基金高级研究员:国家生物科学中心(TIFR)

利益冲突。未声明。

致谢

R.S.和K.S感谢国家生物科学中心(TIFR)的基础设施和印度生物技术部的财政支持。R.S.是英国Wellcome信托基金会的高级研究员。我们感谢匿名推荐人的建设性建议和宝贵意见。

工具书类

1安芬森CB。蛋白质结构的形成和稳定。生物化学。J。1972;128:737–749. [PMC免费文章][公共医学][谷歌学者]
2安芬森CB。控制蛋白质链折叠的原理。科学。1973;181:223–230.[公共医学][谷歌学者]
三。Banavar JR、Maritan A、Micheletti C、Trovato A.蛋白质的几何和物理。蛋白质。2002;47:315–322.[公共医学][谷歌学者]
4Levinthal C.有蛋白质折叠的途径吗?J.烟囱。物理。1968;65:44. [谷歌学者]
5Rao ST,Rossmann MG.蛋白质超二级结构的比较。分子生物学杂志。1973;76:241–256.[公共医学][谷歌学者]
6Deremble C,Lavery R.《大分子识别》。货币。操作。结构。生物。2005;15:171–175.[公共医学][谷歌学者]
7大分子拥挤:明显但未被重视。生物化学趋势。科学。2001;26:597–604.[公共医学][谷歌学者]
8Ouzounis CA、Coulson RM、Enright AJ等。蛋白质结构和功能的分类方案。Nat.Rev.基因。2003;4:508–519.[公共医学][谷歌学者]
9沃思CL,龚S,布伦德尔TL。蛋白质家族进化中的结构和功能约束。自然修订版分子细胞生物学。2009;10:709–720.[公共医学][谷歌学者]
10Wodak SJ,Janin J.大分子识别的结构基础。高级蛋白质化学。2002;61:9–73.[公共医学][谷歌学者]
11Henrick K,Thornton JM.PQS:蛋白质四元结构文件服务器。生物化学趋势。科学。1998;23:358–361.[公共医学][谷歌学者]
12Ali MH,Imperiali B.蛋白质齐聚:如何和为什么。生物有机医药化学。2005;13:5013–5020.[公共医学][谷歌学者]
13.Johnson MS、Srinivasan N、Sowdhamini R、Blundell TL。基于知识的蛋白质建模。批评。生物化学版。分子生物学。1994;29:1–68.[公共医学][谷歌学者]
14Green SM、Gittis AG、Meeker AK、Lattman EE。单体蛋白质二聚体的一步进化。自然结构。生物。1995;2:746–751.[公共医学][谷歌学者]
15.Liu Y,Eisenberg D.三维域交换:随着域的不断交换。蛋白质科学。2002;11:1285–1299. [PMC免费文章][公共医学][谷歌学者]
16Liu Y,Hart PJ,Schlunegger MP,Eisenberg D.核糖核酸酶a的三维域摆动二聚体的晶体结构,分辨率为2.1-a。程序。美国国家科学院。科学。美国。1998;95:3437–3442. [PMC免费文章][公共医学][谷歌学者]
17Yang S、Levine H、Onuchic JN。通过结构域交换实现蛋白质齐聚:分子间相互作用和蛋白质浓度的作用。分子生物学杂志。2005;352:202–211.[公共医学][谷歌学者]
18Bennett MJ,Choe S,Eisenberg D。结构域交换:蛋白质之间的缠绕联盟。程序。美国国家科学院。科学。美国。1994;91:3127–3131. [PMC免费文章][公共医学][谷歌学者]
19Bennett MJ,Choe S,Eisenberg D。二聚白喉毒素在2.0 A分辨率下的精细结构。蛋白质科学。1994;:1444–1463. [PMC免费文章][公共医学][谷歌学者]
20Crestfield AM,Stein WH,Moore S.关于牛胰腺核糖核酸酶的聚集。架构(architecture)。生物化学。生物物理学。1962;(补充1):217–222。[公共医学][谷歌学者]
21Crestfield AM,Stein WH,Moore S.关于牛胰腺核糖核酸酶A的制备。生物学杂志。化学。1963;238:618–621.[公共医学][谷歌学者]
22.Fruchter RG,Crestfield AM。两种活性形式核糖核酸酶二聚体的制备和性质。生物学杂志。化学。1965;240:3868–3874.[公共医学][谷歌学者]
23Alva V,Ammelburg M,Soding J,Lupas AN。关于组蛋白褶皱的起源。BMC结构。生物。2007;7:17. [PMC免费文章][公共医学][谷歌学者]
24Jaskolski M.3D结构域交换、蛋白质齐聚和淀粉样蛋白形成。生物学报。波兰。2001;48:807–827.[公共医学][谷歌学者]
25Bennett MJ,Eisenberg D.蛋白质中3D结构域交换的进化作用。结构。2004;12:1339–1341.[公共医学][谷歌学者]
26Bennett MJ、Sawaya MR、Eisenberg D.沉积疾病和3D域交换。结构。2006;14:811–824.[公共医学][谷歌学者]
27.Bennett MJ,Schlunegger MP,Eisenberg D.3D域交换:低聚物组装的机制。蛋白质科学。1995;4:2455–2468. [PMC免费文章][公共医学][谷歌学者]
28内华达州多科利安市哈雷SD。人类疾病中多肽聚集的分子机制。货币。蛋白质肽。科学。2007;8:573–579.[公共医学][谷歌学者]
29Straub JE,Thirumalai D.淀粉样肽中低聚物形成的原理。货币。操作。结构。生物。2010;20:187–195. [PMC免费文章][公共医学][谷歌学者]
30Thirumalai D、Klimov DK、Dima RI。蛋白质和肽聚集的分子基础上的新想法。货币。操作。结构。生物。2003;13:146–159.[公共医学][谷歌学者]
31Fink AL。蛋白质聚集:折叠聚集体、包涵体和淀粉样蛋白。折叠Des。1998;:R9–R23。[公共医学][谷歌学者]
32Yang S、Cho SS、Levy Y等。域名交换是最不容易的结果。程序。美国国家科学院。科学。美国。2004;101:13786–13791. [PMC免费文章][公共医学][谷歌学者]
33Miller KH,Karr JR,Marqusee S.核糖核酸酶A中的顺脯氨酸铰链区域充当C末端结构域交换的构象守门人。分子生物学杂志。2010;400:567–578. [PMC免费文章][公共医学][谷歌学者]
34Schlunegger MP,Bennett MJ,Eisenberg D.通过3D结构域交换形成低聚物:蛋白质组装和错配的模型。高级蛋白质化学。1997;50:61–122.[公共医学][谷歌学者]
35Ahuja U、Rozhkova A、Glockshuber R等。螺旋交换导致大肠杆菌c型细胞色素成熟蛋白CcmH的N末端结构域二聚化。FEBS通讯。2008;582:2779–2786.[公共医学][谷歌学者]
36Alcantara EH、Kim DH、Do SI、Lee SS。噬菌体T7和K11溶菌酶之间的结构域交换构建的嵌合溶菌酶的双功能活性。生物化学杂志。分子生物学。2007;40:539–546.[公共医学][谷歌学者]
37Andjelkovic M,Maira SM,Cron P,等。区域交换用于研究3-磷酸肌醇依赖性蛋白激酶1和Ser473激酶对蛋白激酶B的调节机制。分子细胞生物学。1999;19:5061–5072. [PMC免费文章][公共医学][谷歌学者]
38Aravind P、Suman SK、Mishra A等。硝基林(一种来自多形亚硝基螺的单域β-结晶蛋白)中的三维结构域交换控制蛋白质构象和稳定性,但不控制二聚体。分子生物学杂志。2009;385:163–177.[公共医学][谷歌学者]
39Back K,Chappell J.使用域切换策略识别萜烯环化酶中的功能域。程序。美国国家科学院。科学。美国。1996;93:6841–6845. [PMC免费文章][公共医学][谷歌学者]
40Back K,Nah J,Lee SB,等。倍半萜环化酶的克隆及其通过结构域交换策略的功能表达。分子细胞。2000;10:220–225.[公共医学][谷歌学者]
41Bakker RA,Dees G,Carrillo JJ等。人体组胺H1受体的结构域交换。《药理学杂志》。实验治疗师。2004;311:131–138.[公共医学][谷歌学者]
42Balciuns D,Ronne H.转录因子jumonji家族中域交换的证据。生物化学趋势。科学。2000;25:274–276.[公共医学][谷歌学者]
43Chan YH,Cheng CH,Chan KM.利用结构域交换研究金鱼(Carassius auratus)生长激素的结构-功能关系。公司。生物化学。生理学。B生物化学。分子生物学。2007;146:384–394.[公共医学][谷歌学者]
44Chintakayala K、Larson MA、Grainger WH等。结构域交换表明DnaG和DnaB的C端和N端结构域分别是功能同源物。摩尔微生物。2007;63:1629–1639. [PMC免费文章][公共医学][谷歌学者]
45.Cho SS,Levy Y,Onuchic JN,Wolynes PG.克服域摇摆中的残余挫折:二硫键在二聚化和聚集中的作用。物理学。生物。2005;2:S44–S55。[公共医学][谷歌学者]
46.Alonso DO,Alm E,Daggett V.通过分子动力学模拟表征细胞周期蛋白p13suc1的去折叠途径:结构域交换的含义。结构。2000;8:101–110.[公共医学][谷歌学者]
47Esposito L,Daggett V.通过分子动力学展开模拟深入了解核糖核酸酶A结构域交换。生物化学。2005;44:3358–3368.[公共医学][谷歌学者]
48林英明,刘红龙,赵建华,等。研究人类胱抑素C结构域交换机制的分子动力学模拟。生物技术。掠夺。2007;23:577–584.[公共医学][谷歌学者]
49.刘红龙,林玉明,赵建华,等。人胱抑素C及其L68Q变异体的分子动力学模拟,以研究结构域交换机制。《生物分子杂志》。结构。动态。2007;25:135–144.[公共医学][谷歌学者]
50Chahine J,Cheung MS。p13suc1可逆结构域交换的计算研究。生物物理学。J。2005;89:2693–2700. [PMC免费文章][公共医学][谷歌学者]
51Cozza G,Moro S,Gotte G.通过3D域交换介导的核糖核酸酶A聚集过程的阐明:一种计算方法揭示了可能的新多聚体结构。生物聚合物。2008;89:26–39.[公共医学][谷歌学者]
52.Gouldson PR、Higgs C、Smith RE等。G蛋白偶联受体的二聚化和结构域交换:一项计算研究。神经精神药理学。2000;23:60系列至S77系列。[公共医学][谷歌学者]
53Shameer K,Pugalenthi G,Kandaswamy KK,et al.使用基于支持向量机的方法,深入研究蛋白质序列和结构衍生特征介导3D域交换机制。生物信息。生物见解。2010;4:33–42. [PMC免费文章][公共医学][谷歌学者]
54Chu CH,Lo WC,Wang HW,等。使用基于角度-距离图像的二级结构匹配技术检测和校准3D域交换蛋白。公共科学图书馆一号。2010;5:e13361。 [PMC免费文章][公共医学][谷歌学者]
55纳格拉多瓦NK。同源寡聚蛋白中的三维结构域交换及其功能意义。生物化学。2002;67:839–849.[公共医学][谷歌学者]
56Vitagliano L、Adinolfi S、Sica F等。牛精液核糖核酸酶的结构域交换产生的潜在变构亚基。分子生物学杂志。1999;293:569–577.[公共医学][谷歌学者]
57Murray AJ、Head JG、Barker JJ、Brady RL。设计一种相互交织的CD2形式,以实现稳定性和组装。自然结构。生物。1998;5:778–782.[公共医学][谷歌学者]
58Lewis RJ、Muchova K、Brannigan JA等。孢子形成反应调节器Spo0A中的域交换。分子生物学杂志。2000;297:757–770.[公共医学][谷歌学者]
59Kumar LV,Rao CM。人类αA和αB结晶蛋白中的结构域交换影响低聚并增强伴侣样活性。生物学杂志。化学。2000;275:22009–22013.[公共医学][谷歌学者]
60Spinelli S、Ramoni R、Grolli S等。单体猪气味结合蛋白的结构揭示了结构域交换机制。生物化学。1998;37:7913–7918.[公共医学][谷歌学者]
61金斯顿RL,Vogt VM。域交换和逆转录病毒组装。分子细胞。2005;17:166–167.[公共医学][谷歌学者]
62Janowski R、Kozak M、Jankowska E等。人类胱抑素C,一种淀粉样蛋白,通过三维结构域交换二聚化。自然结构。生物。2001;8:316–320.[公共医学][谷歌学者]
63Rost B.蛋白质序列比对的黄昏区。蛋白质工程。1999;12:85–94.[公共医学][谷歌学者]
64Chung SY,Subbiah S.蛋白质序列同源性模糊区的结构解释。结构。1996;4:1123–1127.[公共医学][谷歌学者]
65Norwood FL、Sutherland-Smith AJ等。人类肌营养不良蛋白N-末端肌动蛋白结合域的结构以及该域的突变如何导致Duchenne或Becker肌营养不良。结构。2000;8:481–491.[公共医学][谷歌学者]
66Levin I、Schwarzenbacher R、Page R等,《黄颡鱼古球虫PIN(PilT N末端)结构域(AF0591)的晶体结构》,分辨率1.90 a。蛋白质。2004;56:404–408.[公共医学][谷歌学者]
67Nurizzo D、Cutruzzola F、Arese M等。铜绿假单胞菌亚硝酸盐还原酶还原和NO结合时发生的构象变化。生物化学。1998;37:13987–13996.[公共医学][谷歌学者]
68Berman H、Henrick K、Nakamura H、Markley JL。全球蛋白质数据库(wwPDB):确保PDB数据的统一存档。核酸研究。2007;35:D301–D303。 [PMC免费文章][公共医学][谷歌学者]
69Joosten RP、Vriend G.PDB改进始于数据沉积。科学。2007;317:195–196.[公共医学][谷歌学者]
70.拉斯科夫斯基RA。使用从文献中提取的关键数字增强PDBsum中PDB结构的功能注释。生物信息学。2007;23:1824–1827.[公共医学][谷歌学者]
71Sowdhamini R,Blundell TL.一种涉及二级结构聚类分析的自动方法,用于识别蛋白质中的结构域。蛋白质科学。1995;4:506–520. [PMC免费文章][公共医学][谷歌学者]
72.Pugalenthi G,Archunan G,Sowdhamini R.DIAL:用于蛋白质结构域自动识别的网络服务器。核酸研究。2005;33:W130–W132。 [PMC免费文章][公共医学][谷歌学者]
73Zweigenbaum P、Demner Fushman D、Yu H、Cohen KB。生物医学文本挖掘的前沿:当前进展。简要生物信息。2007;8:358–375. [PMC免费文章][公共医学][谷歌学者]
74Rzhetsky A、Seringhaus M、Gerstein M。通过文本挖掘寻找新的生物学。单元格。2008;134:9–13. [PMC免费文章][公共医学][谷歌学者]
75Velankar S、Best C、Beuth B等。PDBe:欧洲蛋白质数据库。核酸研究。2010;38:D308–D317。 [PMC免费文章][公共医学][谷歌学者]
76PyMOL分子图形系统,1.2r3pre版,Schrödinger,LLC。
77伯恩斯坦·HJ。RasMol的最新变化,重组变体。生物化学趋势。科学。2000;25:453–455.[公共医学][谷歌学者]
78Sayle RA,Milner-White EJ公司。RASMOL:面向所有人的生物分子图形。生物化学趋势。科学。1995;20:374.[公共医学][谷歌学者]
79Kawashima S、Pokarowski P、Pokarouwska M等。氨基酸指数:氨基酸指数数据库,2008年进度报告。核酸研究。2008;36:D202–D205。 [PMC免费文章][公共医学][谷歌学者]
80de Castro E、Sigrist CJ、Gattiker A等。ScanProsite:检测蛋白质中的PROSITE特征匹配和ProRule相关的功能和结构残基。核酸研究。2006;34:W362–W365。 [PMC免费文章][公共医学][谷歌学者]
81.Sigrist CJ、Cerutti L、de Castro E等人PROSITE,一个用于功能表征和注释的蛋白质结构域数据库。核酸研究。2010;38:D161–D166。 [PMC免费文章][公共医学][谷歌学者]
82Altschul SF、Madden TL、Schaffer AA等。缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究。1997;25:3389–3402. [PMC免费文章][公共医学][谷歌学者]
83Herráez A.计算机中的生物分子:Jmol去救援。生物化学。教育。2006;34:7.[公共医学][谷歌学者]
84Goodsell DS。用RasMol表示结构信息。货币。协议。生物信息学。2005第5章,第54单元。[公共医学][谷歌学者]
85Mizuguchi K、Deane CM、Blundell TL等。JOY:蛋白质序列-结构表征与分析。生物信息学。1998;14:617–623.[公共医学][谷歌学者]
86Kabsch W,Sander C.蛋白质二级结构词典:氢键和几何特征的模式识别。生物聚合物。1983;22:2577–2637.[公共医学][谷歌学者]
87Barrell D、Dimmer E、Huntley RP等。2009年的GOA数据库——集成的基因本体注释资源。核酸研究。2009;37:D396–D403。 [PMC免费文章][公共医学][谷歌学者]
88Finn RD、Mistry J、Tate J等。Pfam蛋白质家族数据库。核酸研究。2010;38:D211–D222。 [PMC免费文章][公共医学][谷歌学者]
89Velankar S、McNeil P、Mittard-Runte V等。E-MSD:生物信息学的综合数据资源。核酸研究。2005;33:D262–D265。 [PMC免费文章][公共医学][谷歌学者]
90Supek F,Skunca N,Repar J等。翻译选择在原核生物中普遍存在。公共科学图书馆-遗传学。2010;6:e1001004。 [PMC免费文章][公共医学][谷歌学者]
91Carbon S、Ireland A、Mungall CJ等。AmiGO:在线访问本体和注释数据。生物信息学。2009;25:288–289. [PMC免费文章][公共医学][谷歌学者]
92Marchler-Bauer A,Bryant SH.CD-Search:蛋白质域动态注释。核酸研究。2004;32:W327–W331。 [PMC免费文章][公共医学][谷歌学者]
93Marchler-Bauer A、Anderson JB、Derbyshire MK等。CDD:用于交互式域家族分析的保守域数据库。核酸研究。2007;35:D237–D240。 [PMC免费文章][公共医学][谷歌学者]
94.Marchler-Bauer A、Lu S、Anderson JB等。CDD:蛋白质功能注释的保守域数据库。核酸研究。2011;39:D225–D229。 [PMC免费文章][公共医学][谷歌学者]
95Shameer K,Sowdhamini R.IWS:用于蛋白质序列和结构分析的集成网络服务器。生物信息。2007;2:86–90. [PMC免费文章][公共医学][谷歌学者]
96Kawashima S,Kanehisa M.氨基酸索引:氨基酸索引数据库。核酸研究。2000;28:374. [PMC免费文章][公共医学][谷歌学者]
97Gattiker A、Gasteiger E、Bairoch A.ScanProsite:PROSITE扫描工具的参考实现。申请。生物信息学。2002;1:107–108.[公共医学][谷歌学者]
98贝特曼·A·世界策展人联合起来:国际生物保护学会。生物信息学。2010;26:991.[公共医学][谷歌学者]
99.Howe D、Costanzo M、Fey P等。大数据:生物化的未来。自然。2008;455:47–50. [PMC免费文章][公共医学][谷歌学者]
100Li C、Donizelli M、Rodriguez N等。生物模型数据库:已发布定量动力学模型的增强、管理和注释资源。BMC系统。生物。2010;4:92. [PMC免费文章][公共医学][谷歌学者]
101Culhane AC、Schwarzl T、Sultana R等人。GeneSigDB——一个精心策划的基因表达特征数据库。核酸研究。2010;38:D716–D725。 [PMC免费文章][公共医学][谷歌学者]
102Lima T、Auchincloss AH、Coudert E等。HAMAP:UniProtKB/Swiss-Prot中完全测序的微生物蛋白质组集和手动筛选的微生物蛋白质家族的数据库。核酸研究。2009;37:D471–D478。 [PMC免费文章][公共医学][谷歌学者]
103.Pruitt KD、Tatusova T、Maglott DR.NCBI参考序列(RefSeq):基因组、转录物和蛋白质的精选非冗余序列数据库。核酸研究。2007;35:D61–D65。 [PMC免费文章][公共医学][谷歌学者]
104Seebah S,Suresh A,Zhuo S,et al.防御素知识库:一个人工管理的数据库和信息源,专注于抗菌肽防御素家族。核酸研究。2007;35:D265–D268。 [PMC免费文章][公共医学][谷歌学者]
105Li H,Coghlan A,Ruan J,et al.TreeFam:动物基因家族系统发育树的精选数据库。核酸研究。2006;34:D572–D580。 [PMC免费文章][公共医学][谷歌学者]
106Hodges PE、Payne WE、Garrels JI。酵母蛋白质数据库(YPD):酿酒酵母的精选蛋白质组数据库。核酸研究。1998;26:68–72. [PMC免费文章][公共医学][谷歌学者]
107Shameer K,Pugalenthi G,Kandaswamy KK,et al.使用基于支持向量机的方法,深入研究蛋白质序列和结构衍生特征介导3D域交换机制。生物信息学。洞察力。2010;4:10. [PMC免费文章][公共医学][谷歌学者]
108Shameer K,Pugalenthi G,Kandaswamy KK,et al.3dswap-pred:使用随机森林方法预测蛋白质序列的3D结构域交换。蛋白肽Lett。2011;18[公共医学][谷歌学者]
109Huss JW,3rd,Orozco C,Goodale J,et al.基因功能社区注释的基因维基。《公共科学图书馆·生物》。2008;6:e175。 [PMC免费文章][公共医学][谷歌学者]
110Stehr H、Duarte JM、Lappe M等。PDBWiki:通过蛋白质数据库的社区注释增加价值。数据库。20104月16日(doi:10.1093/database/baq009;印刷前的epub)[PMC免费文章][公共医学][谷歌学者]
111.Pico AR、Kelder T、van Iersel MP等,《WikiPathways:为人们编辑路径》。《公共科学图书馆·生物》。2008;6:e184。 [PMC免费文章][公共医学][谷歌学者]
112Cuff AL、Sillitoe I、Lewis T等。CATH分类重温——回顾了超家族中的架构和表征结构差异的新方法。核酸研究。2009;37:D310–D314。 [PMC免费文章][公共医学][谷歌学者]
113Szklarczyk D、Franceschini A、Kuhn M等。2011年的STRING数据库:全球整合和评分的蛋白质功能相互作用网络。核酸研究。2011;39:D561–D568。 [PMC免费文章][公共医学][谷歌学者]
114Letunic I、Doerks T、Bork P.SMART 6:最新更新和新发展。核酸研究。2009;37:D229–D232。 [PMC免费文章][公共医学][谷歌学者]
115.Wu C,Orozco C,Boyer J,等。BioGPS:一个可扩展和可定制的门户,用于查询和组织基因注释资源。基因组生物学。2009;10:R130。 [PMC免费文章][公共医学][谷歌学者]

文章来自数据库:《生物数据库与治疗杂志》由提供牛津大学出版社