跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2011; 2011年:bar035。
2011年9月16日在线发布。 doi(操作界面):10.1093/数据库/bar035
预防性维修识别码:PMC3263597型
PMID:21930505

内塞里亚基础:比较基因组数据库脑膜炎奈瑟菌

摘要

脑膜炎奈瑟菌是一种重要的病原体,会导致危及生命的疾病,包括脑膜炎、败血症,在某些情况下还会导致肺炎。基因组研究对脑膜炎双球菌但需要大量的数据库资源来处理完整测序和注释基因组所带来的丰富信息。为了满足这一需求,我们开发了内塞里亚Base(NBase)是一个比较基因组数据库和基因组浏览器,可容纳和显示公开可用的内容脑膜炎双球菌基因组。除了现有的脑膜炎双球菌基因组序列,我们使用454焦测序和CG-Pipeline基因组分析工具对19个新基因组进行了测序和注释。总共,NBase主机27个已完成脑膜炎双球菌基因组序列及其相关注释。NBase平台设计为可扩展的,通过底层数据库模式和模块化代码体系结构,这样它可以很容易地合并新的基因组及其相关注释。NBase的首页通过搜索、浏览和下载为用户提供对这些基因组的访问。NBase搜索实用程序包括基于BLAST的序列相似性搜索以及各种语义搜索选项。使用GBrowse平台的修改版本可以浏览所有基因组,使用定制的详细信息页面可以查看每个基因的大量信息。NBase还有一个全基因组比较工具,可以在两组用户定义的基因组之间产生单核苷酸多态性差异。以ST-11毒力谱系为例,我们展示了如何利用这种比较基因组学的实用性来识别新的基因组标记,以便对脑膜炎奈瑟菌。

数据库URL: http://nbase.biology.gatech.edu

介绍

流行性脑脊髓膜炎

脑膜炎奈瑟菌是一种革兰氏阴性包裹细菌,是全球细菌性脑膜炎的主要病因(1). 脑膜炎球菌病的病死率为10–14%,另有11–19%的幸存者有耳聋和精神发育迟滞等长期神经后遗症(2). 了解循环菌株的基因组学是了解脑膜炎双球菌例如,最近一个名为BIGSdb的数据库利用脑膜炎球菌基因组中的基因座生成可定制的分子图谱(). 这些配置文件显示了高质量的分辨率键入数据。我们的需要包括搜索整个基因组,以确定菌株之间表型差异的基因组决定因素。为了满足这些需求,疾病控制与预防中心(CDC)的脑膜炎实验室采用了基因组学方法来研究脑膜炎双球菌.

基因组学和生物信息学脑膜炎双球菌

目前正在进行一些努力来确定脑膜炎双球菌基因组序列以及该生物体的基因组数据量在不久的将来将呈指数级增长。CDC最近使用了下一代测序技术(4)描述19脑膜炎双球菌基因组用于研究各种特征,包括囊膜转换。在撰写本文时脑膜炎双球菌基因组序列已经在别处进行了表征(5–12).

能够处理这些数据并具有足够扩展能力以适应预期快速增长的生物信息学工具脑膜炎双球菌基因组序列是必不可少的。工作生物学家可以访问并使用的计算基因组学应用程序也很重要。我们的团队通过开发一个全自动分析管道来解决这些挑战的一个方面,该管道可以获取基因组序列数据,并依次执行基因组组装、基因预测和功能注释http://sourceforge.net/projects/cg-pipeline/) (6). 该管道允许调查人员快速访问个人注释脑膜炎双球菌基因组无需费力的人工分析。然而,一旦掌握了这些数据,研究人员仍然需要一种方法来可视化这些信息,并比较不同基因组之间的注释数据和序列。开发和维护一个共享平台,用于存储和传播脑膜炎双球菌基因组项目。为了实现这些目标,我们开发了内塞里亚Base(NBase),一个在线平台,用于存储、传播和比较分析脑膜炎双球菌在美国疾病控制与预防中心和其他地方鉴定的基因组。NBase允许用户浏览、搜索和下载基因组序列和注释脑膜炎双球菌该数据库还包括比较基因组分析应用程序,包括SNPtool,它允许用户发现区分两组用户选择的脑膜炎双球菌基因组。在本文中,我们提供了一个全基因组比较的示例。NBase平台的设计具有可扩展性,因此它可以很容易地合并大量新基因组及其相关注释。NBase是一种免费的社区资源,可以在http://nbase.biology.gatech.edu.

材料和方法

基因组数据

总共19个脑膜炎双球菌在美国疾病控制与预防中心生物技术核心设施分部使用454焦磷酸测序法对基因组序列进行了表征,并在佐治亚理工学院进行了分析。另外九个脑膜炎双球菌之前描述过的基因组也包含在NBase中。补充表S1显示了NBase中的基因组列表,以及描述其起源的元数据。使用CG-Pipeline(版本0.2.1-0.2.4)自动基因组分析平台分析CDC的基因组序列数据。

在组装阶段,最好的参考基因组组装,或最好的从头开始选择组件进行进一步分析。在得到的集合上,我们使用同源搜索和从头算方法。在这些基因预测中,我们使用包括17种不同注释应用程序的组合方法执行了自动功能注释。注释步骤生成GenBank格式的平面文件。这些GenBank文件被转换为通用特征格式(GFF)以导入NBase。有关基因组测序协议和基因组分析程序的更多详细信息,请参阅CG-Pipeline的报告(6).

软件组件

为了构建NBase,我们使用了几个软件组件:GBrowse 2.00(13),BLAST版本2.2.17(14),Perl 5.8.8,BioPerl 1.6.1。(15),毛韦2.2.0(16),肌肉3.6(17)和JalView 2.5.1(18,19). NBase基于MySQL 5.0版,并使用Apache 2.0版Web服务器应用程序托管(http://mysql.com,http://apache.org).

多序列比对

全基因组多序列比对(MSA)由27个基因组构建(补充表S1)使用MAUVE程序的mauveAligner算法。mauveAligner算法生成所有基因组共享的共线同源区域的局部比对,称为局部共线块(LCB)。通过使用程序MUSCLE进一步校准每个LCB,而不使用优化选项。

序列类型的确定

对于这里表征的七个新基因组,使用全基因组序列确定了序列类型(ST)。为此,将整个基因组与PubMLST数据库进行比较(20)寻找并执行所有7个基因座的等位基因调用。唯一不明确的序列是adk公司对M16917进行了重新排序,以确认其身份。否则,这些基因组没有新的等位基因,也没有与MLST位点不完全匹配的基因。对于剩下的12个基因组,通过常规测序方法测定STs(21).

ST-11基因组与其他基因组的比较

比较基因组学实用程序SNPtool评估完整基因组序列的MSA,以发现区分两个用户定义的基因组组的单个单核苷酸多态性(SNP)。SNPtool用于比较ST-11基因组序列(菌株FAM18、M13519、M16917、M17661、M18774、M15141和M9261)与代表7个不同ST:32、74、4824、198、177、53和7(菌株M13220、α14、M17094、M10699、M15293、M5178、MC58、8013、M17062和053442)的其他10个完整基因组序列。将M13220菌株的基因组序列用作此比较的参考,并将区分这两组基因组的SNP位置作为M13220基因组上的坐标。使用Sanger测序的MLST位点序列验证了使用SNPtool区分ST-11和非ST-11基因组组的10个单核苷酸多态性。SNP验证分析比较了10株ST-11菌株与10株非ST-11株的序列,这些非ST-11-菌株代表了其他7株ST,并与SNPtool进行了比较。

内塞里亚底座

首页

NBase首页是NBase中所有数据、工具和分析功能的门户。NBase的首页设计得很简单。用户可以选择从首页执行以下操作之一:(i)查看元数据;(ii)下载;(iii)浏览;(iv)搜查;或(v)进行SNP分析。

元数据是关于每个基因组的信息,位于左侧导航栏上(图1C) 。有关每个隔离的信息,例如地理来源、隔离日期和配置文件信息显示在列中。基因组数据可在生物体表中以标准文件格式(GenBank、FASTA和GFF)下载。此外,该综合项目生成的所有软件,包括CG-Pipeline,都可以从主页下载。在校准查看器页面上,可以通过读取Clustal格式的纯文本或使用JalView小程序来查看所有可用基因组的每个LCB的多序列校准(18,19). JalView包括按需生成系统发育树的功能,这有助于观察特定区域菌株之间的相似性。

保存图片、插图等的外部文件。对象名称为bar035f1.jpg

首页侧栏。侧栏提供了对基因组浏览器、搜索功能和元数据的访问。(A类)要进行浏览,用户可以选择基因组和重叠群以进入GBrowse界面。(B)要进行搜索,用户可以提供关键字,也可以选择通过多个搜索项之一进行搜索。(C类)基因组元数据可通过生物体数据链接获得(补充表S1). 将提供指向路线数据页的链接。

用户可以通过从侧栏上的下拉菜单中选择有机体来浏览基因组(图1A) ●●●●。选择基因组后,会显示可用的连接或染色体。由于覆盖范围的考虑,大多数454组件将无法完成(22)或重复元素(23)因此,NBase上的大多数基因组是在contig水平上而不是在染色体水平上可见的。选择重叠群或染色体后,用户将进入GBrowse(13)图形界面(参见“基因组浏览器”部分)。

到达GBrowse界面的另一种方法是搜索特定的基因组特征。在这种情况下,基因组特征是基因组中的任何注释标志,包括基因和所有相关注释。搜索类别位于“搜索”页面的侧栏中(图1B) ●●●●。搜索结果可以过滤到选定的生物体、特征类型(例如基因)和/或注释源。注释源对应于CG-Pipeline基因组分析工具中使用的不同注释应用程序(6). 每种特定类型的搜索都允许包含更具体的参数,如基因长度。如果用户不想使用特定搜索,则提供常规关键字搜索。搜索基因组序列的另一种方法是使用BLAST界面中五个BLAST程序中的任意一个。通过单击BLAST结果,用户可以到达GBrowse界面。

用户可以从首页顶部的SNPtool选项卡导航到SNP分析工具SNPtoll。SNPtool使用综合MSA来发现SNP,这些SNP显示两组用户定义的基因组之间的互斥模式(图2). 这些SNP作为区分两组基因组的标记。要使用SNPtool,用户需要将所需的基因组拖到第一组或第二组中,以定义每个组。接下来,用户提供参考基因组,以便可以在GBrowse界面中显示结果。SNPtool输出参考基因组基因组空间中定义的所有识别SNP的坐标,以及与识别SNP相关的基因列表。这些SNP基因被定义为在其编码区域和/或在预测编码起始/终止位点的用户定义区域上游和下游具有识别SNP的基因。以前SNPtool选择的所有结果都可以通过SNPtoll页面上的超链接访问,用户可以在Genome浏览器部分查看所选结果。

保存图片、插图等的外部文件。对象名为bar035f2.jpg

SNP工具。SNPtool发现两组基因组之间存在差异性SNP。每个组由用户通过将每个基因组拖动到指定的组来定义。并非所有基因组都必须使用。必须指定参考基因组,因为可以从所选参考基因组的有利位置在图形基因组浏览器上查看结果。侵入性分离株以红色表示,以蓝色表示。

基因组浏览器

我们选择使用GBrowse,因为它是可定制的、开源的、快速可靠的(13). 它也是一个经过验证的基因组浏览器,被一些机构用于其他几种生物体,因此许多用户都熟悉该界面(24–26)(GMOD用户,http://gmod.org/wiki/gmod_用户). 我们使用GFF模式用MySQL数据库实现了GBrowse。我们能够使用这个未经修改的模式在单个数据库中存储多基因组注释,并使用GBrowse快速加载特征注释。这种方法的使用也有助于快速方便地同化新基因组序列和注释的可扩展性。

NBase还设计为可扩展,以添加新应用程序。这是通过对GBrowse下的数据库模式进行格式化来实现的。目前,我们所有的搜索工具,无论是基于文本还是基于序列,都查询运行GBrowse的同一个MySQL数据库。当任何新的应用程序添加到站点时,它们将被设计为查询相同的数据库,而对模式几乎没有修改。此外,浏览器和相关实用程序的整个源具有模块化设计,以便于将来添加到网站。

GBrowse为用户提供了基因组选定区域的线性地图,基因组特征显示在各自的坐标上(图3). 用户可以放大和缩小,沿着序列向上和向下移动,并配置序列特征的显示。GBrowse使用语义查看,这是指在放大或缩小描述时显示的详细程度。从远处看,要素仅显示为显示方向性的彩色箭头。在中等缩放时,可以看到功能的名称。近距离观察,可以看到单个核苷酸和氨基酸残基。

保存图片、插图等的外部文件。对象名称为bar035f3.jpg

基因组描述。基因组是线性表示的,其特征位于各自的坐标上。(A类)基因及其编码序列(CDS)都有自己的轨迹,并链接到自己的详细信息页面。(B)上传的曲目。

只有打开基因、核苷酸和残基各自的轨迹,才能查看它们。此外,用户可以使用正确的文件格式提供自己的自定义轨迹来覆盖和比较特征(补充图S1). 添加自定义轨迹的一个示例是使用SNPtool的结果。SNPtool的结果,即识别SNP和SNP基因的列表,可以上传到NBase并与其他轨迹进行比较(图3).

详细信息页面

单击功能将用户带到详细信息页面(图4). 每个特征都有一些基本特征,如名称、长度和坐标。对于CG-Pipeline产生的数据或已经存在于导入基因组中的数据,还可以获得大量附加信息。CG-Pipeline使用UniProt数据库注释基因(27)和InterProScan(28). 此外,它预测了TMHMM的跨膜螺旋(29),信号肽与信号肽(30)和毒力因子数据库中的毒力基因(31,32). 所有这些注释都存在于NBase中。详细信息页面包含指向联机UniProt和InterProScan数据库的超链接,注释是从这些数据库中派生出来的。

保存图片、插图等的外部文件。对象名为bar035f4.jpg

详细信息页面。显示了编码序列的一些特征的细节。可能出现多达五种重叠的特征类型:基因、蛋白质、蛋白质结构域、信号肽和跨膜结构。目标特征以黄色高亮显示。此功能的核苷酸和氨基酸序列显示在页面底部。页面上的所有功能都包含指向GBrowse基因组查看器中坐标的链接。

使用SNPtool进行基因组分型

在这里,我们说明了NBase的潜在应用,以及其中编码的比较基因组学实用程序,用于脑膜炎双球菌.当前的键入协议,如MLST(21),是基于个体标记或等位基因的组合。在MLST中,对七个预定义的基因座进行测序,并调用它们的等位基因来产生一个称为ST的图谱。在撰写本文时,每个基因座定义了几百个等位基因,定义了>8500个ST(20). 虽然这种方法很强大,但基因组尺度比较分析应该能够为分型提供更高的分辨率。在这里,我们说明了如何使用SNPtool来帮助发现新的标记,这些标记定义了已知的脑膜炎双球菌.

ST 11

脑膜炎奈瑟菌ST-11与疾病的相关性高于其他任何ST(33–35). 我们评估了SNPtool在发现新的基因组标记方面的实用性,这些标记描述了高毒力ST-11谱系。为此,我们将NBase中的完整ST-11脑膜炎球菌基因组与其他10个进行了比较脑膜炎双球菌其中的基因组序列代表其他七种不同的ST。将这两组基因组与SNPtool进行比较,得到7822个SNP,这些SNP显示了ST-11基因组和其他七个评估的ST之间的互斥模式。所有这些位点都代表了ST-11的可能标记,根据定义,这些标记可以将ST-11与其他ST区分开来,从而提高了分型的分辨率。我们使用MLST基因座序列验证了其中10个SNP,发现每个验证的位置都明确区分了ST-11基因组和其他7个评估的ST(补充表S2). 这些结果证明了SNPtool能够在单个核苷酸变异水平上识别基因组组之间的许多差异,每个差异都可以作为潜在的谱系特异性标记。值得注意的是,SNPtool在某种意义上是保守的,它依赖于NBase中所有基因组共享的对齐区域;较小的基因组组可能在这些保守区域之外具有额外的识别SNP。

讨论

目前还有其他几个可用的neisserial数据库(36–40). 其他内塞里亚基因组浏览器具有显著优势,尤其是NeMeSys(11),它提供了非常有用的工具,在查看基因组时提供了一个同步视角,并包含基因组8013的突变研究(41). NBase是专门设计的,可以方便地容纳使用CG-Pipeline分析的新基因组,该管道是开源的,可以在台式计算机上本地运行。

只使用开源软件有很多优点。首先,许多用户都熟悉GBrowse界面,因此减少了学习如何使用和导航NBase所需的时间。第二,GBrowse的所有新插件都可以根据需要整合到NBase中(例如,下载基因组中选定区域的插件)。第三,属于通用模型生物数据库项目(GMOD)的所有现有软件都可以被吸收到NBase中。例如,在未来,我们将合并到NBase GMOD的SynView中,它是GBrowse的synteny查看器(42). SynView是一个比较基因组学工具,用于显示MSAs的可视化。这将使研究人员能够可视化和比较基因组中的同源区域。

NBase允许搜索、浏览和下载整个基因组,包括集合和注释。我们总共有27个脑膜炎球菌基因组可用于这些任务。NBase的核心是GBrowse,它有一个简单而高级的数据库结构,有一个用于浏览基因组的图形界面。GBrowse还为基因组中每个特征的详细信息页面的使用提供了便利,以便用户能够看到基因组的广度和深度。最后,NBase的区别在于其比较基因组学效用。在这里,我们通过结合自定义比较基因组学工具SNPtool,展示了NBase的灵活性和可扩展性。SNPtool比较了两组基因组,并显示了不同的SNP及其相关SNP基因。我们已经证明,SNPtool可以用于在基因组水平上比较整个菌株组,以发现单个显著的SNP。这有助于发现ST-11的基因组标记。

补充数据

补充数据可在数据库在线。

基金

疾病控制和预防中心(1 R36 GD000075-1号至L.S.K.);阿尔弗雷德·斯隆计算和进化分子生物学研究奖学金(BR-4839型提交给I.K.J.);乔治亚研究联盟(政府科学研究机构联合会。VAC09型.O至I.K.J.、B.H.H.、L.W.M.和L.S.K.];佐治亚理工学院生物信息学项目[致J.C.H.、P.J.、N.V.S.、V.N.);国防高级研究项目局(HR0011-05-1-0057型至A.O.K.)。开放获取费用的资金来源:佐治亚理工学院生物信息学项目。

利益冲突。未声明。

致谢

我们要感谢生物技术核心设施分支机构的伊丽莎白·纽豪斯(Elizabeth Neuhaus)、德瓦尼·戈维尔(Dhwani Govil)和斯科特·萨蒙斯(Scott Sammons)对我们的指导。感谢斯科特·凯恩(Scott Cain)最初向我们演示了GBrowse平台。感谢您参加乔治亚理工学院(the Georgia Institute of Technology)2008-2010年的Compgenomics课程。感谢Nancy Messonnier审阅本文并提供宝贵反馈。许多人捐献了菌株用于研究,包括来自活性细菌核心监测项目的菌株。我们感谢捐献以下分离物用于研究的人的辛勤工作:M20918、M13220、M18575、M17277、M16207、M17094、M10699、M5178、M15141、M17062、M15293、M16917、M13159、M17661、M18774、M9261、M11791、M14900和M20899。

工具书类

1Rosenstein NE、Perkins BA、Stephens DS等。脑膜炎球菌病。北英格兰。医学杂志。2001;344:1378–1388.[公共医学][谷歌学者]
2Bilukha OO,Rosenstein N.脑膜炎球菌病的预防和控制。免疫做法咨询委员会的建议MMWR建议。代表。2005;54:1–21.[公共医学][谷歌学者]
三。Jolley KA少女MC。第17届国际致病性奈瑟菌会议记录。加拿大阿尔伯塔省班夫:2010年。内塞里亚人口基因组学:将全基因组数据与流行病学和人口生物学的多基因座方法相结合;第47页。[谷歌学者]
4Margulies M,Egholm M,Altman WE,et al.微加工高密度微晶反应器中的基因组测序。自然。2005;437:376–380. [PMC免费文章][公共医学][谷歌学者]
5Bentley SD、Vernikos GS、Snyder LA等。通过对血清组C菌株FAM18的比较分析观察脑膜炎球菌的遗传变异机制。公共科学图书馆-遗传学。2007;:e23。 [PMC免费文章][公共医学][谷歌学者]
6Kislyuk AO、Katz LS、Agrawal S等。原核测序项目的计算基因组学管道。生物信息学。2010;26:1819–1826. [PMC免费文章][公共医学][谷歌学者]
7Parkhill J,Achtman M,James KD,et al.一株血型a菌株的完整DNA序列脑膜炎奈瑟菌Z2491号。自然。2000;404:502–506.[公共医学][谷歌学者]
8彭杰,杨磊,杨凤,等。ST-4821配合物的表征,一种独特的脑膜炎奈瑟菌克隆。基因组学。2008;91:78–87.[公共医学][谷歌学者]
9Tettelin H,Saunders NJ,Heidelberg J等脑膜炎奈瑟菌血清群B菌株MC58。科学。2000;287:1809–1815.[公共医学][谷歌学者]
10Joseph B、Schneiker-Bekel S、Schramm-Gluck A等。血清组B携带和疾病株的比较基因组生物学支持脑膜炎球菌毒力的多基因性质。《细菌学杂志》。2010;192:5363–5377. [PMC免费文章][公共医学][谷歌学者]
11Rusniok C、Vallenet D、Floquet S等。NeMeSys:缩小人类病原体序列和功能之间差距的生物资源脑膜炎奈瑟菌.基因组生物学。2009;10:R110。 [PMC免费文章][公共医学][谷歌学者]
12Schoen C、Blom J、Claus H等。疾病株和携带株的全基因组比较提供了对脑膜炎奈瑟菌.程序。美国国家科学院。科学。美国。2008;105:3473–3478. [PMC免费文章][公共医学][谷歌学者]
13.Stein LD、Mungall C、Shu S等。通用基因组浏览器:模型生物系统数据库的构建块。基因组研究。2002;12:1599–1610. [PMC免费文章][公共医学][谷歌学者]
14Altschul SF、Madden TL、Schaffer AA等。缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究。1997;25:3389–3402. [PMC免费文章][公共医学][谷歌学者]
15.Stajich JE,Block D,Boulez K等。Bioperl工具包:生命科学的Perl模块。基因组研究。2002;12:1611–1618. [PMC免费文章][公共医学][谷歌学者]
16Darling A,Mau B,Blattner F,et al.Mauve:具有重排的保守基因组序列的多重比对。基因组研究。2004;14:1394–1403. [PMC免费文章][公共医学][谷歌学者]
17埃德加钢筋混凝土。肌肉:高精度和高通量的多序列比对。核酸研究。2004;32:1792–1797. [PMC免费文章][公共医学][谷歌学者]
18Clamp M、Cuff J、Searle SM等。Jalview Java对齐编辑器。生物信息学。2004;20:426–427.[公共医学][谷歌学者]
19Waterhouse AM、Procter JB、Martin DM等。Jalview Version 2–多序列比对编辑器和分析工作台。生物信息学。2009;25:1189–1191. [PMC免费文章][公共医学][谷歌学者]
20Jolley KA、Chan MS、Maiden MC.mlstdbNet-分布式多位点序列分型(MLST)数据库。BMC生物信息学。2004;5:86. [PMC免费文章][公共医学][谷歌学者]
21Maiden MC,Bygraves JA,Feil E,等。多焦点序列分型:一种便携式方法,用于鉴定致病微生物种群中的克隆。程序。美国国家科学院。科学。美国。1998;95:3140–3145. [PMC免费文章][公共医学][谷歌学者]
22.Lander ES,Waterman MS通过指纹随机克隆进行基因组图谱绘制:一种数学分析。基因组学。1988;2:231–239.[公共医学][谷歌学者]
23Pop M、Phillippy A、Delcher AL等。比较基因组组装。简介。生物信息。2004;5:237–248.[公共医学][谷歌学者]
24Bieri T、Blasiar D、Ozersky P等人。WormBase:新内容和更好的访问。核酸研究。2007;35:D506–D510。 [PMC免费文章][公共医学][谷歌学者]
25Drysdale R.FlyBase:果蝇属研究社区。方法分子生物学。2008;420:45–59.[公共医学][谷歌学者]
26Elsik CG、Worley KC、Zhang L等。社区注释:程序、协议和支持工具。基因组研究。2006;16:1329–1333.[公共医学][谷歌学者]
27Uniprot财团。2010年的Universal Protein Resource(UniProt)。核酸研究。2010;38:D142–D148。 [PMC免费文章][公共医学][谷歌学者]
28Mulder N、Apweiler R.InterPro和InterProScan:蛋白质序列分类和比较工具。方法分子生物学。2007;396:59–70.[公共医学][谷歌学者]
29Krogh A、Larsson B、von Heijne G等。用隐马尔可夫模型预测跨膜蛋白拓扑结构:应用于完整基因组。分子生物学杂志。2001;305:567–580.[公共医学][谷歌学者]
30Bendtsen JD、Nielsen H、von Heijne G等。信号肽预测的改进:SignalP 3.0。分子生物学杂志。2004;340:783–795.[公共医学][谷歌学者]
31Chen L,Yang J,Yu J,等。VFDB:细菌毒力因子参考数据库。核酸研究。2005;33:D325–D328。 [PMC免费文章][公共医学][谷歌学者]
32Yang J,Chen L,Sun L,et al.VFDB 2008 release:一个增强的比较病理学网络资源。核酸研究。2008;36:D539–D542。 [PMC免费文章][公共医学][谷歌学者]
33Yazdankhah SP、Kriz P、Tzanakaki G等,疾病相关和携带分离物中血清组和基因型的分布脑膜炎奈瑟菌来自捷克共和国、希腊和挪威。临床杂志。微生物。2004;42:5146–5153. [PMC免费文章][公共医学][谷歌学者]
34Cohn AC、MacNeil JR、Harrison LH等脑膜炎奈瑟菌1998-2007年美国疾病流行病学:对脑膜炎球菌病预防的影响。临床。感染。数字化信息系统。2010;50:184–191.[公共医学][谷歌学者]
35施密克·S、沃森·JT、库尔森·GB等脑膜炎奈瑟菌2003年伊利诺伊州芝加哥市男男性行为者脑膜炎球菌病暴发的分离物。临床杂志。微生物。2007;45:3768–3770. [PMC免费文章][公共医学][谷歌学者]
36Kent WJ、Sugnet CW、Furey TS等。UCSC的人类基因组浏览器。基因组研究。2002;12:996–1006. [PMC免费文章][公共医学][谷歌学者]
37Dehal PS、Joachimiak MP、Price MN等。MicrobesOnline:比较基因组学和功能基因组学的集成门户。核酸研究。2010;38:D396–D400。 [PMC免费文章][公共医学][谷歌学者]
38Aurrecoecha C,Heiges M,Wang H,et al.ApiDB:顶级复合生物信息学资源中心的集成资源。核酸研究。2007;35:D427–D430。 [PMC免费文章][公共医学][谷歌学者]
39Sayers EW、Barrett T、Benson DA等。国家生物技术信息中心数据库资源。核酸研究。2010;38:D5–D16。 [PMC免费文章][公共医学][谷歌学者]
40Flicek P、Aken BL、Ballester B等,合奏团第十年。核酸研究。2010;38:D557–D562。 [PMC免费文章][公共医学][谷歌学者]
41Geoffroy MC,Floquet S,Metais A等。通过基因破坏对脑膜炎球菌基因组的大规模分析:对补体介导的裂解的耐药性。基因组研究。2003;13:391–398. [PMC免费文章][公共医学][谷歌学者]
42Wang H,Su Y,Mackey AJ,等。SynView:一种兼容GBrowse的方法,用于可视化比较基因组数据。生物信息学。2006;22:2308–2309.[公共医学][谷歌学者]

文章来自数据库:《生物数据库与治疗杂志》由以下人员提供牛津大学出版社