SUPERFAMILY 1.75 HMM库和基因组分配服务器

SUPERFAMILY 2可从supfam.org。拜托联系我们如果你遇到任何问题。

超域2GO推理和超域表型本体(SPPO)

跳转到[顶部·SP2PO公司·SPPO公司·数据可用性]

本文档解释了超域PO注释背后的详细信息。蛋白质的结构分类(SCOP公司)数据库(Andreeva等人,2008)将域定义为结构的单位和作为的最小单位进化与GO一样,已经开发了表型本体论(PO,如下所示),用于分类和组织与人类/模型生物体相关的表型信息,从最高层的非常一般的术语到DAG中更具体的术语。

  • 疾病本体论(执行)是一个标准化的人类疾病本体,通过将DO术语广泛交叉映射到MeSH、ICD、NCI的同义词库、SNOMED和OMIM(Schriml等人,2009),在语义上整合了疾病和医学词汇。也可以获得它们在人类基因组上的映射(Osborne等人,2009年)。

  • 人类表型本体(惠普)捕获OMIM中描述的表型异常以及相应的致病基因(Robinson等人,2008)。它包括三个互补的生物学概念:遗传模式(MI)、ONset和临床过程(ON)以及表型异常(PA)。

  • 哺乳动物/小鼠表型本体(MP公司)描述了特定基因被遗传破坏后小鼠的表型(Smith等人,2009)。使用它,小鼠基因组信息学(MGI)为小鼠提供高覆盖率的基因水平表型。

  • 蠕虫表型本体(可湿性粉剂)对秀丽线虫和其他线虫的表型描述进行分类和组织(Schindelman等人,2011)。使用它,WormBase为秀丽线虫的表型注释提供了主要资源。

  • 酵母表型本体(YP公司)是“子囊菌表型本体论”的主要贡献者。利用它,酿酒酵母基因组数据库(SGD)提供了酵母基因组中每个基因的单一突变表型(Engel等人,2010)。

  • 苍蝇表型本体(计划)指FlyBase控制的词汇表。具体而言,FlyBase中的等位基因注释(针对其诱变剂等)使用结构化受控词汇(Grumbing等,2006年)。

  • 苍蝇解剖学本体(FA公司)是黑腹果蝇解剖结构的结构化受控词汇,用于描述表型和基因表达位置(Grumbing等人,2006)。

  • 斑马鱼解剖本体(南非)显示了使用标准解剖学命名法的斑马鱼的解剖学术语,以及受影响的基因(Bradford等人,2011)。

  • 爪蟾解剖本体(XA公司)代表青蛙(非洲爪蟾和热带爪蟾)的组织谱系和发育时间。它用于注释爪蟾基因表达模式以及突变和变体表型(Bowes等人,2009年)。

  • 拟南芥植物本体(AP公司)是植物本体论的主要贡献者,该本体论描述了植物的无原子和形态结构(PAN)以及生长和发育阶段(PDE)。《拟南芥信息资源》(TAIR)为模式高等植物拟南芥(Arabidopsis thaliana)提供了拟南芥子植物本体注释(Ilic等人,2006;Pujar等人,2006)。

为了合并非OBO格式的本体,该方法也适用于其他具有固定长度或简化层次的本体:

  • 酶委员会(电子计算机)是一个专注于酶命名的资源,这是一个与UniProts交叉引用的酶(蛋白质催化剂)命名系统(Fleischmann等人,2004)。它使用四位数的EC编号来定义催化的反应。前三位数字用于定义催化的反应,第四位数字用于唯一标识符(序列号)。

  • DrugBank ATC代码(数据库)根据其作用的器官或系统(第一级,解剖主组)及其治疗(第二级,治疗亚组)、药理(第三级,药理亚组)和化学性质(第四级,化学亚组;第五级,化学物质),将其分为五个不同的级别。仅考虑DrugBank中的药物和具有解剖治疗化学(ATC)分类系统的药物(Knox等人,2011年)。

  • UniProtKB关键字(千瓦)受控词汇表,提供条目内容的摘要,用于基于10个类别(此处不包括“技术术语”类别)为UniProtKB/Swiss-Prot条目编制索引。每个关键字手动归属于UniProtKB/Swiss-Prot条目,并自动归属于UniProtKB/TrEMBL条目(根据特定注释规则)(Bairoch等人,2005)。

  • UniProtKB UniPathway(向上)一个用于表示和注释代谢途径的完全手动管理的资源,在UniProtKB中用作路径注释的受控词汇(Morgat等人,2012)。

结合SUPERFAMILY数据库中蛋白质的全基因组域分配(Gough,2006),我们对检测PO本体与结构域的相关性进行了统计推断(de Lima Morais,et al.,2011)。尽管以域为中心的表型注释在描述独立域方面有很大的希望,大多数域本身可能不只是单独工作。在多域蛋白质中,它们可以结合在一起形成不同的域结构。现有结构域的重组被认为是表型多样性的主要驱动力之一。特别地,某些成对域组合(或三元组或更多)可能出现在不同的域体系结构中,因此可以被视为更大的进化单元(称为超域)尽管超结构域显然具有进化重要性,但它们的功能/表型仍未明确。在实践中,通过手动检查其所在的多域蛋白质的功能,它们比单个域要难得多。为了便于理解域组合如何促进功能/表型多样性,在这里,我们扩展了先前框架在捕获适用于超域和单个超家族的PO术语方面的效用(图1-4). 该框架的核心是,如果一个PO术语倾向于注释单个结构域蛋白质(或包含超结构域的蛋白质),那么这个术语也应该给出该单结构域(或超结构域)的功能信号.


构建超域PO注释的管道

跳转到[顶部·SP2PO公司·SPPO公司·数据可用性]

该框架的实现始于高覆盖域结构和最长转录物的蛋白质/基因级PO注释(以确保单基因-蛋白质映射有效,因为这些表型注释是基因导向的,而不是基于蛋白质的),分别可从SUPERFAMILY(de Lima Morais等人,2011)和PO感兴趣的注释中获得(图1). 我们尊重PO的层次结构,通过将单个术语视为节点,将其与父术语的关系(允许多个父项)视为有向边,将其组织为有向无环图(DAG)。因此,超结构域(个体超家族)和PO术语之间的两种推理是根据根和直接亲代PO进行的(图2). 这些双重约束确保只保留最相关的采购订单条款。

图1。一个用于推断进化SCOP域和超域的PO注释的通用框架,使用域体系结构和感兴趣模型生物体中最长转录的PO注释。

图2。根据超几何分布评估推断的统计显著性,生成整体注释的总体过度表示(左面板)和所有直系父母的相对过度表示(中面板)。基于最大P值,SP-PO术语关联的统计显著性可以通过FDR解释多重假设检验的方法进行评估(右面板)。SP表示超结构域和单个超家族。


获得超域哺乳动物表型本体

跳转到[顶部·SP2PO公司·SPPO公司·数据可用性]

基于预测的SP2PO注释,我们还初始化了PO的trimmed-down版本,这是注释supr-domains(包括单个超家族)信息量最大的版本(图3).

图3。基于SP2PO注释配置文件的信息论分析创建超域哺乳动物表型本体(SPPO)的流程图。

    弗斯特,我们应用信息理论定义PO术语的信息内容(IC):负log10-对该术语注释的观察SP频率的转换对于任何SP,注释到该SP的PO术语构成DAG中的SP-PO注释配置文件,包括直接注释以及根据真实路径规则继承的注释。考虑到采购订单条款(或所谓的真实路径规则)之间的依赖性,直接注释到特定采购订单条款的SP(称为直接注释)应可继承地注释到其父条款(作为继承注释的条款)。上面生成的PO注释可视为直接注释。完整的采购订单注释(直接和继承)用于计算所有采购订单条款的IC。值得注意的是,那些具有类似IC的PO术语可以用SP2PO表示DAG的分区。

    第二给定一个预定义的IC(例如1)作为种子及其对应的范围(例如[0.75 1.25]),该算法从最初未标记的所有PO项开始,迭代地识别最接近预定义IC的未标记PO项,直到标记所有PO项(图4). 为了确保DAG中的每个路径只能标识一个PO术语,应满足以下约束条件:如果在同一路径中标识了多个具有相同IC的PO术语,则会过滤掉这些父术语;一旦确定了PO术语,该术语所在路径中的所有术语都将被标记为不受进一步搜索的影响。

    最后,输出为IC在范围内的已识别PO术语。我们使用四个种子IC(即0.5、1、1.5和2)中的每一个来运行算法,以创建SPPO,分别对应于四个级别的PO术语(信息最少,信息量适中,信息丰富的,信息量大). 总之,我们提供了一个元-PO作为注释超域和单个超家族的代理。

图4。演示算法如何迭代创建超域哺乳动物表型本体(SPPO)。一) ●●●●。最初,DAG中的所有PO术语都没有标记(空心圆圈);II) 。识别那些未标记的采购订单条款(以粉红色填写),其中IC最接近预定义IC(例如,1);三) ●●●●。从步骤II中确定的采购订单条款中筛选出这些母公司采购订单条款。四) ●●●●。标记已识别的PO术语及其所有祖先和后代。V-VI)。继续执行步骤II-IV,反复识别未标记的采购订单条款,直到标记所有采购订单条款。七) ●●●●。仅输出IC在范围内(例如[0.75 1.25])的已确定PO条款作为SPPO。


数据可用性

跳转到[顶部·SP2PO公司·SPPO公司·数据可用性]

采购订单层次结构对于浏览,我们还提供了两种可解析格式的SP2PO映射结果(即普通文件和mysql表)。以下缩写的含义在可浏览层次结构中进行了解释.

SP2PO映射普通文件

    SP2DO映射结果
    • 完整的supre-domains(包括单个超家族)DO注释可在SP2DO.txt文件文件。

    • DO术语被视为SPDO(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPDO.txt文件文件。与整个DO层次结构不同,不同粒度的DO术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPDO仅对应SCOP超家族级别。

    • 我们强烈建议用户在SPDO.txt文件以及从中提取的注释性超域SP2DO.txt文件它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2HP映射结果
    • 完整的超级域(包括单个超级系列)HP注释可在SP2HP.txt格式文件。

    • 被视为SPHO的HP术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPHO.txt文件文件。与整个HP层次结构不同,这些不同粒度的HP术语在与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPHO仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPHO.txt文件及其注释性超域,摘自SP2HP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2MP映射结果
    • 完整的超级域(包括单个超家族)MP注释可在SP2MP.txt格式文件。

    • 被视为SPMP的MP术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPMP.txt(SPMP文本)文件。与整个MP层次结构不同,不同粒度的MP术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPMP仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPMP.txt(SPMP文本)以及从中提取的注释性超域SP2MP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2WP映射结果
    • 完整的supre-domains(包括单个超家族)WP注释可在SP2WP.txt格式文件。

    • 被视为SPWP的WP术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPWP.txt格式文件。与整个WP层次结构不同,这些不同粒度的WP术语在与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPWP仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPWP.txt格式以及从中提取的注释性超域SP2WP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2YP映射结果
    • 完整的supre-domains(包括单个超家族)YP注释可在SP2YP.txt格式文件。

    • 被视为SPYP的YP术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPYP.txt格式文件。与整个YP层次结构不同,不同粒度的YP术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPYP仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPYP.txt格式以及从中提取的注释性超域SP2YP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2FP映射结果
    • 完整的超级域(包括单个超家族)FP注释可在SP2FP.txt格式文件。

    • FP术语被视为SPFP(四个级别:信息量最小、信息量适中、信息量大、信息量大)可以在中找到SPFP.txt文件文件。与整个FP层次结构不同,这些不同粒度的FP术语在与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPFP仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPFP.txt文件及其注释性超域,摘自SP2FP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2FA映射结果
    • 完整的supre-domains(包括单个超家族)FA注释可在SP2FA.txt文件文件。

    • 被视为SPFA的FA术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPFA.txt格式文件。与整个FA层次结构不同,不同粒度的FA术语在与超域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPFA仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPFA.txt格式以及从中提取的注释性超域SP2FA.txt文件它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2ZA映射结果
    • 完整的supre-domains(包括单个超家族)ZA注释可在SP2ZA.txt(SP2ZA.文本)文件。

    • ZA术语被视为SPZA(四级:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPZA.txt格式文件。与整个ZA层次结构不同,这些不同粒度的ZA术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPZA仅对应SCOP超家族级别。

    • 我们强烈建议用户在SPZA.txt格式以及从中提取的注释性超域SP2ZA.txt(SP2ZA.文本)它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2XA映射结果
    • 完整的超级域(包括单个超家族)XA注释可在SP2XA.txt格式文件。

    • 被视为SPXA的XA术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPXA.txt格式文件。与整个XA层次结构不同,不同粒度的XA术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPXA仅对应SCOP超家族级别。

    • 我们强烈建议用户在SPXA.txt格式以及从中提取的注释性超域SP2XA.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2AP映射结果
    • 完整的supre-domains(包括单个超家族)AP注释可在SP2AP.txt格式文件。

    • AP术语被视为SPAP(四个级别:信息量最小、信息量适中、信息量大、信息量大)可以在中找到SPAP.txt格式文件。与整个AP层次结构不同,这些不同粒度的AP术语在与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPAP仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPAP.txt格式以及从中提取的注释性超域SP2AP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多结构域蛋白质如何在生命树的功能限制下进化方面。

    SP2EC映射结果
    • 完整的supre-domains(包括单个超家族)EC注释可在SP2EC文本文件。

    • 被视为SPEC的EC术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到规格.txt文件。与整个EC层次结构不同,这些不同粒度的EC术语在与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPEC仅对应SCOP超家族级别。

    • 我们强烈建议用户在规格.txt以及从中提取的注释性超域SP2EC文本它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2DB映射结果
    • 完整的超级域(包括单个超家族)DB注释可在SP2DB.txt文件文件。

    • 被视为SPDB的DB术语(四级:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPDB.txt文件文件。与整个DB层次结构不同,这些不同粒度的DB术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPDB仅对应SCOP超家族级别。

    • 我们强烈建议用户在SPDB.txt文件以及从中提取的注释性超域SP2DB.txt文件它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2KW映射结果
    • 完整的超级域(包括单个超级家族)KW注释可在SP2KW.txt(SP2KW)文件。

    • 被视为SPKW的KW术语(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPKW.txt软件文件。与整个KW层次结构不同,不同粒度的KW术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPKW仅对应SCOP超家族级别。

    • 我们强烈建议用户在SPKW.txt软件以及从中提取的注释性超域SP2KW.txt(SP2KW)它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

    SP2UP映射结果
    • 完整的supre-domains(包括单个超家族)UP注释可在SP2UP.txt格式文件。

    • 被视为SPUP的UP条款(四个级别:信息量最小、信息量适中、信息量大、信息量高)可以在中找到SPUP.txt文件文件。与整个UP层次结构不同,不同粒度的UP术语在其与超级域(包括单个超家族)的相关性方面具有代表性和全面性。请记住,SPUP仅对应于SCOP超家族级别。

    • 我们强烈建议用户在SPUP.txt文件以及从中提取的注释性超域SP2UP.txt格式它们在比较功能基因组学中具有潜在的用途,特别是在理解多域蛋白质如何在生命树的功能限制下进化。

SP2PO MySQL表
      我们用四张桌子(SP2PO.sql.gz公司)存储上述信息(即。,Domain2PO映射结果):

      PO_信息:包含有关采购订单条款的信息。
      >DESC公司采购订单信息;+------------+---------------------+------+-----+---------+-------+|字段|类型|空|键|默认|额外|+------------+---------------------+------+-----+---------+-------+|obo|char(2)|NO|PRI|NULL|||po|varchar(20)|NO|PRI|NULL|||namespace|varchar(50)|NO||NULL|||name | varchar(255)|否| MUL |空|||同义词|text|YES||NULL|||定义|text|YES||NULL|||distance|tinyint(3)unsigned|NO||NULL||+------------+---------------------+------+-----+---------+-------+
      • 这个双簧管列指示采购订单的类型。“DO”代表“疾病本体论”,“HP”代表“人类表型”,“MP”代表“小鼠表型”,”WP“代表“蠕虫表型”,‘YP’代表“酵母表型”,’FP“代表‘蝇表型’,‘FA’代表‘蝇解剖’,‘ZA’代表‘斑马鱼解剖学’,‘AP’代表‘拟南芥植物’。
      • 这个采购订单列是相应的采购订单id。可通过以下方式浏览采购订单层次结构.
      • 这个命名空间列可以是三个GO子本体之一,否则为根。
      • 这个名称列显示采购订单条款的全名。
      • 这个同义词列是PO术语的同义词。
      • 这个定义列是采购订单术语的定义。
      • 这个距离列显示PO术语到相应子本体的距离。

      PO_hie(_H):包含有关采购订单层次结构的信息。
      >DESC公司PO_hie;+----------+---------------------+------+-----+---------+-------+|字段|类型|空|键|默认|额外|+----------+---------------------+------+-----+---------+-------+|obo|char(2)|NO|PRI|NULL|||parent|varchar(20)|NO|PRI|NULL||child|varchar(20)|NO|PRI|NULL||distance|tinyint(3)unsigned|NO|PRI|NULL|+----------+---------------------+------+-----+---------+-------+
      • 这个双簧管列指示采购订单的类型。“DO”代表“疾病本体论”,“HP”代表“人类表型”,“MP”代表“小鼠表型”,”WP“代表“蠕虫表型”,‘YP’代表“酵母表型”,’FP“代表‘蝇表型’,‘FA’代表‘蝇解剖’,‘ZA’代表‘斑马鱼解剖学’,‘AP’代表‘拟南芥植物’。
      • 这个父母列是父订单id。
      • 这个小孩列是子PO id。
      • 这个距离列显示直接父子关系的父PO id到子PO id的距离。其他列指示它们之间存在路径(可到达但间接)。

      PO_映射_超域:包含有关SP2PO批注的信息。
      >DESC公司PO_映射_超域;+----------------+---------------------------+------+-----+---------+-------+|字段|类型|空|键|默认|额外|+----------------+---------------------------+------+-----+---------+-------+|超域|text|NO|MUL|NULL|||level|enum('cl','cf','sf','fa')|NO||NULL|||obo|char(2)|NO|MUL|NULL|||po|varchar(20)|NO||NULL|||all_score|double |否||1|||inherited_from|text|YES||NULL||+----------------+---------------------------+------+-----+---------+-------+
      • 这个超域是SCOP唯一标识符的逗号分隔列表,太阳系的。可通过浏览SCOP层次结构.
      • 这个水平在SCOP层次结构中。可以是class的“cl”,fold的“cf”,superfamily的“sf”,fa的“fa”之一。
      • 这个双簧管列指示采购订单的类型。“DO”代表“疾病本体论”,“HP”代表“人类表型”,“MP”代表“小鼠表型”,”WP“代表“蠕虫表型”,‘YP’代表“酵母表型”,’FP“代表‘蝇表型’,‘FA’代表‘蝇解剖’,‘ZA’代表‘斑马鱼解剖学’,‘AP’代表‘拟南芥植物’。
      • 这个采购订单列是相应的采购订单id。
      • 这个所有核心列是由所有最长转录的蠕虫基因/蛋白质(包括多域蛋白质)支持的FDR。
      • 这个继承自列用于标记SP2PO预测注释的状态。1)如果标记为“directed”(即“all_score”<0.001),则所有最长转录的蠕虫基因/蛋白质(包括多域蛋白质)都显著支持SP2PO。2)如果是以逗号分隔的PO id列表(数字部分;列“all_score”不小于0.001),则在DAG中应用true-path规则时,SP2PO将从任何下行PO术语(显著相关)继承。3)否则清空。因此,通过使用NOT EPOTY选择列“inherited_from”,可以获得仅由所有人支持的SP2PO列表.

      PO_ic_上文:包含SPPO的信息。
      >DESC公司PO_ic_上文;+---------+---------------------------+------+-----+---------+-------+|字段|类型|空|键|默认|额外|+---------+---------------------------+------+-----+---------+-------+|level|enum('cl','cf','sf','fa')|NO|PRI|NULL|||obo|char(2)|NO|PRI|NULL|||po|varchar(20)|NO|PRI|NULL|||ic|double|YES||NULL|||include|tinyint(2)|YES|MUL|NULL||+---------+---------------------------+------+-----+---------+-------+
      • 这个水平在SCOP层次结构中。可以是class的“cl”,fold的“cf”,superfamily的“sf”,fa的“fa”之一。
      • 这个双簧管列表示采购订单的类型。“DO”代表“疾病本体论”,“HP”代表“人类表型”,“MP”代表“小鼠表型”,”WP“代表“蠕虫表型”,‘YP’代表“酵母表型”,’FP“代表‘蝇表型’,‘FA’代表‘蝇解剖’,‘ZA’代表‘斑马鱼解剖学’,‘AP’代表‘拟南芥植物’。
      • 这个采购订单列是相应的PO id。
      • 这个集成电路列显示采购订单条款的信息内容。
      • 这个包括列指示PO术语是否属于SDPO。如果列设置为“0”,则它不是SDPO的成员。否则,“1”表示信息量最小(即最一般),“2”表示信息量适中,“3”表示信息量大,“4”表示信息量大(即最具体)。


    工具书类

    • Andreeva,A.、Howorth,D.、Chandonia,J.M.、Brenner,S.E.、Hubbard,T.J.、Chothia,C.和Murzin,A.G.(2008)《数据增长及其对SCOP数据库的影响:新发展》,核酸研究,36,D419-425。摘要[公共医学]  
    • Bairoch,A.、Apweiler,R.等人(2005)《通用蛋白质资源》(UniProt),核酸研究,33,D154-9。摘要[公共医学]  
    • Benjamini,Y.和Hochberg,Y.(1995)《控制错误发现率——一种实用而有力的多重测试方法》,《皇家统计学会期刊B辑方法学》,57,289-300。摘要[公共医学]  
    • Bowes,J.B.、Snyder,K.A.、Segerdell,E.、Jarabek,C.J.、Azam,K.、Zorn,A.M.和Vize,P.D.(2009)《Xenbase:基因表达和改进整合》,核酸研究,38,D607-12。摘要[公共医学]  
    • Bradford,Y.、Conlin,T.、Dunn,N.等人(2011)《ZFIN:斑马鱼模型生物数据库的增强和更新》,核酸研究,39,D822-9。摘要[公共医学]  
    • Engel,S.R.、Balakrishnan,R.、Binkley,G.等人(2010)《酵母基因组数据库》提供了突变表型数据,核酸研究,38,D433-6。摘要[公共医学]  
    • Fleischmann,A.、Darsow,M.、Degtyarenko,K.、Fleischmann,W.、Boyce,S.、Axelsen,K.B.、Bairoch,A.、Schomburg,D.、Tipton,K.F.和Apweiler,R.(2004)IntEnz,综合关系酶数据库,Nucleic Acids Res,32,D434-7。摘要[公共医学]  
    • Gough,J.(2006)蛋白质结构域的基因组尺度亚家族分配,核酸研究,343625-3633。摘要[公共医学]  
    • Grumbing,G.和Strelets,V.(2006)FlyBase:解剖学数据、图像和查询,《核酸研究》,34,D484-8。摘要[公共医学]  
    • Ilic,K.,Kellogg,E.A.,Jaiswal,P.等人(2006)《植物结构本体论》,开花植物解剖学和形态学的统一词汇,《植物生理学》,143587-99。摘要[公共医学]  
    • Morgat,A.、Coissac,E.等人(2006)《UniPathway:代谢途径探索和注释的资源》,《核酸研究》,40,D761-9。摘要[公共医学]  
    • Osborne,J.D.、Flatow,J.、Holko,M.、Lin,S.M.、Kibbe,W.A.、Zhu,L.J.、Danila,M.I.、Feng,G.和Chisholm,R.L.(2009)《用疾病本体论注释人类基因组》。BMC基因组学,10,S1–S6。摘要[公共医学]  
    • Pujar,A.、Jaiswal,P.、Kellogg,E.A.等人(2006)《被子植物的全植物生长阶段本体及其在植物生物学中的应用》,《植物生理学》,142,414-28。摘要[公共医学]  
    • Robinson,P.N.、Kohler,S.、Bauer,S.,Seelow,D.、Horn,D.和Mundlos,S.(2008)《人类表型本体:注释和分析人类遗传病的工具》。《美国人类遗传学杂志》,83,610-615。摘要[公共医学]  
    • Knox,C.、Law,V.等(2011)DrugBank 3.0:药物“组学”研究的综合资源。《核酸研究》,39,D1035-41。摘要[公共医学]  
    • Schindelman,G.、Fernandes,J.S.、Bastiani,C.A.、Yook,K.和Sternberg,P.W.(2011)《蠕虫表型本体:整合秀丽线虫群落内外的表型数据》,BMC生物信息学,12:32。摘要[公共医学]  
    • Schriml LM、Arze C、Nadendla S等(2012)《疾病本体论:疾病语义整合的支柱》。《核酸研究》,40,D940-D946。摘要[公共医学]  
    • Smith,C.L.和Eppig,J.T.(2009)《哺乳动物表型本体:实现稳健注释和比较分析》,Wiley Interdiscip Rev Syst Biol Med,1390-399。摘要[公共医学]