摘要

UniProt是一个重要的蛋白质序列及其注释集合,在过去一年中,其大小增加了一倍,达到8000万个序列。这种序列的增长促使UniProt登录号空间从6个字符扩展到10个字符。越来越多的新序列与数据库中已经存在的序列相同,其中大多数序列来自基因组测序项目。我们创建了一个新的蛋白质组标识符,用于唯一地识别物种和菌株或亚种的特定集合,以帮助用户跟踪序列的来源。我们展示了一个使用用户体验设计流程设计的新网站。我们为UniProt中的所有条目引入了注释分数,以表示每个蛋白质的相对已知知识量。这些分数将有助于确定哪些蛋白质是最具特征和信息量最大的比较分析蛋白质。所有UniProt数据都是免费提供的,可从以下网站获得:网址:http://www.uniprot.org/.

简介

我们正处于蛋白质序列数据库开发的关键时刻。下一代测序技术的不断进步意味着,对于每一种实验表征的蛋白质,现在有数百种蛋白质将永远无法在实验室进行实验表征。此外,通过开发蛋白质组学和基因组学的高通量技术,引入了新的数据类型。两者的结合为生命科学和生物医学领域提供了新的机遇。因此,至关重要的是确定文献中蛋白质的实验特征,并将此知识捕获并整合到框架中,结合高通量数据和自动注释方法,以充分利用它。UniProt通过组织生物知识,使研究人员能够快速理解复杂的生物学领域,促进科学发现。

简而言之,UniProt由几个重要的组件组成。UniProt中包含手动管理和审查条目的部分称为UniProtKB/Swiss-Prot,目前包含大约50万个序列。这一部分随着新蛋白质的实验表征而增长(1). 所有其他序列都收集在UniProt的未审查部分,称为UniProtKB/TrEMBL。UniProt这一部分目前包含约8000万个序列,并呈指数级增长。虽然UniProtKB/TrEMBL中的条目不是手动管理的,但它们由自动生成的注释补充。UniProt还提供了三组在不同级别的序列标识中非冗余的序列:UniRef100、UniRef90和UniRef50(2). UniParc数据库是一个由所有已知序列组成的综合集合,这些序列通过其唯一的序列校验和进行索引,目前包含7000多万个序列条目(). UniProt数据库具有150多个数据库的交叉引用,并充当组织蛋白质信息的中心枢纽。其登录号是信息学应用中准确和可持续标记蛋白质的主要机制。

在这份手稿中,我们描述了开发UniProt的最新进展。UniProt组织和注释蛋白质序列的目标面临着许多挑战。特别是,微生物菌株序列的巨大增长促使我们创建了一个新的蛋白质组标识符,下面将对此进行更详细的描述。UniProt的一项核心活动是从原始文献中收集有关蛋白质的信息。在这篇论文中,我们着眼于孤酶活性,来研究酶的注释。UniProt数据库每天都被世界各地数千名科学家使用,2013年,其网站已被40多万独立访问者访问。我们在下面描述了基于用户体验设计过程的网站的完整重新开发。

进展和新发展

蛋白质组和其他序列数据的增长

UniProt中的蛋白质序列数量继续加速增长。如图所示1在2013年6月至2014年8月的12次发布中,UniProt中的序列数量从4040万个增加了一倍,达到8070万个,呈指数级增长。UniRef数据库以100%、90%和50%的同一性对序列进行聚类,说明了序列冗余的级别。从2004年到2014年,UniRef100、UniRef90和UniRef50的数据库大小分别从5%/42%/70%减少到54%/73%/88%。序列增长的大部分原因是向核苷酸序列数据库提交完整基因组的数量增加(4). 这些基因组大多数来自全基因组鸟枪式研究,其中细菌基因组占80%的数据。此外,同一生物或密切相关物种的菌株的多个基因组提交量也在增加。虽然这些丰富的蛋白质信息为我们的用户提供了进行蛋白质组分析和解释的新机会,但在捕获、搜索、保存蛋白质组数据并将其提交给科学界方面也带来了挑战。为了给新序列腾出空间,我们将登录号格式从6个字符增加到了10个字符。有关新格式的详细信息,请访问www.uniprot.org/help/accession_numbers网站为了帮助应对这些在追踪和显示蛋白质组方面的挑战,我们重新组织了对蛋白质组的处理和显示,并引入了一种新的蛋白质组标识符,该标识符能够唯一地识别与一个完整测序基因组的单个集合相对应的一组蛋白质。对于喜欢使用特定分类组中单个注释最好的蛋白质组进行分析的用户,UniProt会选择一个蛋白质组。UniProt参考蛋白质组是通过咨询研究社区或通过计算从蛋白质组簇中确定的(5)其中参考蛋白质组是通过考虑最佳整体注释分数的算法从集群中选择的。已选择参考蛋白质组来提供生命树的广泛覆盖,并构成UniProt中发现的分类学多样性的代表性横截面(图2). 目前已筛选出2290个参考蛋白质组。它们是手动和自动注释的重点,旨在为所选物种提供最佳注释蛋白质集。它们包括生物医学和生物技术研究感兴趣的模型生物和其他蛋白质组。这些物种的蛋白质组是与INSDC、Ensembl和RefSeq参考基因组合作生成的。参考蛋白质组的示例可以在新的蛋白质组信息页面和蛋白质组标识符中找到http://www.uniprot.org/proteomes/UP000000803.

图1。

UniProt和UniRef数据库的增长。

图2。

蛋白质组和参考蛋白质组在生命树中的分布。

对于喜欢蛋白质组的所有版本和变体的用户,非参考蛋白质组仍将在UniProt中提供。

手动管理进度

基于文献的专家管理是UniProt的核心活动。它为UniProt的UniProtKB/Swiss-Prot部分中不同蛋白质家族和分类群的实验表征蛋白质提供了高质量的注释。虽然劳动密集型,但创建这样一个丰富的注释数据集的好处是多方面的,无论是对湿斑研究人员来说,都是通过提供包含实验信息的最新知识库,还是对计算机科学家来说,都可以通过提供高质量的训练集来开发和增强生物信息学算法。最后但并非最不重要的一点是,它也是生成无特征蛋白质自动注释的基本来源,这是下一代测序时代的关键挑战。多年来,联合体积累了丰富的策展经验,在该领域建立了一支专家团队。2013年,我们策划了8400多篇论文,创建了3300多个新的UniProtKB/Swiss-Prot条目。

为了向用户提供最大数量的高质量信息,选择要策划的出版物至关重要。我们的目标不是策划所有已发表的论文,而是选择一个具有代表性的子集,根据既定的标准,使用文献监督和自动系统(参见(1)以获取更详细的描述)。一个重要的关注领域是酶反应的专家管理。鉴于大量可用序列数据为新酶的发现提供了独特的机会,因此有必要提供注释完善的特征酶语料库,以便于识别新酶的活性。以酶的专家管理为例,我们将详细说明我们如何优先选择蛋白质进行管理,突出注释内容,并简要描述一些正在进行的和未来的管理发展。

近年来,人们特别重视孤儿酶的注释,孤儿酶是一组经过实验表征但缺乏相关氨基酸序列的酶(6,7). 这种酶的鉴定可能很困难,我们得到了最近一份出版物的帮助,该出版物根据文献综述和数据库搜索报告了许多孤儿酶的鉴定(6). 本出版物中描述的相关酶已被优先考虑用于管理,这项工作正在进行中。

参考蛋白质组中先前未经特征化的酶也受到高度重视。人线粒体烯醇化酶超家族成员1蛋白(UniProt Q7L5Y1)提供了一个很好的例子。编码该蛋白的ENOSF1基因最初被认为编码胸苷酸合成酶的反义RNA,能够下调TYMS活性(8,9). 直到最近,其功能多年来基本上仍不为人所知,其被鉴定为L-岩藻酸脱水酶(10). L-岩藻酸脱水酶参与L-岩藻糖的分解代谢,这是一种糖,是与细胞糖蛋白相连的碳水化合物的一部分,并催化L-岩藻酸酯脱水为2-酮-3-脱氧-L-岩藻酸。有趣的是,这种酶以前在真核生物中还没有被鉴定出来,以前在野油菜黄单胞菌仅限(UniProt Q8P3K2)(11). 相关出版物已经过详细阅读和全面管理,各种论文中的所有信息都已汇编成一份简明而全面的报告,该报告提供了有关该蛋白质的可用信息的完整概述,包括与功能、催化活性、辅因子、,亚细胞定位和生物物理化学特性。我们还添加了一条警告注释,警告用户最初提出的反义RNA对胸苷酸合成酶的功能尚不清楚。序列注释对酶特别重要,对催化或底物结合重要的位点的保存(或非保存)对于预测未标记酶的功能或预测同源酶的底物特异性至关重要。许多序列注释信息来自3D结构,利用蛋白质数据库(PDB)中的信息与论文中提取的信息相结合。在ENOSF1(UniProt Q7L5Y1)的情况下,可以使用镁辅因子复合物中的高分辨率晶体结构,从而可以注释序列上的辅因子结合位点(10). 镁与基体复合的晶体结构可用于X.野油菜岩藻酸脱水酶(UniProt Q8P3K2),由于两种酶之间约50%的高序列保守性,允许底物结合位点可靠地传播到人类入口(图).

图3。

(A) 人类ENOSF1条目(UniProt Q7L5Y1,http://www.uniprot.org/uniprot/Q7L5Y1). (B) 使用PyMol(PDB加入4A35)拍摄人类ENOSF1 X射线结构与镁(蓝色)络合物中镁结合位点的图像。(C) 的活动站点图像X.野油菜使用PyMol(PDB加入2HXT)与镁(蓝色)和底物(绿色)的络合物中的岩藻酸脱水酶X射线结构。

收集的知识用标准化词汇表表示,以便于后续检索。许多与酶相关的注释字段都是这样构造的。催化活性注释字段遵循国际生物化学和分子生物学联合会命名委员会(IUBMB)的建议,我们积极参与创建新的酶委员会(EC)编号,在需要时向IUBMB提交新的反应。此外,UniProt是基因本体(GO)的主要贡献者(12)根据文献中的实验数据手动管理GO术语是UniProt管理过程的一部分。我们正在许多注释字段中扩展受控词汇表的使用。例如,我们最近将辅助因子注释从自由文本改为结构化注释,并引入了生物兴趣化学实体(ChEBI)本体的受控词汇(13),改进化学标识符的表示,并使用户更容易访问此信息。

未来,我们还计划加强催化活性场的表示,以构建代谢模型,因为目前的催化反应表示在全面准确地描述所有生物体中所有可能的化学反应变体方面存在局限性。我们计划通过利用资源来解决这一问题,例如人工策划的Rhea化学反应数据库(14)其中包括酶催化反应、转运反应和自发发生的反应,并使用ChEBI本体来描述这些反应。

自动批注进度

UniProt开发了两个互补的基于规则的系统,用于自动注释UniProtKB/TrEMBL的未特征化蛋白质序列。这些是UniRule,其中的规则是作为UniProtKB/Swiss-Prot和SAAS的专家管理过程的一部分创建的,其中规则是从共享共同注释和特征的UniProtKB/Swish Prot条目中自动导出的。UniRules和SAAS都使用蛋白质家族和结构域特征的层次化InterPro分类(15)作为蛋白质分类和功能注释的基础。这些规则有一个共同的语法,规定了注释,包括蛋白质命名、功能和重要残基以及必要条件,例如对保守功能残基和基序的要求。InterPro集成来自HAMAP的签名(16)和PIRSF(17)UniProt财团内的项目。HAMAP和PIRSF中家族签名的创建与UniProtKB/Swiss-Prot中以文献为特征的模板条目的专家管理紧密相关,这使得即使在功能多样的大型超家族中也可以进行高度特定的功能注释。例如,HAMAP签名MF_01864见图4,其中仅封装了七份同行评审出版物中的信息,涵盖四种实验表征的蛋白质,作为模板,注释细菌tRNA-2-methylthio-N(6)-二甲基烯丙基腺苷合酶家族的功能,记录超过11000条UniProtKB/TrEMBL记录。UniRule管道还利用UniProtKB/Swiss-Prot的手动管理来持续验证规则:在UniProtKB/TrEMBL的每个版本中都会刷新注释,并且通过将预测的注释与当前UniProtKB/Swiss-Pro版本的注释进行比较来评估每个规则的一致性。只有那些预测与UniProtKB/Swiss-Prot完全匹配的规则才会在当前生产周期中保留。

图4。

基于HAMAP条目MF_ 01864的规则表示。

尽管数据库规模呈指数级增长,但UniProtKB/TrEMBL的覆盖率在过去4年中从28%增长到35%,见图5这在一定程度上是由于冗余完整细菌蛋白质组的整合导致了大量增加,我们现有的UniRules对细菌蛋白质组进行了注释。我们解决这种冗余的策略将在本文的蛋白质组部分进行讨论。我们在UniRule生成中的自动注释优先级是(i)专注于使用和注释蛋白质组感兴趣的新功能数据,如酶和通路,(ii)将我们的覆盖范围扩展到新的分类和蛋白质家族,以及(iii)通过与外部团体合作利用策划数据来扩展注释范围,RESID数据库中的翻译后修改(PTM)数据就是这样(例如,请参阅PTM/Processing部分中的UniRule注释(UniProt F2I0T3),以及基于RESID:AA0120的规则信息)。

图5。

通过手动管理UniRules增加UniProtKB/TrEMBL的覆盖范围。这个Y(Y)-axis显示UniRule整体以及各个源的UniProtKB/TrEMBL覆盖率百分比。PIR表示PIR站点规则(PIRSR)和PIR名称规则(PIRNR)的组合。

新建网站

我们按照以用户为中心的设计流程重新设计了UniProt网站,涉及全球250多名具有不同研究背景和使用案例的用户。以用户为中心的设计是一种基于用户需求和期望的设计方法。从收集需求到测试最终产品,它们都包含在流程的每个阶段。重新设计分为四个主要阶段。首先,我们通过可用性测试与用户一起分析当前站点,并通过用户研讨会收集需求。这确定了重新设计的目标。然后,我们致力于信息架构和设计,为需求找到可能的解决方案,并解决我们发现的可用性问题。我们从很早的阶段就使用纸质原型和草图对用户进行了测试。这使我们能够在重新设计的第三阶段根据用户反馈快速迭代设计,并将设计开发为高规格原型。在最后阶段,我们实现了这些设计,依靠用户反馈来验证设计决策。新的UniProt网站现已上线。

我们主要关注创建更容易的导航,改进现有功能的可见性和可用性,以及更好地构建注释数据以改进可查找性。UniProt主页为每个数据集提供了磁贴,以允许用户快速访问、工具链接和帮助。所有搜索结果页面现在都包含了帮助用户缩小搜索结果范围的过滤器、保存数据以供以后分析的篮子以及自定义结果表中列的选项,请参见图6.

图6。

可定制的UniProt“insulin”搜索结果,带有搜索词过滤器和按流行有机体细分的搜索结果,以及显示每个条目注释分数的附加列。

UniProt蛋白质条目已经过重组,以更好地将相关注释和数据联系在一起。引入了新的直观标题,如功能、亚细胞定位、病理学和生物技术、相互作用等(见图7).

图7。

人类线圈和C2域蛋白2A(UniProt Q9P2K1)的UniProt入口视图。

我们还为蛋白质组数据集下的完全测序生物体的蛋白质组添加了新页面,见图8这允许用户找到感兴趣物种的蛋白质组和参考蛋白质组,并完全下载数据或根据染色体/质粒进行选择。

图8。

参考蛋白质组页枯草芽孢杆菌(应变168)。

工具的结果页面还提供了增强的功能,包括用于多重对齐的Align、用于序列相似性搜索的Blast和用于检索批次或从UniProt映射标识符的Upload列表。UniProt YouTube频道的UniProt帮助视频的所有页面和链接都提供了上下文帮助https://www.youtube.com/user/uniprotvideos网站.

通过帮助台和用户直接测试从测试版网站获得的反馈表明,用户体验得到了很大改善。我们继续遵循以用户为中心的方法,以确保用户能够充分利用我们未来的所有开发。用户社区可以通过网站上的contact链接联系UniProt,提供反馈和查询,还可以订阅我们的推特订阅源@UniProt、关注我们的Facebook页面或关注我们的博客Inside UniProt以获取最新更新。

注释分数

我们对UniProt条目的注释内容建立了一种启发式测量方法,称为注释分数,以便于识别特征良好的蛋白质,这些蛋白质对于比较分析来说信息最丰富。注释分数按以下方式计算(请参见http://www.uniprot.org/help/annotation_score详细信息):不同的注释类型(例如,蛋白质名称、基因名称、功能和序列注释、GO注释、交叉引用)通过存在或出现次数进行评分。具有实验证据的注释得分高于等效的推断或预测注释,因此相对于自动注释,更倾向于基于专家文献的管理。单个条目的得分是其注释得分的总和。蛋白质组的得分是组成蛋白质组的条目得分的总和。通过将这些绝对数得到的开放区间分解为5个子区间,将其转换为5点系统。第一个区间的分数用“5分之一”表示,第二个区间的得分用“5中2分”表示,等等。因此,5分的注释分数与注释最好的条目相关联,1分表示注释相当基本的条目。

我们使用注释分数来确定UniRef簇的代表成员,也用于从高度相似的蛋白质组簇中自动选择参考蛋白质组。网站上还提供了分数,使用户可以快速了解搜索结果中UniProt条目注释的相对级别。

UniProt在文献中的使用

为了衡量UniProt对研究界的影响,我们利用汤普森路透社科学网工具分析了2002年至2014年间UniProt联盟出版物(一组38种出版物)中引用的科学文献。UniProt的全部出版物在898种独特的期刊标题中被引用了3576次。每年的引文分布如图所示9根据科学网提供的索引类别,这些出版物涵盖的主要研究领域包括生物化学和分子生物学(超过50%)、生物技术、计算生物学、计算机科学和遗传学等(见图10). 我们还研究了这组引用UniProt的文章的ISI 5年期刊影响因素。引用UniProt的10种或10种以上出版物的期刊的中位数得分为4.3。请注意,有48份出版物的影响因子超过20。这些结果表明,UniProt广泛应用于生物医学研究的广泛领域,从算法开发(使用UniProt注释作为数据集或序列)到资源构建(集成UniProt的数据或提供UniProt数据的链接),再到蛋白质鉴定、功能注释和比较研究。引文数量偏低,因为我们已经注意到许多例子,其中UniProt或其他广为人知的资源要么没有被引用,要么以引用数据库中没有记录的方式被引用。例如,《细胞》杂志最近的一篇文章广泛使用UniProt注释来定义含锚蛋白重复序列的蛋白质的核导入途径(18). 尽管UniProt在文章正文中通篇都有明确提及,但它只在补充材料中引用,而许多引用跟踪服务中都没有引用。

图9。

每年向UniProt出版物分发引文。

图10。

根据研究类别,引用UniProt的出版物数量分布。注意,出版物可以分为多个类别。

结论

过去一年,UniProt发生了许多重要变化。特别是,为了应对序列的增加,有必要进行许多更改,例如增加加入数量。然而,我们有几种策略来帮助用户处理大量蛋白质数据,例如包括蛋白质组标识符和添加更多参考蛋白质组,以更好地导航大量新的测序数据。注释分数的提供将帮助用户识别具有最高水平功能特征的蛋白质,这将大大有助于比较蛋白质序列分析。我们特别高兴地发布了一个完全重新开发的网站,其设计的主要目标是增强用户在浏览我们的数据时的体验。除了这些新的发展,我们继续专注于我们的核心任务,从文献中提取和组织关于蛋白质的实验信息,从而帮助世界各地的科学家做出进一步的重要发现。我们鼓励所有用户就我们的数据和网站向我们提供反馈,并通过电子邮件与我们联系help@uniprot.org,通过web访问http://www.uniprot.org/联系人或者通过我们的社交媒体渠道。

UniProt由Alex Bateman、Maria Jesus Martin、Claire O'Donovan、Michele Magrane、Rolf Apweiler、Emanuele Alpi、Ricardo Antunes、Joanna Arganiska、Benoit Bely、Mark Bingley、Carlos Bonilla、Ramona Britto、Borisas Bursteinas、Gayatri Chavali、Elena Cibrian-Uhalt、Alan Da Silva、Maurizio De Giorgi、Tunca Dogan、Francesco Fazzini、,保罗·甘恩(Paul Gane)、莱拉·加西亚·卡斯特罗(Leyla Garcia Castro)、佩内洛普·加米里(Penelope Garmiri)、艾玛·哈特顿·埃利斯(Emma Hatton-Ellis)、雷娅·希塔(Reija Hieta)、雷切尔·亨特利(Rachael Huntley)、邓肯·里格(Duncan Legge)、刘无东(Wudong Liu)、杰罗(Jie Luo)、阿里斯泰尔·麦克道格尔(Alistair MacDougall)、普鲁登斯·穆托沃(Prudence Mutowo)、安德鲁·南丁格尔(,欧洲生物信息研究所的Edward Turner、Vladimir Volynkin、Tony Wardell、Xavier Watkins、Hermann Zellner、Andrew Cowley、Luis Figueira、Weizhong Li、Hamish McWilliam和Rodrigo Lopez;Ioannis Xenarios、Lydie Bouguellet、Alan Bridge、Sylvain Poux、Nicole Redaschi、Lucila Aimo、Ghislaine Argoud-Puy、Andrea Auchincloss、Kristian Axelsen、Parit Bansal、Delphine Baratin、Marie-Claude Blatter、Brigitte Boeckmann、Jerven Bolleman、Emmanuel Boutet、Lionel Breuza、Cristina Casal-Casas、Edouard de Castro、Elisabeth Coudert、,Beatrice Cuche、Mikael Doche、Dolnide Dornevil、Severine Duvaud、Anne Estreicher、Livia Famiglietti、Marc Feuermann、Elisabeth Gasteiger、Sebastien Gehant、Vivienne Gerritsen、Arnaud Gos、Nadine Gruaz-Gumowski、Ursula Hinz、Chantal Hulo、Florence Jungo、Guillaume Keller、Vicente Lara、Philippe Lemercier、Damien Lieberherr、Thierry Lombardot、,泽维尔·马丁(Xavier Martin)、帕特里克·马森(Patrick Masson)、安妮·莫尔加特(Anne Morgat)、特蕾莎·内托(Teresa Neto)、内维拉·努斯皮格尔(Nevila Nouspiel)、萨尔沃·佩萨诺(Salvo Paesano)、伊沃·佩德鲁齐(Ivo Pedruzzi)、桑德里娜·皮尔布特(Sandrine Pilbout)、莫妮卡·波扎托(Monica Pozzato)、曼努埃拉·普鲁斯(Manuela Pruess)、,SIB瑞士生物信息研究所的Laure Verbregue和Anne-Lise Veuthey;蛋白质信息资源的Cathy H.Wu、Cecilia N.Arighi、Leslie Arminski、Chuming Chen、Yongxing Chen、John S.Garavelli、Hongzhan Huang、Kati Laiho、Peter McGarvey、Darren A.Natale、Baris E.Suzek、C.R.Vinayaka、Qinghua Wang、Yuqi Wang、Lai-Su Yeh、Meher Shruti Yerramalla和Jian Zhang。

资金

美国国立卫生研究院(NIH)[U41HG006104,U41HG1007822,U41HG002273,R01GM080646,G08LM010720,P20GM103446];英国心脏基金会[RG/13/5/30112];英国帕金森氏病[G-1307];瑞士联邦政府通过国家教育、研究和创新秘书处;国家科学基金项目[DBI-1062520];欧洲分子生物学实验室核心基金。开放获取费用资助:美国国立卫生研究院【U41HG007822】。

利益冲突声明。未声明。

现住址:Alex Bateman,欧洲生物信息学研究所(EMBL-EBI)欧洲分子生物学实验室,Wellcome Trust Genome Campus,Hinxton,Cambridge,CB10 1SD,UK。

参考文献

1
美国。
马格兰
M。
阿里吉语
C.N.公司。
答:。
奥多诺万
C、。
莱荷
英国。
UniProt公司
C、。
UniProtKB中的专家管理:处理冲突和错误数据的案例研究
数据库
2014
,卷。 
2014
  
doi:10.1093/数据库/bau016
2
苏泽克
英国工程师协会。
H。
麦加维
第页。
Mazumder公司
R。
C.H.公司。
UniRef:全面的非冗余UniProt参考集群
生物信息学
2007
,卷。 
23
(第
1282
-
1288
)
三。
莱诺宁
R。
迪兹
F.G.公司。
宾斯(Binns)
D。
弗莱什曼
西。
洛佩兹
R。
阿普维勒
R。
UniProt存档
生物信息学
2004
,卷。 
20
(第
3236
-
3237
)
4
中村
年。
科克伦
G.公司。
Karsch-Mizrachi公司
一、。
国际核苷酸序列数据库,C。
国际核苷酸序列数据库合作
核酸研究。
2013
,卷。 
41
(第
D21号机组
-
第24页
)
5
C、。
纳塔莱
D.A.公司。
芬兰
钢筋混凝土。
H。
J。
C.H.公司。
Mazumder公司
R。
代表性蛋白质组:用于序列分析和功能注释的稳定、可扩展和无偏见的蛋白质组集
公共科学图书馆
2011
,卷。 
6
第页。 
18910元
 
6
希勒
美国政府。
奥尔特曼
吨。
李(Rhee)
中央处理器。
寻找270多种孤儿酶的序列
公共服务一号
2014
,卷。 
9
第页。 
电子97250
 
7
索罗金娜
M。
斯塔姆
M。
地中海
C、。
莱斯皮内
O。
瓦伦内
D。
分析孤酶
生物直接法
2014
,卷。 
9
第页。 
10
 
8
多尼克
B.J.公司。
人胸苷酸合成酶天然反义RNA的克隆与鉴定
核酸研究。
1993
,卷。 
21
(第
1747
-
1752
)
9
多尼克
B.J.公司。
黑色
阿拉伯联合酋长国。
温克勒
下午
辛德勒
英国。
C.T.公司。
rTS基因表达与细胞对胸苷酸合成酶抑制剂敏感性的改变有关
高级酶调节。
1996
,卷。 
36
(第
165
-
180
)
10
威切列基
D.J.公司。
弗罗泽
D.S.公司。
科佩克
J。
穆尼兹
J.R.公司。
西部。
Gerlt公司
J.A.公司。
rTSgamma的酶学和结构特征提供了对rTSbeta功能的见解
生物化学
2014
,卷。 
53
(第
2732
-
2738
)
11
紫杉
美国西部。
费多罗夫
答:。
费多罗夫
电动汽车。
拉库斯
J.F.公司。
皮尔斯
相对湿度。
阿尔莫
S.C.公司。
Gerlt公司
J.A.公司。
油菜黄单胞菌烯醇化酶超家族中酶活性的进化:L-岩藻酸脱水酶
生物化学
2006
,卷。 
45
(第
14582
-
14597
)
12
调光器
E.C.公司。
亨特利
相对湿度。
阿拉姆·法鲁克
年。
索福德
吨。
奥多诺万
C、。
马丁
医学博士。
别雷
B。
布朗
第页。
Mun Chan先生
西。
埃伯哈特
R。
2011年的UniProt-GO Annotation数据库
核酸研究。
2012
,卷。 
40
(第
D565型
-
D570型
)
13
黑斯廷斯
J。
德马托斯
第页。
德克尔
答:。
埃尼斯
M。
哈沙
B。
卡莱
N。
穆图克里希南
五、。
欧文
G.公司。
特纳
美国。
威廉姆斯
M。
ChEBI生物相关化学参考数据库和本体:2013年改进
核酸研究。
2013
,卷。 
41
(第
D456号
-
D463号
)
14
阿尔坎塔拉
R。
阿克塞尔森
K.B.公司。
摩加特
答:。
贝尔达
E。
考德特
E。
答:。
H。
德马托斯
第页。
埃尼斯
M。
特纳
美国。
Rhea–一种人工管理的生化反应资源
核酸研究。
2012
,卷。 
40
(第
D754号
-
D760型
)
15
亨特
美国。
琼斯
第页。
米切尔
答:。
阿普维勒
R。
阿特伍德
T.K.公司。
贝特曼
答:。
伯纳德
吨。
宾斯(Binns)
D。
博克
第页。
伯格
美国。
2011年InterPro:家族和领域预测数据库的新发展
核酸研究。
2012
,卷。 
40
(第
D306号
-
第312天
)
16
佩德鲁齐
一、。
Rivoire公司
C、。
奥金克洛斯
A.H.公司。
考德特
E。
凯勒
G.公司。
德卡斯特罗
E。
巴拉廷
D。
屈什
文学学士。
布盖勒特
L。
美国。
2015年HAMAP:蛋白质家族分类和注释系统更新
核酸研究。
2014
 
doi:10.1093/nar/gku1002
17
瓦苏德万
美国。
象头神
首席风险官。
纳塔莱
D.A.公司。
H。
卡西
R.Y.公司。
C.H.公司。
UniProt知识库中基于结构引导规则的蛋白质功能位点注释
方法分子生物学。
2011
,卷。 
694
(第
91
-
105
)
18
M。
扎克
J。
美国。
桑切斯·普利多
L。
塞弗森
D.T.公司。
恩迪科特
J。
庞廷
C.P.公司。
斯科菲尔德
C.J.公司。
十、。
锚定重复序列中RanGDP结合的代码定义了核导入途径
单元格
2014
,卷。 
157
(第
1130
-
1145
)
这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/4.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。

补充数据

评论

0条评论
提交评论
您输入了无效代码
感谢您对本文发表评论。您的评论将由杂志自行审查并发表。请通过电子邮件查看更多通知。