跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2018年1月4日;46(D1):D851-D860。
doi:10.1093/nar/gkx1068。

RefSeq:原核基因组注释和管理的最新进展

附属公司

RefSeq:原核基因组注释和管理的最新进展

丹尼尔·哈夫特等。 核酸研究. .

摘要

国家生物技术信息中心(NCBI)的参考序列(RefSeq)项目为超过95000个符合序列质量、完整性和无污染标准的原核基因组提供了注释。基因组由单个原核基因组注释管道(PGAP)进行注释,以便为用户提供尽可能一致和准确的资源。最近的显著变化包括发展了一种分层证据方案,新的重点放在管理注释证据源上,增加和管理了蛋白质剖面隐马尔可夫模型(HMM),发布了更新的管道(PGAP-4),以及全面重新解释RefSeq原核基因组。抗菌耐药蛋白得到了全面的重新标记,插入序列转座酶和硒蛋白的结构注释得到了改进,精心策划的复杂结构域为数百万个多域蛋白提供了升级的名称,我们引入了一种新的注释规则-BlastRules。不断管理支持性证据,并将改进的名称传播到RefSeq蛋白上,确保基因组的功能注释保持最新。我们的注释现在越来越多地来自HMM和其他注释规则集,这些注释规则本质上是可移植的,可供其他研究人员下载和重用。RefSeq位于https://www.ncbi.nlm.nih.gov/refseq/。

PubMed免责声明

数字

图1。
图1。
PGAP 4.x系列管道用于结构注释的新工作流。计算过程以蓝色显示,数据以白色或灰色显示。GeneMarkS+提供从头算预测蛋白质编码基因,但基于同源性证据的提示,包括首次HMM证据。PGAP-4.1版本中首次引入了使用ORFfinder生成每一个停止到停止的翻译,以及使用HMM搜索查找每一个HMM点击的翻译。该管道检测到被破坏的基因(如假基因)和异常的阅读框(如硒蛋白)。
图2。
图2。
RefSeq和PGAP注释中使用的同源性证据和蛋白质命名层次的部分扩展视图。显示了四个β-内酰胺酶家族(A、金属、C和D),每个家族与其他底物(如RNA)的各种水解酶相比,更类似于其他β-内内酰胺酶类别的任何成员。对于每个类别,蛋白质剖面HMM识别成员并建议蛋白质产品名称,但进一步扩展层次结构可以揭示多个子家族,每个子家族由更具体的HMM标识,在注释期间具有更高的优先级。证据的层次结构很大程度上遵循蛋白质名称的隐含层次结构,偶尔也有必要例外,例如当不相关的蛋白质执行密切相关的功能时。

类似文章

  • 参考序列:通过蛋白质家族模型管理扩大原核基因组注释管道范围。
    Li W、O'Neill KR、Haft DH、DiCuccio M、Chetvernin V、Badretdin A、Coulouris G、Chitsaz F、Derbyshire MK、Durkin AS、Gonzales NR、Gwadz M、Lanczycki CJ、Song JS、Thanki N、Wang J、Yamashita RA、Yang M、Zheng C、Marchler-Bauer A、Thibaud-Nissen F。 李伟等。 核酸研究,2021年1月8日;49(D1):D1020-D1028。doi:10.1093/nar/gkaa1105。 核酸研究2021。 PMID:33270901 免费PMC文章。
  • RefSeq和宏基因组时代的原核基因组注释管道。
    Haft DH、Badretdin A、Coulouris G、DiCuccio M、Durkin AS、Jovenitti E、Li W、Mersha M、O'Neill KR、Virothaisakun J、Thibaud-Nissen F。 Haft DH等人。 《核酸研究》2024年1月5日;52(D1):D762-D769。doi:10.1093/nar/gkad988。 核酸研究2024。 PMID:37962425 免费PMC文章。
  • NCBI的参考序列(RefSeq)数据库:当前状态、分类扩展和功能注释。
    O'Leary NA、Wright MW、Brister JR、Ciufo S、Haddad D、McVeigh R、Rajput B、Robbertse B、Smith-White B、Ako-Adjei D、Astashyn A、Badretdin A、Bao Y、Blinkova O、Brover V、Chetvernin V、Choi J、Cox E、Ermolaeva O、Farrell CM、Goldfarb T、Gupta T、Haft D、Hatcher E、Hlavina W、Joardar VS、Kodali VK、Li W、Maglott D、Masterson P、McGarvey KM、,Murphy MR、O'Neill K、Pujar S、Rangwala SH、Rausch D、Riddick LD、Schoch C、Shkeda A、Storz SS、Sun H、Thibaud-Nissen F、Tolstoy I、Tully RE、Vatsan AR、Wallin C、Webb D、Wu W、Landrum MJ、Kimchi A、Tatusova T、DiCuccio M、Kits P、Murphy-TD、Pruitt KD。 O'Leary NA等人。 核酸研究2016年1月4日;44(D1):D733-45。doi:10.1093/nar/gkv1189。Epub 2015年11月8日。 2016年核酸研究。 PMID:26553804 免费PMC文章。
  • NCBI分类学:关于策展、资源和工具的全面更新。
    Schoch CL、Ciufo S、Domrachev M、Hotton CL、Kannan S、Khovanskaya R、Leipe D、Mcveigh R、O’Neill K、Robbertse B、Sharma S、Soussov V、Sullivan JP、Sun L、Turner S、Karsch-Mizrachi I。 Schoch CL等人。 数据库(牛津)。2020年1月1日;2020年:baaa062。doi:10.1093/database/baa062。 数据库(牛津)。2020. PMID:32761142 免费PMC文章。 审查。
  • 致病微生物的基因组注释。
    董毅,李C,金K,崔L,刘X。 Dong Y等人。 简要生物信息。2021年3月22日;22(2):845-854. doi:10.1093/bib/bbab004。 简要生物信息。2021 PMID:33537706 免费PMC文章。 审查。

引用人

工具书类

    1. Cochrane G.,Karsch-Mizrachi I.,Takagi T.国际核苷酸序列数据库,C。国际核苷酸序列数据库合作。2016年《核酸研究》;44:D48–D50。-项目管理咨询公司-公共医学
    1. Maglott D.R.、Katz K.S.、Sicotte H.、Pruitt K.D.NCBI的LocusLink和RefSeq。核酸研究2000;28:126–128.-项目管理咨询公司-公共医学
    1. Tatusova T.、DiCuccio M.、Badretdin A.、Chetvernin V.、Nawrocki E.P.、Zaslavsky L.、Lomsadze A.、Pruitt K.D.、Borodovsky M.、Ostell J.NCBI原核基因组注释管道。2016年《核酸研究》;44:6614–6624.-项目管理咨询公司-公共医学
    1. Tatusova T.、Ciufo S.、Fedorov B.、O'Neill K.、Tolstoy I.RefSeq微生物基因组数据库:新的表示和注释策略。核酸研究2014;42:D553–D559。-项目管理咨询公司-公共医学
    1. Cole S.T.、Brosch R.、Parkhill J.、Garnier T.、Churger C.、Harris D.、Gordon S.V.、Eiglmeier K.、Gas S.、Barry C.E.3rd等人。从完整的基因组序列中解读结核分枝杆菌的生物学。自然。1998; 393:537–544.-公共医学

出版物类型