标签:RefSeq功能元素

加入ASHG 2023 NCBI

加入ASHG 2023 NCBI

11月1日至5日,华盛顿特区。 

我们期待着在美国人类遗传学学会年会(ASHG 2023)2023年11月1日至5日,华盛顿特区。我们将参加各种活动和活动,包括举办展台您可以在这里与NCBI专家会面、提问、提供反馈或聊天!我们特别高兴地分享我们在临床和人类遗传资源方面的最新成果,并提供NIH比较基因组资源(CGR)的最新信息。 

查看NCBI的活动和事件时间表: 

继续阅读“加入ASHG 2023 NCBI”

RefSeq中的新注释!

RefSeq!中的新注释!

四月、五月和六月NCBI真核基因组注释管道释放82条新注释英寸参考序列!

集锦:

  • 智人(人类)T2T-CHM13v2.0版本现在包括了更多的可选剪接变体
  • 智人(人类)GRCh38.p14型包括来自鬃毛v1.2,包括78000多个新RefSeq功能元素自2022年上次注释以来添加的(RefSeqFE)功能
  • 小家鼠GRCm39型自2020年9月以来,整合了3000多个基因和14000个转录本的管理
  • 褐家鼠(挪威鼠)额定BN7.2,包括自2021年我们最后一次注释以来对5000多个基因的管理

新批注:继续阅读“RefSeq中的新注释!”

超越基因的冒险:新RefSeq功能元件出版物!

如果你对基因以外的基因组注释感兴趣,那么请继续阅读!我们以前写过博客关于我们的RefSeq功能元素该资源提供了经实验验证的人类和小鼠非基因功能元素的注释。现在,为了开启2022年,我们很高兴地在一月份的基因组研究:

Farrell CM、Goldfarb T、Rangwala SH、Astashyn A、Ermolaeva OD、Hem V、Katz KS、Kodali VK、Ludwig F、Wallin CL、Pruitt KD、Murphy TDRefSeq Functional Elements作为非基因参考标准和人类和小鼠的功能相互作用的实验测定。 基因组研究.2022年1月;32(1):175-188. 数字对象标识:10.1101/克275819.121Epub 2021年12月7日。PMID:34876495.

图1。RefSeq Functional Elements数据集生成的工作流。全圆柱表示数据库,半圆柱表示指示的数据源,矩形表示操作。有关更多详细信息,请参阅出版物。

继续阅读“超越基因的冒险:新RefSeq功能元件出版!”

NCBI RefSeq和gene中最新的与新冠肺炎相关的人类基因注释

对新冠肺炎生物学中涉及的人类基因感兴趣吗?NCBI的参考序列该小组一直在努力编写一组与冠状病毒感染和疾病有关的人类基因。现在,您可以在NCBI Gene和RefSeq中查看和搜索这些基因及其调控元件。

图1.人体的顶部ACE2公司记录在基因数据库中。COVID-19信息可在摘要和注释信息部分中找到。

继续阅读“NCBI RefSeq和gene中最新的与新冠肺炎相关的人类基因注释”

RefSeq Release 202已公开

RefSeq 202版可用联机,通过文件传输协议以及通过NCBI的Entrez编程实用程序、电子实用程序。

此完整版本包含截至2020年9月8日可用的基因组、转录和蛋白质数据,包含255571455条记录,包括186755483个蛋白质、33077068个RNA和104969个生物体的序列。该版本作为完整的数据集在多个目录中提供,也按逻辑分组进行划分。

更新的人类基因组注释版本109.20200815
更新的注释版本109.2020815是NCBI智人注释版本109的更新。注释报告可用在这里.

注释产品可在序列数据库和文件传输协议现场。

该更新包括约15000个更新的RefSeq转录本,修订后使用CAGE和polyA数据定义5′端和3′端,并与参考GRCh38序列相匹配。

冠状病毒宿主基因调控元件现在由RefSeq功能元件注释
NCBI的RefSeq功能元件项目将与SARS-CoV-2进入细胞相关的人类宿主基因的经实验验证的调节元件的管理作为优先事项。注释包括几个增强子、启动子、顺调控元件和蛋白质结合位点等特征类型。我们注释了27个不同生物区域的236个调控特征,包括ABO、ACE2、ANPEP、CD209、CLEC4G、CLEC4M、CTSL、DPP4和TMPRSS2基因的调控元件。可以找到更多信息在这里.

新的真核生物基因组注释
此次发布包括由NCBI的真核生物基因组注释管道为27个物种生成的新注释,包括:

  • 玉米注释版本103,基于新组件Zm-B73-REFERENCE-NAM-5.0(GCF_902167145.1)
  • 绒猴注释版本105,基于新程序集Callithrix_jacchus_cj1700_1.1(GCF_009663435.1)
  • 中国仓鼠注释版本104,基于组件CriGri_1.0(GCF_000223135.1)和新组件CriGrai-PICRH-1.0(GCF_003668045.3)
  • 亚洲大黄蜂注释版本100,基于新程序集V.mandarinia_Nanaimo_p1.0(GCF_014083535.2)
  • 佛罗里达州柳叶刀注释版本100,基于新组件Bfl_VNyyK(GCF_ 000003815.2)
  • Anopheles stephensi注释版本100,基于新程序集UCI_ANSTEP_V1.0(GCF_013141755.1)

更新和改进的RefSeq代表性基因组集合现已上市
细菌和古生菌的代表性基因组集合包含11727个原核集合,以代表各自的物种。可以找到更多信息在这里.

PGAP使用的更新蛋白质家族模型可下载
3.0版原核生物基因组注释管道(PGAP)使用的NCBI蛋白家族模型现已可用。

此版本包含17350个型号:NCBI中构建的12864个HMM(比2.0版多111个)和4486个TIGRFAM HMM。此外,自2.0版以来,我们已经为2000多个Pfam HMM分配了产品名称,使总数达到6698个Pfam-HMM,其名称可以通过PGAP转移到它们命中的注释蛋白质。可以找到更多信息在这里.

未来更改:鼠标引用程序集更新
新鼠标GRCm39程序集的RefSeq注释正在进行中,预计将包含在下一版本中。

冠状病毒宿主基因调控元件现在由RefSeq功能元件注释

新冠肺炎大流行已引起人们对与SARS-CoV-2进入相关的人类宿主基因以及调控这些基因表达的因素的关注。在NCBI,我们优先考虑了对这些基因在RefSeq功能元素项目。 我们的注释包括一些增强子、启动子、顺调控元件和蛋白质结合位点等特征类型。 在最新的人类注释发布中,我们注释了27个不同生物区域的236个调控特征(109.20200522)包括ABO公司ACE2公司,ANPEP公司CD209型CLEC4G公司CLEC4M系列CTSL公司,DPP4(DPP4)、和TMPRSS2型 基因

您可以使用我们的新轨道枢纽我们最近宣布。您还可以看到生物区域和特征轨迹。它们具有功能性和描述性元数据,包括生物区域摘要、实验证据类型、出版物支持等。

图1中的示例显示了NCBI的基因组数据查看器(GDV)中ABO基因区域(GRCh38,NW_009646201.1:73864-103789)人类ABO血型的测定者。最近一项全基因组关联研究发现,非编码ABO变异与新型冠状病毒肺炎严重程度相关(PMID:32558485),映射到此区域中的某些RefSeq功能元素。显示GDV生物区的ABO区域图1。人类ABO基因区在NCBI GDV中显示RefSeq功能元素功能。生物区域聚集轨迹显示ABO上游增强子的潜在特征注释(LOC112637023号),启动子区域(LOC112679202号),+5.8内含子1增强子(LOC112679198号),3′调控区(位置112639999)和a+36.0下游增强子(LOC112637025号).功能元件特征包括许多增强子、启动子、顺调控元件和蛋白质/转录因子结合位点。

我们在网站,包括数据下载和提取选项。敬请关注NCBI见解以及其他NCBI社交媒体,以便将来发布RefSeq Functional Elements!

NCBI RefSeq鼠标GRCm38.p6注释的主要更新

我们已经更新了小鼠参考基因组GRCm38.p6的注释。它包括:

  • 的标记RefSeq选择为每个蛋白编码基因识别一个代表性转录物和蛋白质。在GFF3中查找具有“tag=RefSeq-Select”属性的特征,以便对每个编码基因只需要一个转录本或蛋白质的分析。您也可以使用查询在Entrez中找到这些RefSeq参考选择(_S)[过滤器].’
  • 去年对2000多个基因进行了注释更新,包括4000多个新的或修改过的转录本。这包括有针对性的管理,以确保我们在RefSeq Select中代表表达良好和保守的转录物。
  • 2300多项监管及其他注释功能元件来自900多个生物区的特征。为了便于解析,现在在GFF3第2列中用源代码“RefSeqFE”标识这些代码。

引用时,请将此注释称为NCBI Mus musculus annotation Release 108.20200622。您可以在以下位置找到数据:

这是我们升级到刚由基因组参考联盟,GRCm39。我们预计将在未来几周内启动我们的计算场,根据我们最新的策展和广泛的短(Illumina)和长(PacBio IsoSeq和nanopore)RNA-seq数据生成完整的注释,这些数据将于今年夏天晚些时候发布。敬请期待!

10月11日NCBI会议纪要:介绍新RefSeq功能元素项目

10月11日NCBI会议纪要:介绍新RefSeq功能元素项目

2017年10月11日,NCBI将于RefSeq功能元素本《NCBI会议纪要》将向您介绍本项目及其范围,描述如何管理和显示功能元素,演示如何访问数据,并提供有关项目当前进度的信息。

日期和时间:2017年10月11日星期三12:00 PM–12:30 PM EDT

之后注册,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示结束后,网络研讨会将上传至NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程页面.

新的RefSeq Functional Elements项目是NCBI RefSeq项目包括已在科学文献中通过实验验证和描述的人类和小鼠的非基因功能基因组区域。