宣布鼠标GRCm39的RefSeq注释!

NCBI RefSeq已完成新鼠标引用程序集GRCm39的初始注释最近发布基因组参考联盟这是自2012年发布GRCm38以来首次对鼠标引用进行坐标更改更新,解决了400多个问题,几乎使脚手架N50翻倍,缩小了几乎一半的差距,并增加了1.9 Mb的序列。这是一件大事!图1。Genome Data Viewer显示了小鼠假常染色体区域的注释,其中包括之前缺失的四个基因的注释:Sts、Nlgn4l、Akap17a和2510022D24Rik

NCBI RefSeq是第一个发布GRCm39注释的资源,称为小肌肉注释版本109包括:

  1. 超过45000份人工管理的抄本,与我们最近注释的内容几乎匹配GRCm38.p6型帮助过渡到新的基因组。
  2. 一组重新计算的模型使用了170多亿个RNA-seq读取和7600万个PacBio和Oxford Nanopore长转录组读取作为支持证据。
  3. 注释基因的新预测(3%)。

一个改进的区域是X染色体和Y染色体之间共享的伪常染色体区域,组装起来特别困难。GRCm39中的ChrX PAR区域包含四个先前缺失的新基因:Sts、Nlgn4l、Akap17a和2510022D24Rik(图1)。

我们将致力于这一新集合的未来管理,并深入研究有助于改善基因表现的区域。

您可以从我们的FTP站点或从我们的新NCBI数据集服务NCBI中也有基因组数据查看器包括58个样本的RNA-seq表达轨迹、GRCm38的组装比对和其他小鼠组装,等等。您可以使用NCBI重新映射服务将基于GRCm38或其他小鼠组件的基因组数据转换为新的参考组件坐标。

关于“宣布鼠标GRCm39的RefSeq注释!

留下回复