GenBank 260.0版可用!

GenBank 260.0版可用!

GenBank(基因银行)260.0版(2024年4月19日)现已在NCBI FTP站点本次发布有31.18万亿个基数,44.6亿个记录。

当前版本具有:

  • 250803006个包含3213818003787个碱基对序列数据的传统记录
  • 3,333,621,823工作组包含27225116587937个序列数据碱基对的记录
  • 741066498散装TSA(交通安全管理局)包含689648317082个序列数据碱基对的记录
  • 135115766散装TLS公司包含53492243256个序列数据碱基对的记录
有什么新功能?

在GenBank 259.0版和260.0版截止日期之间的93天内,GenBank的传统部分增加了643106415743个碱基对和1742570个序列记录。同期,我们更新了113299条记录。我们平均每天增加和/或更新19955条传统记录!

在259.0版和260.0版之间,GenBank的WGS组件增加了2573536123602个碱基对和470393271个序列记录。GenBank的TSA成分增加了20841207756个碱基对和25263375个序列记录。GenBank的TLS成分增加了1923886278个碱基对和2760634个序列记录。

在此版本中,序列数据文件的总数增加了1560个。划分如下:

  • BCT:132个新文件,现在总计1201个
  • CON:2个新文件,现在总计240个
  • INV:462个新文件,现在总计2561个
  • MAM:76个新文件,现在总共349个
  • PAT:6个新文件,现在总共269个
  • 印尼国家电力公司:745个新文件,现在总计2458个
  • PRI:10个新文件,现在总共87个
  • ROD:29个新文件,现在总计343个
  • VRL:32个新文件,现在总计1095个
  • VRT:66个新文件,现在总共575个

注:2月份没有GenBank发布,因此增长数据高于正常值。

即将发生的变化

与我们的合作伙伴合作国际核苷酸序列数据库合作(INSDC),我们正在将GenBank限定符的名称“/country”更改为“/geo_loc_name”之前宣布的,这一变化(2024年6月生效)将更好地代表样本采集地点类型的多样性。

GenBank还将为“/collection_date”限定符提供新的允许值,于2024年12月生效。

其他信息

为了便于下载,请记住,未压缩的GenBank 260.0版序列数据平面文件大约需要5021 GB。ASN.1数据文件大约需要2041 GB。

有关GenBank 260.0版的更多信息,请参阅发行说明以及上的GenBank和ASN.1(ncbi-asn1)目录中的README文件文件传输协议.

保持最新

关注我们的社交活动@NCBI公司加入我们的邮件列表及时了解GenBank和其他NCBI新闻。

问题?

请将任何意见或问题发送至info@ncbi.nlm.nih.gov.

留下回复