月份:2017年10月

2018年NCBI参考序列的变化特征变化

自2018年3月起,RefSeq基因组组装记录中不再包含SNP变异特征——带有NC_、NT_、NW_和AC_加入前缀的染色体和连续记录。此更改同时影响ASN.1和平面文件记录。由于变异体的数量已经很大,而且还在不断增加,因此从这些大型基因组记录中删除SNP特征将大大减少RefSeq FTP文件的大小,并使下载和处理变得更容易。我们将继续在以NG_为前缀的基因组记录、转录物(NM_、NR_、XM_、XR_)和蛋白质(NP_、XP_、YP_)序列中包含SNP。

提醒:截至2017年9月,NCBI已经停止接受dbSNP和dbVar中非人类SNP的提交.RefSeq平面文件将于2017年11月停止提供非人类变体数据。

订阅参考消息公告列表服务有关RefSeq的定期更新。

BLAST+2.7.1现已上市

在新版(2.7.1)中BLAST+可执行文件blastdbcmd可以更快地查找分类名称(例如,科学名称或通用名称)。我们还进行了一些低级改进,使BLAST能够更高效地执行多线程,特别是当可用内存不足时。

注意:一些LINUX和MacOSX用户可能会发现,他们需要增加进程允许的打开文件描述符的数量。可以使用“ulimit-n”(在bash下)轻松更改允许打开的文件描述符的数量。我们建议将限制设置为至少1024。

请参阅BLAST+发行说明了解更多信息。

IgBLAST 1.8.0版本

新版本的IgBLAST现已在上提供文件传输协议,以及上的新手册github。此版本有以下改进:

  1. igblastn可执行文件现在可以更有效地多线程处理大型查询集。默认线程数现在是四个,但可以使用-num_threads选项进行更改。
  2. igblastn可执行文件现在可以将SRA登录作为查询输入。搜索在本地计算机上运行,但查询是从NCBI的SRA存储库中检索的。请使用-SRA而不是-query选项来启用。
  3. 发现D和J基因的默认核苷酸错配惩罚值较低(分别从-4到-2和从-3到-2)。这提高了为中度突变序列找到最佳D和J基因命中的准确性。

我们的网络IgBLAST页面还使用了新的默认核苷酸错配惩罚值(即-2,用于查找D和J基因)。

IgBLAST有助于分析免疫球蛋白和T细胞受体可变结构域序列。

新流感病毒提交向导使流感序列提交更容易

NCBI现在提供了一个流感序列提交向导,使提交更容易,并将更快地为您提供登录号。要开始,请登录NCBI,转到提交门户并从GenBank部分选择“核糖体RNA(rRNA)、rRNA-ITS或流感序列”的链接。

带有genbank链接的提交门户页面

继续阅读“新流感病毒提交向导使流感序列提交更容易”

11月1日网络研讨会:介绍基因组数据查看器(GDV)

11月1日网络研讨会:介绍基因组数据查看器(GDV)

2017年11月1日,星期三,我们将举办一场关于GDV的网络研讨会,GDV是NCBI的全功能基因组浏览器。在本次网络研讨会中,您将学习如何探索和分析真核RefSeq基因组组装的序列和注释。我们将向您展示如何:

  • 在整个组件中搜索基因、产品和其他标记,或跳到特定位置或范围
  • 显示七个预选轨迹集中的任意一个,突出显示装配的各个方面,或者从您的NCBI帐户创建并加载您自己的自定义轨迹集。
  • 加载并显示NCBI的GEO或SRA提交的路线数据。
  • 上传您自己的注释和变量数据
  • 在浏览器中的部件上显示BLAST或Primer-BLAST结果。

日期和时间:2017年11月1日星期三美国东部夏令时12:00-12:30

之后注册,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示结束后,网络研讨会将上传至NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程页面.

NCBI的Genome Data Viewer(GDV)取代Map Viewer

这个基因组数据查看器(GDV)现在是NCBI的主要基因组浏览器,取代了我们原来的基因组浏览器Map Viewer。GDV是一个现代基因组浏览器,与Map Viewer相比有了重要改进。这些包括序列级细节和自动更新过程,以跟上基因组测序、组装和注释的快速步伐。

APOBE3CB_GDV公司_
Genome Data Viewer主页(顶部面板)和浏览器视图(底部面板)

继续阅读“NCBI的Genome Data Viewer(GDV)取代Map Viewer”

GenBank 222.0版通过FTP、Entrez和BLAST提供

GenBank 222.0版通过FTP、Entrez和BLAST提供

GenBank 222.0版(2017年10月14日)有203953682条传统记录(包括非散装TSA),包含244914705468个碱基对的序列数据。此外,有508825331条WGS记录包含2318156361999个序列数据碱基对,192754804条TSA记录包含172909268535个序列数据碱对,9479460条TLS记录包含2993818315个序列数据基对。

继续阅读“GenBank 222.0版可通过FTP、Entrez和BLAST获得”

来自Exome Aggregation Consortium(ExAC)的CNV在2017年9月的数据发布中添加到dbVar

来自Exome Aggregation Consortium(ExAC)的CNV在2017年9月的数据发布中添加到dbVar

拷贝数变体(CNV)来自ExAC的出版物现在可以在dbVar中作为nstd151型数据包括从60000个人类外显子中鉴定出的约50000个CNV区域,对影响人类基因组中蛋白质编码序列的常见和罕见拷贝数变异进行了深入调查。

dbVar提供FTP文件以VCF、GVF和CSV格式,并包括GRCh37上的放置以及GRCh38上的重新映射放置。教程也可以使用不同的格式。

遵循dbVar RSS提要了解每月发布的信息。

基因中更新的HIV-1相互作用数据集

基因中更新的HIV-1相互作用数据集

我们最近更新了基因数据由南方研究所(SRI).

这个蛋白质相互作用数据集现在有:

  • 8005个交互,
  • 16215个交互描述,
  • 3859个蛋白质由3757个人类基因编码,
  • 和6822份出版物。

这个复制交互数据集现在有:

  • 1595次互动,
  • 1854个交互描述,
  • 1583个蛋白质由1583个人类基因编码,
  • 和229份出版物。

数据也可在RefSeq HIV-1网站GeneRIF FTP站点.