月份:2020年5月

从NCBI多序列比对查看器(MSAV)下载高质量图形

现在,您可以下载显示在NCBI多序列比对查看器(图1)。将序列对齐从加载到查看器中爆炸结果或直接上载对齐文件。在查看器中设置好对齐方式后,在工具栏上的“下载”菜单中选择“打印机友好型PDF/SVG”选项以保存图像。PDF和SVG文件包含适合演示和发布的矢量图形。MSA_下载图1。MSAV中的图像下载选项。您可以调整所需的坐标范围并选择下载PDF或SVG图像。您还可以预览PDF下载。选择简化的彩色底纹以提高与某些图形程序的兼容性。

下载的图像将显示您请求的坐标范围,并将包括路线中的所有行。

请通过MSA Viewer上的反馈链接联系我们或写信给NCBI帮助台以提供反馈,并让我们知道如何使NCBI多序列查看器更好地为您工作。

Orthologs在RefSeq中是A-Swiming和A-Buzzing!

以前我们写了关于果蝇属RefSeq中的注释。我们很高兴地报告,我们也在改进如何计算和报告鱼和昆虫帮助你发现跨物种进化相关的基因。目前,当我们使用我们的内部注释脊椎动物基因组时真核生物基因组注释管道,我们有一个稳健的过程,使用BLAST比较和局部同步性的组合来识别1:1的直系图与人类。这些结果可在NCBI基因和我们的新Ortholog页面,也在上Gene的FTP站点我们还使用这些数据将人类基因和蛋白质名称应用于其他物种的直系生物,为数百种脊椎动物提供了非常丰富的注释。

对于鱼类,我们现在使用两层流程。首先,现在大多数鱼类与斑马鱼的直系同源性为1:1,这通常会导致识别出50%以上的直系祖先。其次,如果我们确定了斑马鱼基因的人类同源基因,那么我们也会报告人类基因。我们还主要转向应用斑马鱼而非人类的基因符号和名称,主要由斑马鱼信息网络提供(ZFIN公司)其他鱼类的直系祖先。最终的结果是更多的正交连接和更好的命名。例如,许多鱼类都有两个相关的同源异型盒基因美斯2a梅斯2b,与单曲相比中小企业2人类的基因。我们的更新流程使我们能够识别并正确命名meis2a和meis2b7340鱼类物种。

继续阅读“Ortholog在RefSeq中是A-Swiming和A-Buzzing!”

扩大的平均核苷酸身份分析现在可用于原核基因组组装

正如我们在更早的职位,GenBank使用平均核苷酸同一性(ANI)分析发现并纠正错误识别的原核基因组组合。现在,您可以通过一份可下载的报告访问60多万个GenBank细菌和古细菌基因组组合的ANI数据(ANI报告原核生物.txt)可从基因组/组装报告FTP站点的区域。这个自述文件详细描述了报告的内容。您可以使用ANI数据为自己评估感兴趣的基因组组装的分类身份。

新的ANI报告原核生物.txt替换同一目录中的旧ANI_report_bacteria.txt。我们不再更新ANI_report_bacteria.txt文件,并将在2020年5月31日后删除该文件。

RefSeq 200版已公开

RefSeq 200版可访问联机,通过文件传输协议以及通过NCBI的Entrez编程实用程序、E-utilities。

此完整版本包含截至2020年5月4日可用的基因组、转录和蛋白质数据,包含237381664条记录,包括171643729个蛋白质、31244247个RNA和100605个生物体的序列。该版本作为完整的数据集在多个目录中提供,也按逻辑分组进行划分。

其他公告:

RefSeq中的生物体数量超过100000个!
当前RefSeq版本包含100605个不同的物种或分类单元,自99版以来净增763个物种。尽管当前版本号为200(请参阅下文),但此里程碑与第100次发布一致。注意,原核生物(细菌和古菌)的物种数量有所减少,因为清理工作主要清除了未分类的细菌和元基因组组装基因组(MAGs)中的组装体。

FTP版本号已跳至200
作为之前宣布的,NCBI的参考序列(RefSeq)FTP版本号在此版本中增加到200,并跳过了编号100-199。上一个版本是2020年3月发布的99版。此更改是为了避免与我们注释的真核基因组的独立编号的RefSeq注释版本的发布编号重叠,当前的范围为100-109,例如小家鼠注释版本108。

NCBI蛋白家族
A类新版本PGAP(原核基因组注释管道)使用的NCBI蛋白家族图谱现已可用。您可以针对您喜爱的原核蛋白质搜索这个隐马尔可夫模型(HMM)集合,以使用hmmer识别其功能。

原核生物参考和代表性基因组组合的重新计算
我们有更新了集合细菌和古生菌的参考和代表组合,以更好地反映RefSeq中原核生物的分类广度。我们根据几个标准为每个物种选择了一个参考或代表性集合,包括连续性、完整性以及集合是否来自类型材料。

未来更改:鼠标引用程序集更新
GRC预计将于2020年发布鼠标GRCm38.p6参考组件的完整组件更新。我们预计今年夏天将RefSeq FTP 201版或202版的鼠标RefSeq注释更新到新的GRCm39程序集。

 

换岗:NCBI新任代理总监

我们想花点时间宣布NCBI的一项重要内部发展。在经历了32年辉煌的职业生涯后,James Ostell博士于2020年3月31日从联邦政府退休。

詹姆斯·奥斯特尔博士
詹姆斯·奥斯特尔博士

奥斯特尔博士(我们都知道他叫“吉姆”)于1988年加入NCBI,并在NCBI担任信息工程处处长。在这个职位上,他负责设计、建造和部署NCBI提供的几乎所有公共生产服务。2017年,他成为NCBI的第二任主管,并支持将NCBI服务转移到云环境的初步努力。在长期任职期间,Jim监督了NCBI的发展,从少数几个想知道如何应对即将到来的生物数据时代的人,发展成为一个每天为700多万用户服务的约700名员工的充满活力的中心。我们庆祝Jim在建立这些服务方面的领导地位,这些服务继续提供免费和可靠的数据访问,这些数据对生物医学研究和美国国立卫生研究院增强人类健康的使命至关重要。

我们也很高兴欢迎Stephen Sherry博士担任NCBI的新任代理总监。

Stephen Sherry博士
Stephen Sherry博士

Sherry博士(或“Steve”)于1998年加入NCBI,领导了数项NCBI资源的开发,包括dbSNP、dbVar、dbGaP、ClinVar和SRA。他还在SRA数据集向云架构的持续移动中发挥了核心作用。史蒂夫长期以来一直热衷于以对研究人员有用的方式存储群体遗传数据,同时保护研究参与者的隐私。

在我们向吉姆致以亲切的告别之际,我们希望你能和我们一起欢迎史蒂夫担任这个新角色。

使用MONDO ID识别ClinVar和基因检测注册处的情况

使用MONDO ID识别ClinVar和基因检测注册处的情况

为了支持数据共享工作,NCBI的ClinVar和基因检测注册中心(GTR)现在接受使用MONDO ID识别条件的提交。

要提交给ClinVar,请下载我们的更新电子表格模板并输入MONDO作为条件ID类型。注意:只有通过MONDO ID而不是名称识别条件时,才需要更新模板。

GTR提交者可以使用MONDO ID识别通过电子表格提交的临床试验中的表型,以及临床和研究试验提交中的MONDO表型名称。

继续阅读“使用MONDO ID识别ClinVar和基因检测注册中的条件”
5月20日网络研讨会:使用BigQuery探索云中的SRA元数据

5月20日网络研讨会:使用BigQuery探索云中的SRA元数据

5月20日加入我们,学习如何使用谷歌的大查询云中的序列读取存档(SRA)加快你的生物信息研究和发现项目。BigQuery是一个使用类似SQL的查询来探索基于云的数据表的工具。在本次网络研讨会中,我们将向您介绍如何使用BigQuery挖掘SRA提交者提供的元数据以及SRA运行的分类分析结果。您将看到真实的案例研究,其中演示了如何找到有关SRA运行的关键信息,并为您自己的分析管道识别数据集。

  • 日期和时间:2020年5月20日星期三12:00 PM–12:45 PM EDT
  • 注册

注册后,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程页面.

结构查看器iCn3D 2.15.0,具有新的渲染、注释和对齐功能

 iCn3D2.15.0现已在NCBI网站上发布GitHub上的版本。若要使用更新的web应用程序,请从分子模型数据库(MMDB),打开结构摘要页面,然后单击分子图形中的“全功能3D查看器”按钮。例如,您可以检索包含术语的结构SARS-COV-2型,单击感兴趣的结构,然后单击“全功能3D查看器。“您还可以打开iCn3D并使用“文件”菜单例如,通过ID检索结构6个月或从本地计算机打开结构文件。spike_port(峰值保护)图1。iCn3D显示SARS-COV-2棘突蛋白的结构(6月)通过保守残基的自定义着色和其他冠状病毒棘突蛋白的多重序列比对。2.15.0中提供的一些新功能包括将自定义颜色应用于特定残留物或链条以及将多条路线添加为轨道的功能 继续阅读结构查看器iCn3D 2.15.0,具有新的渲染、注释和对齐功能

新版本的IgBLAST(1.16.0)在这里!

我们发布了新版本(1.16.0)的IgBLAST抗体通用的NCBI软件包,用于分类和分析免疫球蛋白(IG)和T细胞受体(TCR)可变域序列。版本1.16.0有三个新的改进。

  1. 增加了在区域末端3'延伸J基因排列的能力(图1)。这允许您查看由于序列相似性较低而不包括的未对齐基。 IgBLAST_选项

图1。The new “extend alignment at the 3′ end” option on theIgBLAST网络表单。命令行选项为“-extend_align3end”。继续阅读“IgBLAST(1.16.0)的新版本在这里!”