月份:2018年9月

2018年10月3日网络研讨会:使用BLAST Well

2018年10月3日网络研讨会:使用BLAST Well

下周三,即2018年10月3日,NCBI BLAST小组的负责人将向您展示如何使用NCBI的独立BLAST应用程序提高效率。您将学习如何优化数据库选择、输出格式、分类信息,以及如何使用我们的下一代对齐程序Magic-BLAST。你也可以使用其中的许多策略来改善你的网络BLAST搜索。

日期和时间:2018年10月3日星期三12:00 PM–12:45 PM EDT

注册

之后注册,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI YouTube频道。您可以在网络研讨会和课程页面上了解未来的网络研讨会。

dbVar现在提供易于使用的人类非冗余SV参考数据集,以帮助解释结构变量

dbVar现在提供易于使用的人类非冗余SV参考数据集,以帮助解释结构变量

dbVar非冗余SV(NR-SV)数据集包括220多万次删除、110万次插入和300000次重复。这些数据来自150多项研究,包括1000基因组3期,西蒙斯基因组多样性项目,临床遗传学、ExAC等。您可以使用NR SV数据文件过滤和注释广泛应用中的变量:

  1. 临床医生可以轻松筛选患者的基因组数据,以找到与先前报告的具有临床意义的变异重叠的SV。
  2. 研究人员可以将他们自己的全基因组SV调查结果与dbVar NR数据进行比较,以确定新的或罕见的变异,以及可能致病的变异,并在某些情况下获得匹配变异的等位基因频率。用户还可以使用NR SV和其他基因组注释注释SV数据,以优先考虑那些最可能影响生物功能的变体。
  3. 开发人员变量分析管道可以使用dbVar NR数据来帮助识别新的变量,校准其算法,或者简单地将数据集成到下游分析工具和工作流中。

dbVar的NR SV参考数据每月更新一次。这些更新包括新的数据库提交。我们欢迎您的反馈这些文件的内容和可用性,以便我们可以改进它们。

有关更多信息,请参阅我们的github网站,其中包括简介教程并通过>FTP访问NR SV数据集。

去ASHG?以下是ClinVar海报的预览

去ASHG?以下是ClinVar海报的预览

今年10月,一些NCBI员工将前往美国人类遗传学学会(ASHG)会议在阳光明媚的圣地亚哥。下面,我们给你一个关于ClinVar公司我们将在ASHG上展示的海报。

想了解更多关于如何提交表型和功能数据的信息吗?或者访问数据?

我们钓到你了吗?

10月18日星期四下午3点至4点,前往海报1492T“ClinVar中表型和功能证据的增加”。(展厅,一楼)

继续阅读“去ASHG?这里是我们ClinVar海报的预览”

RefSeq 90版已公开

RefSeq 90版已公开

RefSeq版本90可访问联机,通过文件传输协议以及通过NCBI的编程实用程序。

此完整版本包含截至2018年9月10日的基因组、转录本和蛋白质数据。它包含173956003条记录,包括121138769个蛋白质,23838676 836个,以及84276个生物体的序列。

该版本在几个目录中作为完整的数据集提供,并按逻辑分组进行划分。

GenBank 227版可通过FTP、BLAST和Entrez获得

GenBank 227版可通过FTP、BLAST和Entrez获得

GenBank 227.0版(2018年8月13日)有208831050条传统记录,包括非散装TSA,包含260806936411个序列数据碱基对。还有665309765条WGS记录,其中包含3204855013281个序列数据碱基对,249295386条批量定向TSA记录,其中含有225520004678个序列数据碱对,15822538条批量定向TLS记录,中含有6077824493个序列数据基对。

继续阅读“GenBank 227版可通过FTP、BLAST和Entrez获得”

GenBank将于2018年12月开始使用扩展的登录格式

到2018年底,GenBank和其他INSDC成员将扩大用于测序项目的加入格式。我们使用当前较短的格式分配了几乎所有可能的加入号。使用这些较长的格式将使我们能够扩大加入范围,并为我们提供更大的容量。

全基因组霰弹枪(WGS)、转录组霰弹枪组装(TSA)和靶向基因座研究(TLS)测序项目的扩展格式将使用六个字母的项目代码前缀和两位数的组装版本号,后跟7、8或9位数字(例如,AAAAAA 020000001)。

非-WGS/TLS/TSA核苷酸序列目前使用“2+6”格式,两个字母的前缀后跟六位数字。此格式将扩展为八位数。

蛋白质序列目前使用“3+5”登录格式。到2018年底,该格式将使用七位数。

您需要调整任何处理方法以适应这些新的标识符格式。请写信给帮助台关于新格式的任何问题。

改进了NCBI数据库中的搜索功能

今年早些时候,我们宣布发布了一个新的改进的搜索功能,该功能可以解释纯语言,为普通搜索提供更好的结果。此功能最初开发于NCBI实验室随后在NCBI上发布所有数据库搜索,现在可用于多种NCBI资源:核苷酸、蛋白质、基因、基因组和组装。无论您是在搜索特定基因还是整个基因组,无论您搜索的数据库是什么,现在都可以检索NCBI的最佳结果。

下图显示了搜索的结果人类INS在核苷酸数据库中。尽管这是一个核苷酸搜索,但结果包括来自基因、蛋白质、分类学的相关信息,以及到NCBI参考序列(RefSeq)的链接,以及在NCBI的基因组浏览器中访问BLAST和胰岛素基因区域基因组数据查看器.KIS_nuccore_小型图1.新的自然语言搜索结果来自人类INS搜索的核苷酸数据库。

试试这个新的搜索功能,让我们知道你的想法。并继续访问NCBI实验室搜索页面尝试我们的最新实验,我们也将在NCBI Insights上发布。

 

9月12日NCBI会议纪要:NCBI API密钥发布计划

9月12日NCBI会议纪要:NCBI API密钥发布计划

更新:网络研讨会将于9月12日举行!

如果您已经注册9月5日的日期,那么您将自动注册9月12日的日期。您无需重新注册。我们欢迎其他愿意的人登记.

如前所述,NCBI为电子实用程序引入了API密钥。您很快就会想开始在E-Utilities API调用中使用API密钥,因为这将允许以最快的速度访问NCBI数据库。在本次网络研讨会中,我们将回顾API密钥的工作原理,并为您提供简短测试周期的时间表以及API密钥功能的完整发布时间。

日期和时间:2018年9月12日星期三12:00 PM–12:30 PM EDT

在此处注册:https://bit.ly/2v0wFMl(网址:https://bit.ly/2v0wFMl)

之后注册,您将收到一封确认电子邮件,其中包含有关参加网络研讨会的信息。现场演示几天后,您可以在NCBI YouTube频道。您可以在上了解未来的网络研讨会网络研讨会和课程第页。

(网络研讨会重新安排到9月12日,因为演讲者被意外叫走了。)