基因组组件的新下载文件和FTP目录


现在可以下载NCBI最近注释的新的文件类型。真核基因组注释管道装配网页和来自基因组/RefSeqFTP区域。新文件类型包括BAM格式的注释成绩单到程序集的对齐,所有模型由日晷和-对于已经被注释多次的物种-通过当前和先前注释之间的特征差异来表征特征的文件。

继续阅读渐次

即将到来:一个新的NIH手稿提交(NIHMS)系统!


反映国家医学图书馆(NLM)持续承诺在美国国立卫生研究院(NIH)和其他国家的公共获取支持,我们高兴地宣布,一个新的NIHMS系统将于2020年初发布。这一新系统旨在简化提交过程,确保稿件的持续质量公开可访问,并为作者和调查者提供更透明的选项来避免处理延迟。

熟悉现有NIHMS系统的人将发现提交、审阅和批准手稿的基本步骤,以在新系统中保持PMC不变。他们将看到一个更新的用户界面,简化了返回用户的登录过程;在整个过程中提供上下文帮助;并且提供了用户友好的选项,用于导入文章元数据、请求更正,以及为被提交的提交接管审阅者角色。这些更新的细节和更多的可在这个视频:

继续阅读渐次

12月11日Webar:运行NCBI原核基因组注释管道(PGAP)在您自己的数据上


星期三,2019年12月11日晚上12点,NCBI工作人员将展示一个网络研讨会,它将向您展示如何使用NCBI的PGAP(HTTPS://GITHUBCOM/NCBI/PGAP利用你自己的数据来预测细菌和古细菌基因组中的基因,并使用相同的输入和应用。您可以运行PGAP您自己的机器,计算农场,或在云中。另外,现在你可以提交你的PGAP副本GenBank注释的基因组序列。

  • 日期和时间:星期六,2019年12月11日12:00下午12:45
  • 注册

注册后,您将收到一封确认邮件,并提供有关网络研讨会的信息。现场演示后的几天,你可以查看关于NCBI YouTube②通道。你可以了解未来的网络研讨会。网络研讨会和课程页面.

12月4日WebAlar:NCBI人类群体遗传变异数据


在星期三,2019年12月4日晚上12点,NCBI工作人员将在NCBI的人口变异数据集上发表一个网络研讨会,如1000个基因组、EXAC、GnomAD和TopMe,这些数据目前包含在数据库中。您将学习如何找到数据,以及如何使用这些信息来解释和优先化变体,以供进一步研究。您也将看到一个预览一个新的倡议,dBAP等位基因频率聚合器(ALFA),这是基于超过150000个主题在60个BGAP研究。

  • 日期和时间:星期六,2019年12月4日12:00下午12:45
  • 注册

继续阅读渐次

更新的TrNASCAN和蛋白质模型的原核基因组注释管道的新版本


原核生物基因组注释管道(PGAP)的新版本现在可以在github. 这个版本使用了一个新的和改进的TrasCAN版本。TrasCAN SE:2.0.4)还包括最新的Hidden Markov模型和命名蛋白质的Brasules集合。

记住,你可以把PGAP的结果提交给GenBank。或者,如果你还在改进程序集,而你的基因组没有通过预注释验证,你可以使用-忽略所有错误模式来获得一个初步注释。

看到我们上岗以及我们的文档有关如何设置和运行PGAP自己的细节。

尝试pGAP和让我们知道你真喜欢!

NCBI Will于2020年4月退休探针数据库


NCBI发布了探针数据库2005作为生物医学研究用核酸试剂的注册表。当时基于阵列的检测是普遍的,但此后随着短读测序的出现而下降。因此,NCBI将在2020年4月为探针数据库退出Web界面。您可以继续访问数据库中的内容NCBI FTP站点,但是它将不再被更新。在这个声明中,探测器将不再接受新的提交。

如果你对这个退休有疑问或担心,我们很乐意听取你的意见。请在此评论或联系我们iNo.ncBi.nLM.NIH.GOV.

请求提案:一月在NYGC的云代码会议中的单细胞


纽约基因组中心将于一月15日至17日2020日在云科典中举办NCBI单细胞。项目建议书将于12月2日提交。

请提交你的建议并申请在这里.

范围内的主题是什么?

该代码将集中于单细胞数据,包括RNA、DNA和染色质可访问性。我们特别感兴趣的是管道的建议和SRA数据的分析、数据互操作性以及在集群中使用机器学习技术。我们也欢迎教程管道和教育工具的建议。你可以访问云计算资源,把你的想法变成一个工作原型。网站例如以前的代码项目的例子。

继续阅读渐次

ReFSEQ发布97是公开的


ReFSEQ版本97是可访问的在线通过文件传输协议通过NCBI的Entz编程实用程序,电子工具。

这个完整的版本包含2019年11月4日的基因组、转录和蛋白质数据,包含219407891个记录,包括157639958个蛋白质,28730283个RNAs,和来自97407个生物体的序列。

在几个目录中,作为一个完整的数据集提供释放,也被逻辑分组所划分。

继续阅读渐次

8月2019年10月Refsq注释:鼠标、萤火虫等


深褐色毛皮的老鼠吃

最近,NCBI真核基因组注释管道在发布了新的注释雷夫斯克下列生物:

  • 白纹伊蚊(亚洲虎蚊)
  • 锦鸡儿(金鹰)
  • 中心弧菌(飞翅鲷)
  • 安娜帽(安娜的蜂鸟)
  • Camarhynchus小蜂(鸟)
  • 驼背骆驼(阿拉伯骆驼)
  • 大麻(大麻)
  • 遮目鱼(虱目鱼)

继续阅读渐次