从序列读取档案(SRA)提交文件中清除人类序列污染

从序列读取档案(SRA)提交文件中清除人类序列污染

您是否使用人类衍生序列数据?您是否经常需要确定您的数据是否没有人类序列,因此是否适合公开发布?我们鼓励提交者在提交给SRA之前,从数据文件中筛选并删除受污染的人为读取。为了支持调查人员的这一努力,我们提供了一种工具,可以从您提交的SRA中删除人类序列污染!

人工读取删除工具(HRRT)

人工读取清除工具(HRRT;也称为人工洗涤器)可在githubDockerHub接口HRRT基于SRA分类分析工具(STAT)将以fastq文件作为输入,并生成fastq.clean文件作为输出,在该文件中,所有识别为潜在人类源的读取都用“N”屏蔽。继续阅读“从序列读取档案(SRA)提交文件中清除人类序列污染”

ClinVar将为躯体数据提供更好的支持

ClinVar将为躯体数据提供更好的支持

我们需要你的意见! 

ClinVar公司是NCBI关于人类基因变异和疾病之间关系的报告档案,并附有支持性证据。为了使ClinVar数据更加准确和有用,我们引入了一个增强的数据模型,以更好地接受和支持体细胞变异的分类。 

您可以如何提供帮助 

你有没有体细胞变异分类来提交给ClinVar? 我们想听听你的意见!我们现在正在测试ClinVar的增强数据模型和对体细胞变异的分类  继续阅读“ClinVar将为躯体数据提供更好的支持”

向GenBank提交mRNA序列的新向导

向GenBank提交mRNA序列的新向导

你提交真核细胞核mRNA序列给GenBank(基因银行)? 新的mRNA提交向导可用!基于现代提交门户框架,此新向导将为您带来增强的体验,包括: 

    • 针对mRNA序列的指导提交经验 
    • 矢量的自动修剪和短序列的删除 
    • 更容易输入源元数据 
    • 编码区域(CDS)和未翻译区域(5'UTR,3'UTR)的新功能注释web表单  
    • 广泛的功能预览(图1) 
    • 更快的序列处理和登录分配 
    • 在加入分配之前访问修复错误工作流 

观看短视频(4分钟)了解如何在这个新向导中注释CDS功能!  继续阅读“向GenBank提交mRNA序列的新向导”

NCBI-NIAID Beyond Phylogenies Codeathon取得了成功!

NCBI-NIAID Beyond Phylogenies Codeathon取得了成功!

SARS-CoV-2基因组数据对于监测新冠肺炎大流行的病毒传播和演变、识别新出现的变异以及制定和评估对策至关重要。截至2022年9月,全世界已有1300多万SARS-CoV-2基因组测序,使其成为有史以来测序最多的病原体。基因组分析的一个基石是建立一个系统发育学,它证明了单个分离物与其余已测序基因组的相关性。然而,SARS-CoV-2基因组的数量提供了新的机会超越系统发育,以及对传统基因组分析和可视化方法的计算挑战。继续阅读“NCBI-NIAID Beyond Phylogenies Codeathon取得了成功!”

全面访问云中的微生物病原检测数据!

全面访问云中的微生物病原检测数据!

NCBI的病原体检测资源现在提供有关谷歌云平台(GCP)让您更好地接触到100多万个细菌分离物。

GCP数据包括:

  1. 来自MicroBIGG-E数据库抗微生物耐药性(AMR)、应激反应、毒力基因和基因组元件以及病原体隔离浏览器都可以通过以下方式访问谷歌BigQuery.
  2. FASTA格式的MicroBIGG-E序列可从谷歌云存储.

功能和优点

GCP上的病原体检测数据允许您通过网络或FTP进行大规模访问。值得注意的是,没有FTP访问MicroBIGG-E;web界面限制为100K行,序列下载也受到限制。GCP没有此类限制。BigQuery上的MicroBIGG-E还允许您下载所有AMR提示增强版结果。目前,在100多万个病原体分离株中发现了2000多万行抗菌药物耐药性、毒力和应激反应基因以及点突变。

以下是两个研究人员使用MicroBIGG-E和AMFinderPlus数据推进抗菌药物耐药性研究的示例:

    • 确定红霉素抗性甲基转移酶(PMID:34795028).
    • 评估抗生素耐药基因的健康风险(PMCID:PMC8346589号).

继续阅读“全面访问云中的微生物病原检测数据!”

RefSeq版本216

RefSeq版本216

RefSeq版本216现在可用联机,来自文件传输协议并通过NCBI的新资源,数据集集合.

此完整版本包含截至2023年1月9日可用的基因组、转录和蛋白质数据,并包含342395932条记录,包括249868639个蛋白质、49869497个RNA和128299个生物体的序列。该版本作为完整的数据集在多个目录中提供,也按逻辑分组进行划分。继续阅读“RefSeq版本216”

介绍一种新的和改进的SciENcv体验!

介绍一种新的和改进的SciENcv体验!

想快速方便地提交联邦拨款申请吗?查看我们新的和改进的SciENcv体验!科学专家网络简历(SciENcv)是一个电子系统,可以帮助您收集申请联邦拨款支持所需的专业信息

SciENcv帮助您收集和汇编有关专业知识、就业、教育和专业成就的信息。您可以使用SciENcv创建和维护财务文档和个人简介,这些都是作为赠款申请包的一部分提交的 继续阅读“引入新的、改进的SciENcv体验!”

比较基因组查看器中的新功能!

比较基因组查看器中的新功能!

轻松区分反向对齐

我们很兴奋地宣布更新NCBI比较基因组查看器(CGV)它允许您快速确定对齐线段的相对方向. CGV公司显示了两个不同真核生物组合之间的全基因组比对(图1)

在查看器中,单个排列区域由两条染色体之间的彩色带连接。根据两个部件上的对齐序列是否位于同一方向(向前)或相对方向相反。正向a对齐由绿色条带连接,而反向对齐由紫色条带连接。反向比对代表局部基因组倒置或倒置易位,并可能指出两个组合之间存在显著生物学差异的区域。  继续阅读“比较基因组查看器中的新功能!”

宣布GenBank和SRA数据处理网页

宣布GenBank和SRA数据处理网页

有兴趣了解序列数据是如何在GenBank和序列读取档案(SRA)中提交、处理和公开的吗?宣布GenBank和SRA数据处理网页!

在这里,您可以了解国家生物技术信息中心(NCBI)(国家医学图书馆(NLM)的一部分)用于处理提交的数据和公开发布的程序,以及数据状态的关键定义。继续阅读“宣布GenBank和SRA数据处理网页”

NIH印前试验的下一阶段即将启动

NIH印前试验的下一阶段即将启动

第二阶段扩大了PubMed和PMC中预印本的范围

上个月,国家医学图书馆(NLM)宣布的计划将其在PubMed Central(PMC)和PubMed-的NIH预印本试点扩展到新冠肺炎之外,以涵盖NIH资助研究的所有预印本报告。该试点的第二阶段将于本月晚些时候启动,包括由NIH奖项、合同或内部计划支持的预印本,并发布到合格的预打印服务器2023年1月1日或之后  继续阅读“NIH印前试验即将启动的下一阶段”