标签:生物项目

现在可用!访问NCBI人类泛基因组研究联盟(HPRC)的数据

现在可用!访问NCBI人类泛基因组研究联盟(HPRC)的数据

你有没有想过你的基因组成与你邻居的有什么不同?国家人类基因组研究所(NHGRI)-资助人类泛基因组研究联合会(HPRC)已经建立了泛基因组参考的初始版本&代表全球47个人的新人类参考基因组序列的集合。泛基因组图将不同基因组的序列相互关联。全基因组使研究人员能够比较这些DNA序列,并获得人类遗传变异范围的更详细视图。这是朝着HPRC建立由350个来自不同遗传背景的个体的基因组组成的泛基因组参考的目标迈出的第一步。  继续阅读“现在可用!访问NCBI人类盘古研究联盟(HPRC)的数据”

重要更新!FTP上ASSEMBLY_REPORTS和GENOME_REPORTSs的更改

重要更新!FTP上ASSEMBLY_REPORTS和GENOME_REPORTSs的更改

您目前是否通过FTP站点访问基因组组装数据?我们正在整合基因组FTP站点上ASSEMBLY_REPORTS和GENOME_REPORTS目录中提供的信息,以简化访问并确保您拥有最准确、最新和一致的报告数据。  

assembly_REPORTS目录中的assembly_summary文件在新添加的第24-38列中获取信息,包括有关集合的统计信息(大小、GC内容、基因组大小和序列数)以及有关所提供注释的详细信息(基因数、注释名称和日期)。参见以下示例(表1)。查看自述文件有关摘要文件内容的更多详细信息。  继续阅读“重要更新!FTP上ASSEMBLY_REPORTS和GENOME_REPORTSs的更改”

从序列读取档案(SRA)提交文件中清除人类序列污染

从序列读取档案(SRA)提交文件中清除人类序列污染

你使用人类衍生的序列数据吗?您是否经常需要确定您的数据是否没有人类序列,因此是否适合公开发布?我们鼓励提交者在提交给SRA之前,从数据文件中筛选并删除受污染的人为读取。为了支持调查人员的这一努力,我们提供了一种工具,可以从您提交的SRA中删除人类序列污染!

人工读取删除工具(HRRT)

人工读取清除工具(HRRT;也称为人工洗涤器)可在githubDockerHub接口HRRT基于SRA分类分析工具(STAT)将以fastq文件作为输入,并生成fastq.clean文件作为输出,在该文件中,所有识别为潜在人类源的读取都用“N”屏蔽。继续阅读“从序列读取档案(SRA)提交文件中清除人类序列污染”

无间隙端粒到端粒人类基因组(T2T-CHM13)现已上市

无间隙端粒到端粒人类基因组(T2T-CHM13)现已上市

2022年4月1日,《科学》出版人类基因组的第一个完整序列,称为T2T-CHM13型这一引人注目的科学成就是在人类基因组首次从人类基因组项目并提供就地看看生物学上重要的区域,如着丝粒、端粒和以前未组装的片段复制。继续阅读,了解如何在NCBI上访问此集合和相关资源的更多信息,或者访问现在的1000多个人类基因组集合中的任何一个GenBank(基因银行).继续阅读“无缺口端粒对端粒人类基因组(T2T-CHM13)现已上市”

研究人员:现在更容易在BioProject中找到你想要的数据

我们已经改进了生物项目为您提供更好的方法来查找特定项目中的所有数据。我们认为您会喜欢这个新界面,它可以让您快速选择正确的BioProject,并链接到其他NCBI数据库中需要的数据。

更新后的BioProject浏览器比以往任何时候都更容易通过各种属性过滤数据,因此您可以快速选择感兴趣的BioProjects。

图1
图1。显示BioProject浏览器链接的BioProject主页。要使用新浏览器,请单击“按项目属性浏览任何BioProject页面搜索栏下方的链接或“按项目属性'上的链接生物项目主页。

继续阅读“研究人员:现在更容易在BioProject中找到您想要的数据”

RefSeq Functional Elements现已公开

RefSeq Functional Elements现已公开

NCBI很高兴宣布发布RefSeq功能元素,该资源提供参考序列基因实验验证的人类和小鼠非基因功能元件的记录。可以通过以下方式访问数据基因核苷酸爆炸生物项目图形显示文件传输协议.

继续阅读“RefSeq Functional Elements现已公开”

进入隐藏王国:真菌ITS参考序列

本文面向真菌研究人员以及RefSeq和BLAST用户。

真菌具有独特的特性,因此很难根据形态学对物种进行识别和分类。为了解决这些问题,NCBI的真菌分类学家Conrad Schoch和NCBI的真菌RefSeq策展人Barbara Robbertse与外部真菌学专家合作,正在从核核糖体RNA基因的内部转录间隔区(ITS)区域策展一组真菌序列。这套真菌分类群的标准DNA序列不仅解决了通过形态学鉴定和分类真菌物种的困难,而且对于分析环境(宏基因组学)测序研究也至关重要。在最近的一篇文章中描述了精心策划的ITS序列数据库(PMC免费文章),都有相关的样本数据,如果可能,从类型中的序列材料,确保正确的物种识别和名称更改跟踪。本文将向您展示如何访问这些ITS序列并使用专门的目标位置爆炸服务。

真菌ITS序列是RefSeq靶向基因座生物项目(项目编号:177353). 您可能知道生物项目是与单个倡议相关的生物数据的集合;在这种情况下,目标是从靶位点收集和保存真菌序列,靶位点是特定的分子标记,例如用于系统发育分析的蛋白质编码或核糖体RNA基因。

继续阅读“进入隐藏王国:真菌ITS参考序列”

塔斯马尼亚魔鬼2:肿瘤和塔斯马尼魔鬼线粒体基因组

塔斯马尼亚魔鬼(袋獾)它是仅存的最后一种大型有袋食肉动物,由于一种奇怪而致命的感染,一种被称为可传播魔鬼面部肿瘤病(TDFTD)的可传播癌症,现在面临灭绝。在之前的NCBI Insights文章中,我们讨论了肿瘤的基因表达数据,这些数据确定了肿瘤的神经起源,并表明肿瘤可能来源于施旺细胞。在本文中,我们将考虑NCBI数据库中的一些基因组测序项目,并探索肿瘤起源于与受影响动物不同的个体的证据,以支持肿瘤细胞本身是传染源的观点。继续阅读“塔斯马尼亚魔鬼2:肿瘤和塔斯马尼魔鬼线粒体基因组”