网络控制比 CCDS横幅
公共医学 Entrez公司 基因 爆炸 OMIM公司
  

CCDS公司
主页
文件传输协议
过程
发布和统计

合作者
EBI公司
HGNC公司
MGI公司
网络控制比

联系我们
电子邮件CCDS

基因组显示
合奏
网络控制比
UCSC公司
VEGA公司

相关资源
基因
同源基因
鬃毛
参考序列

共识CDS(CCDS)项目是一项合作努力,旨在确定一组具有一致注释和高质量的人类和小鼠蛋白质编码核心区域。长期目标是支持收敛到一组标准的基因注释。

可用信息包括:

  公告 返回页面顶部

确定MANE中的包容性      2022年11月9日

MANE集合中包含的序列标识符现在在个人CCDS报告页面中标识,用于人工记录。MANE是NCBI和EMBL-EBI项目的匹配注释。CCDS页面左侧的相关资源标题下有一个指向MANE信息的链接。

CCDS Release 24-人类更新      2022年10月26日

GRCh38.p14参考基因组的NCBI和Ensembl/Havana注释(组装GCF_000001405.40分析了NCBI注释版本110和Ensembl注释版本108),以确定一致注释的附加编码序列(CDS)。CCDS数据可在CCDS网站和FTP站点并将根据每个浏览器的更新周期在合作者的基因组和/或基因浏览器网站上提供。

此次更新增加了2746个新的CCDS ID,并将237个基因添加到人类CCDS集合中。CCDS Release 24共包含35608个CCDS ID,对应于19107个GeneID,其中48062个蛋白质序列来自NCBI,47762个来自Ensembl。请参阅发布和统计报告以获取详细信息。


请参见过去的公告

  概述 返回页面顶部

基因注释由多个公共资源提供,使用不同的方法,产生相似但并不总是相同的信息。人类和小鼠基因组序列现在已经足够稳定,可以开始识别那些相同的基因位置,并公开这些数据,作为三大公共基因组浏览器支持的核心集。长期目标是支持收敛到一组标准的基因注释。

为此,建立了共识CDS项目。CCDS项目是一项协作工作,旨在确定一组核心的蛋白质编码区,这些编码区具有一致的注释和高质量。

  访问和可用性 返回页面顶部

共识CDS项目的初步结果现在可以从参与者的基因组浏览器网站上获得。此外,CCDS标识符显示在相关NCBI RefSeq和Entrez Gene记录中。可以通过以下提供的链接访问CCDS报告,或者使用此页面顶部提供的查询界面直接查询底层数据库。

CCDS数据集也可用于匿名文件传输协议.

  合作者 返回页面顶部

CCDS集合由合作成员协商一致建立,包括:

我们预计,随着独立管理小组就最初不同的情况达成一致,随着对弱支持基因进行额外的实验验证,以及自动注释方法的不断改进,CCDS集将变得更加完整。CCDS合作小组之间的沟通是一项持续的活动,将解决CCDS更新周期之间的差异并确定改进。

  CCDS标识符和跟踪 返回页面顶部

包括在CCDS集合中的注释基因与唯一标识符编号和版本号相关联(例如,CCDS1.1、CCDS234.1)。如果CDS结构发生变化,或者如果该位置的基本基因组序列发生变化,则版本号将更新。通过注释和基于序列的基因组浏览器更新周期,CCDS集合将被向前映射,以维护标识符。现有CCDS基因的所有变更均通过合作协议完成;任何一个团体都不会单方面改变设置。

  工艺流程和质量测试 返回页面顶部

CCDS集合是在NCBI和Ensembl进行协调的全基因组注释更新后计算的。注释更新表示由手动管理和自动计算处理混合定义的基因。

主要的策展小组是哈瓦那队EMBL-EBI和NCBI的RefSeq注释组。自动方法通过合奏组和NCBI基因组注释计算管道。与自动化信息相比,编辑信息更受青睐,EMBL-EBI和NCBI组中的信息必须一致,并通过严格的质量控制。

定义CCDS基因集的一般流程包括:

  1. 比较基因组注释结果
  2. 识别基因组上具有相同位置坐标的带注释的编码区域
  3. 质量评价
  4. 在协作组进行额外审查之前,从核心集中删除质量较低的CDS。

CCDS集合包括注释为全长的编码区(带有起始ATG和有效的终止密码子),可以从基因组中翻译而无需移码,并使用一致剪接位点。未来进行的质量测试的数量和类型可能会增加,但包括跨物种比较分析的一致性、识别假性基因、反转录转座子、一致剪接位点、支持转录本和蛋白质同源性的分析。

  出版物 返回页面顶部

请为CCDS使用以下引文:

共识编码序列(CCDS)项目:确定人类和小鼠基因组的共同蛋白编码基因集。
Pruitt KD、Harrow J、Harte RA、Wallin C、Diekhans M、Maglott DR、Searle S、Farrell CM、Loveland JE、Ruef BJ、Hart E、Suner MM、Landrum MJ、Aken B、Ayling S、Baertsch R、Fernandez-Banet J、Cherry JL、Curwen V、Dicuccio M、Kellis M、Lee J、Lin MF、Schuster M、Shkeda A、Amid C、Brown G、Dukhanina O、Frankish A、Hart J、Maidak BL、Mudge J、Murphy MR,Murphy T、Rajan J、Rajput B、Riddick LD、Snow C、Steward C、Webb D、Weber JA、Wilming L、Wu W、Birney E、Haussler D、Hubbard T、Ostell J、Durbin R、Lipman D。
基因组研究,2009年7月;19(7):1316-23.
公共医学:PMID:19498102

跟踪和协调CCDS项目的国际策划工作。
Harte RA、Farrell CM、Loveland JE、Suner MM、Wilming L、Aken B、Barrell D、Frankish A、Wallin C、Searle S、Diekhans M、Harrow J、Pruitt KD。
数据库2012年3月20日;2012年:bas008。doi:10.1093/database/bas008。
公共医学:PMID:22434842

共识编码序列数据库的当前状态和新功能。
Farrell CM、O'Leary NA、Harte RA、Loveland JE、Wilming LG、Wallin C、Diekhans M、Barrell D、Searle SM、Aken B、Hiatt SM、Frankish A、Suner MM、Rajput B、Steward CA、Brown GR、Bennett R、Murphy M、Wu W、Kay MP、Hart J、Rajan J、Weber J、Snow C、Riddick LD、Hunt T、Webb D、Thomas M、Tamez P、Rangwala SH、McGarvey KM、Pujar S、Shkeda A、Mudge JM、,Gonzalez JM、Gilbert JG、Trevanion SJ、Baertsch R、Harrow JL、Hubbard T、Ostell JM、Haussler D、Pruitt KD。
核酸研究2014年1月1日;42(1):D865-72。doi:10.1093/nar/gkt1059。
公共医学:PMID:24217909

共识编码序列(CCDS)数据库:由专家管理支持的人类和小鼠蛋白质编码区域的标准化集合。
Pujar S、O’Leary NA、Farrell CM、Loveland JE、Mudge JM、Wallin C、Girón CG、Diekhans M、Barnes I、Bennett R、Berry AE、Cox E、Davidson C、Goldfarb T、Gonzalez JM、Hunt T、Jackson J、Joardar V、Kay MP、Kodali VK、Martin FJ、McAndrews M、McGarvey KM、Murphy M、Rajput B、Rangwala SH、Riddickickick LD、Seal RL、Suner MM、Webb D、Zhu S、Aken BL、Bruford EA、,Bult CJ、Frankish A、Murphy T、Pruitt KD。
核酸研究2018年1月4日;46(D1):D221-D228。doi:10.1093/nar/gkx1031。
公共医学:采购经理人指数:29126148
PubMed中心:预防性维修识别码:PMC5753299 抄送浏览:1.1.51