美国国旗

美国政府的官方网站

NCBI智人注释版本GCF_009914755.1-RS_2023_10

基因组序列记录智人RefSeq程序集GCF_009914755.1号(T2T-CHM13v2.0)由NCBI真核基因组注释管道这是一个自动管道,用于注释草图和成品基因组装配上的基因、转录物和蛋白质。

注释版本GCF_009914755.1-RS_2023_10是NCBI智人注释版本110的更新。2023年10月2日最新的已知RefSeq转录本(带有NM_和NR_前缀)被放在基因组上,用于更新注释特征。此外,更新后的注释中包括了在上一次完整注释(NCBI智人注释版本110)中预测的模型RefSeq,该注释在2023年10月2日仍然有效。此次更新未重新计算这些模型。有关用于生成模型RefSeq的证据的更多信息,请参阅以下报告NCBI智人注释版本110。

注释产品可在序列数据库和FTP站点。

本报告提供:

有关注释过程的更多信息,请访问NCBI真核基因组注释管道第页.


注释发布信息

该注释应称为“GCF_009914755.1-RS_2023_10”。

Entrez查询转录本和蛋白质的日期:2023年10月2日
向公共数据库提交注释的日期:2023年10月6日
软件版本:10.2

程序集

此注释运行中包含以下程序集:
程序集名称加入大会提交人组装日期参考/替代程序集内容
GRCh38.p14型GCF_000001405.40基因组参考联盟02-03-2022参考25条组装染色体;未放置的脚手架
T2T-CHM13v2.0GCF_009914755.1号T2T联合体2022年1月24日备用24条组装染色体

基因和特征统计

下面为每个部件提供了注释特征的数量和长度。

功能计数

功能GRCh38.p14型GRCh38.p14型
主要组件
GRCh38.p14型
所有备用位置
GRCh38.p14型
补丁
T2T-CHM13v2.0
基因和假基因帮助59,65259,0312,5182,87858,360
蛋白质编码20,08019,8958611,08920,077
非编码22,10221,79573086720,939
转录假基因1,2251,2241031511204年
非转录假基因15,77215,65565473615,683
带有变体的基因20,22920,02772585020,245
免疫球蛋白/T细胞受体基因片段40039016224387
其他737281170
  放置在多个部件单元上帮助4,458674
mRNA136,181130,4425,6344,637129,663
完全支持132,914127,6915,3524,403124,799
  初始>5%帮助1,2481074个92821,121
部分3171312315121
  带填充间隙帮助00000
  放置在多个部件单元上帮助4,296810
  已知RefSeq(NM_)帮助67,11666,9762,1102,56266971个
模型参考序列(XM_)69,06563,4663524个2,07562,692
非编码RNA帮助49,18246,5641,9581,78048,943
完全支持46,06844,1821,5741,61345,616
  初始>5%帮助00000
部分99826443
  带填充间隙帮助00000
  放置在多个部件单元上帮助1,085222
  已知RefSeq(NR_)帮助21,48721,47764266921,434
  型号RefSeq(XR_)帮助25,69723,6949811022个26,027
伪抄本帮助1,7561,7201301881,685
完全支持1735年1704年1271861,668
  初始>5%帮助00000
部分00151111
  带填充间隙帮助00000
  放置在多个部件单元上帮助
  已知RefSeq(NR_)帮助1,5931,5871251631,544
  型号RefSeq(XR_)帮助163133525141
信用违约互换136,772130,8335,7944,641130,050
完全支持132,914127,6915,3524,403124,799
  初始>5%帮助2,0331,7891381062,065
部分521390389277417
  有重大修正帮助4710541126268
  已知RefSeq(NP_)帮助67,11666,9762,1062543个66,970
  模型RefSeq(XP_)帮助69,07863,4663524个2,07562,692

详细报告

以下计数不包括假基因。

基因注释的BUSCO分析

BUSCO v4.1.4版已运行在注释基因集的“蛋白质”模式中,每个选择一个最长的蛋白质基因,并使用灵长类odb10谱系数据集运行。结果报告了来自初级装配单元的基因集,并在BUSCO中显示符号。

工具书类