Godes荆棘龟 (rGopEvg1_v1.p)

Goodes thornscruch乌龟组装和基因注释

装配

rGopEvg1_v1.p组装件由脊椎动物基因组项目于2019年7月提交。该组件位于染色体水平,由933个连续体组成,组装成383个支架。根据这些序列,已经构建了24条染色体。N50大小是指组装基因组的50%位于N50大小或更长的区块中的长度。连续梁的N50长度为13026736,脚手架的N50为147425149。

基因注释

基因注释过程是使用蛋白质与基因组比对、来自合适参考物种的注释映射和RNA-seq比对的组合进行的(其中RNA-seq数据和合适的元数据是公开的)。对于每个候选基因区域,根据进化距离、源数据的实验证据和比对质量,应用选择过程来选择最合适的转录集。
结合BLAST和Inferal/RNAfold获得小的ncRNA。
假基因是通过观察含有大量非生物内含子(内含子<10bp)的基因来计算的,在这些基因中,该基因被重复所覆盖,或者该基因是单个外显子,并且在基因组的其他地方发现了功能性多xon paralog的证据。
lincRNAs是通过RNA-seq数据生成的,在转录本中没有发现蛋白质同源性或蛋白质结构域的证据。

根据劳德代尔堡协议,请在使用这些数据发布任何全基因组分析之前检查基因组/组装的发布状态。

更多信息

有关该物种的一般信息,请参阅维基百科.

统计

总结

装配rGopEvg1_v1.p,INSDC组件GCA_0073999415.1型2019年7月
基本对2,298,547,364
黄金路径长度2,298,547,364
注释提供程序合奏
注释方法全基因构建
Genebuild已启动2019年10月
Genebuild已发布2020年4月
Genebuild上次更新/修补2019年12月
数据库版本112.1

基因计数

编码基因19,808
非编码基因1, 285
小的非编码基因942
长非编码基因281
其他非编码基因62
假基因170
基因转录本31,974

其他

Genscan基因预测53,442