北極地松鼠 (ASM342692v1)

北极地松鼠组装和基因注释

装配

ASM342692v1组件由UAF于2018年8月提交。该组件位于脚手架水平面上,由79883个连体构件组装成15884个脚手架。N50大小是指组装基因组的50%位于N50大小或更长的区块中的长度。连续梁的N50长度为91013,脚手架的N50为3964291。

基因注释

基因注释过程是通过结合蛋白质到基因组比对、来自合适参考物种的注释映射和RNA-seq比对(其中RNA-seq-数据和适当元数据是公开的)来进行的。对于每个候选基因区域,根据进化距离、源数据的实验证据和比对质量,应用选择过程来选择最合适的转录物集。
结合BLAST和Inferal/RNAfold获得小的ncRNA。
假基因是通过观察含有大量非生物内含子(内含子<10bp)的基因来计算的,在这些基因中,该基因被重复所覆盖,或者该基因是单个外显子,并且在基因组的其他地方发现了功能性多xon paralog的证据。
lincRNAs是通过RNA-seq数据生成的,在转录本中没有发现蛋白质同源性或蛋白质结构域的证据。

根据劳德代尔堡协议,请在使用这些数据发布任何全基因组分析之前检查基因组/组装的发布状态。

更多信息

有关该物种的一般信息,请参阅维基百科.

统计

总结

装配ASM342692v1,INSDC组件一般合同A_003426925.1,2018年8月
基本对2,520,505,282
黄金路径长度2,520,505,282
注释提供程序恩森布尔
注释方法全基因构建
Genebuild已启动2018年11月
Genebuild已发布2019年4月
Genebuild上次更新/修补2020年3月
数据库版本112.1

基因计数

编码基因19,674
非编码基因3,408
小的非编码基因2,111
长非编码基因785
其他非编码基因512
假基因433
基因转录本34, 173

其他

Genscan基因预测45,091