家养牦牛 (LU_Bosgru_v3.0)

家养牦牛装配与基因注释

装配

LU_Bosgru_v3.0组件由兰州大学于2019年6月提交。该组件位于染色体水平,由1060个连续体组成,组装成414个支架。根据这些序列,已经构建了31条染色体。N50大小是指组装基因组的50%位于N50大小或更长的区块中的长度。连续梁的N50长度为44716738,脚手架的N50为114386978。

基因注释

基因注释过程是通过结合蛋白质到基因组比对、来自合适参考物种的注释映射和RNA-seq比对(其中RNA-seq-数据和适当元数据是公开的)来进行的。对于每个候选基因区域,根据进化距离、源数据的实验证据和比对质量,应用选择过程来选择最合适的转录物集。
结合BLAST和Inferal/RNAfold获得小的ncRNA。
假基因是通过观察含有大量非生物内含子(内含子<10bp)的基因来计算的,在这些基因中,该基因被重复所覆盖,或者该基因是单个外显子,并且在基因组的其他地方发现了功能性多xon paralog的证据。
lincRNAs是通过RNA-seq数据生成的,在转录本中没有发现蛋白质同源性或蛋白质结构域的证据。

根据劳德代尔堡协议,请在使用这些数据发布任何全基因组分析之前检查基因组/组装的发布状态。

更多信息

有关该物种的一般信息,请参阅维基百科.

统计

总结

装配LU_Bosgru_v3.0,INSDC组件GCA_005887515.1,2019年5月
基本对2,832,776,395
黄金路径长度2,832,776,395
注释提供程序合奏
注释方法全基因构建
Genebuild已启动2019年7月
Genebuild已发布2019年12月
Genebuild上次更新/修补2019年8月
数据库版本112.3

基因计数

编码基因20,967
非编码基因4,749
小的非编码基因3,021
长非编码基因1,703
其他非编码基因25
假基因1, 208
基因转录本49,935

其他

Genscan基因预测46,048