装配
rGopEvg1_v1.p组装件由脊椎动物基因组项目于2019年7月提交。该组件位于染色体水平,由933个连续体组成,组装成383个支架。根据这些序列,已经构建了24条染色体。N50大小是指组装基因组的50%位于N50大小或更长的区块中的长度。连续梁的N50长度为13026736,脚手架的N50为147425149。
基因注释
基因注释过程是使用蛋白质与基因组比对、来自合适参考物种的注释映射和RNA-seq比对的组合进行的(其中RNA-seq数据和合适的元数据是公开的)。对于每个候选基因区域,根据进化距离、源数据的实验证据和比对质量,应用选择过程来选择最合适的转录集。结合BLAST和Inferal/RNAfold获得小的ncRNA。假基因是通过观察含有大量非生物内含子(内含子<10bp)的基因来计算的,在这些基因中,该基因被重复所覆盖,或者该基因是单个外显子,并且在基因组的其他地方发现了功能性多xon paralog的证据。lincRNAs是通过RNA-seq数据生成的,在转录本中没有发现蛋白质同源性或蛋白质结构域的证据。
根据劳德代尔堡协议,请在使用这些数据发布任何全基因组分析之前检查基因组/组装的发布状态。
更多信息
有关该物种的一般信息,请参阅维基百科.