古皮 (Guppy_female_1.0_MT)

Guppy组装和基因注释

孔雀鱼(网状百合)也被称为millionfish和彩虹鱼,是世界上分布最广的鱼类之一热带鱼类分布广泛,是最受欢迎的淡水水族馆鱼类之一。孔雀鱼被用作生态学、进化和行为研究领域的模式生物。

装配

Guppy_female_1.0+MT组装件由马克斯·普朗克发育生物学研究所于2014年5月提交。该组件位于染色体水平,由40144个连续体组成,组装成3029个支架。根据这些序列,已经构建了23条染色体。N50大小是指组装基因组的50%位于N50大小或更长的区块中的长度。连续梁的N50长度为41908,脚手架的N50为5270359。

基因注释

基因注释过程是通过结合蛋白质到基因组比对和注释映射进行的来自合适的参考物种和RNA-seq比对(其中RNA-seq-数据和适当的元数据是公开的可用)。对于每个候选基因区域,应用一个选择过程来选择最合适的基于进化距离的转录本、源数据的实验证据和比对的质量。结合BLAST和Inferal/RNAfold获得小的ncRNA。假基因是通过查找at基因含有大量非生物内含子(内含子<10bp),其中该基因被重复,或者基因是单外显子,并且在其他地方发现了功能性多外显子旁系的证据基因组。lincRNA是通过RNA-seq数据产生的,其中没有蛋白质同源性或蛋白质结构域的证据在成绩单上找到。

根据劳德代尔堡协议,请检查在使用这些数据发布任何全基因组分析之前,基因组/组装的发布状态。

更多信息

有关该物种的一般信息,请参阅维基百科.

统计

总结

装配Guppy_female_1.0_MT,INSDC组件GCA_000633615.22014年4月
基本对731,622,281
黄金路径长度731,622,281
注释提供程序合奏
注释方法全基因构建
Genebuild已启动2018年5月
Genebuild已发布2018年7月
Genebuild上次更新/修补2020年3月
数据库版本112.1

基因计数

编码基因22,871
非编码基因358
小的非编码基因338
长非编码基因2
其他非编码基因18
假基因25
基因转录本34,730

其他

Genscan基因预测39,344