摘要

双氟醚双支猪鬃孔雀是一种祖先失明的无翅六足类动物,具有非凡的再生能力,能够修复丢失的身体附件,例如其长长的触角。作为昆虫纲的姊妹类群,双盲蝽是了解六足类早期进化以及昆虫起源和进化的关键。这里我们报告了1.2-Gb的基因组草图C.augens公司以及与其他节肢动物的比较基因组分析结果。C.augens公司,我们发现了动物王国中最大的趋离子受体化学感受基因库,这一大规模的扩展可能会弥补视力的丧失。我们发现感光细胞基因的缺乏在基因组水平上反映了祖先外部感光器官的继发性丢失。解毒和碳水化合物代谢基因家族的扩张可能反映了对觅食行为的适应,而重复的凋亡基因可能是其高再生潜力的基础。这个C.augens公司基因组是研究昆虫基因组创新出现的关键参考之一,昆虫是最具多样性的动物类群,它为研究尚未开发的双氟醚生物学开辟了新的机会。

介绍

双尾龙,也被称为双叉刚毛尾,是祖先无翼的六足类动物。它们分布于世界各地,是土壤生态系统中普遍存在的组成部分,主要出现在森林和草原的凋落物层和潮湿土壤中,甚至在较深的土层中定居(Orgiazzi等人,2016年). 它们柔软、大多无色素、弱硬化的细长身体长达10毫米(Sendra等人。2018). 所有的双氟龙都是盲人,都有长的肌腱(珠状)触角、一对丝状末端附肢(尾蚴)以及腹足残留物(柱头)(格里马尔迪2010). 幼虫的发育是表观的(即在孵化前完成身体分割),蜕皮在整个生命周期中持续进行(科赫2009),很可能在它们修复失去的附属物的非凡能力中发挥了重要作用(Maruzzo等人。2005;Whalen和Sampedro 2010; Orgiazzi等人,2016年;Tyagi and Veer 2016年). 双氟脲类卵子的受精是间接的:雄性产生并沉积精子团(精子包),随后由同种雌性收集(科赫2009). 已描述了大约1000种双盲蝽,并将其分为3个主要类群:尾节长且呈丝状的盲蝽亚纲、尾节不分的钳状盲蝽总科和尾旋转腺体短的原甲亚纲(科赫2009). 虽然后两种是食肉动物,吃小型节肢动物,但其中的Campodeoidea孔雀是典型的代表,是杂食动物,是分解者土壤群落的一部分(卡彭特1988;Lock等人。2010). 双氟醚相对于昆虫(昆虫纲)的一个显著特征是隐藏在头袋中的口器的位置(昆虫)(Böhm等人。2012)如弹尾目和尖尾目,而昆虫的口器是暴露的(外颚)。然而,昆虫(狭义)中保留了双氟醚的许多特征,系统发育和形态学研究表明,双氟醚可能代表昆虫的姊妹类群(马奇达2006;Sasaki等人。2013;Misof等人。2014)在研究昆虫基因组的早期进化时,双盲蝽是一个重要的参考分类单元。尽管二氟醚在进化上具有重要意义,但它们仍然没有得到充分的研究,特别是在基因组水平上,这阻碍了对六足类基因组早期进化的深入理解。因此,我们对C.augens公司,并在此首次对双氟醚基因组进行分析。在我们的一些分析中,我们获得了包括另一个双氟醚基因组的许可(短吻Catajapyx aquilonaris)代表Japygoidea血统,已在i5k计划的背景下进行排序(https://i5k.nal.usda.gov/; 上次访问时间为2019年11月29日)。通过分析比较C.augens公司与其他12种节肢动物的基因组相比,我们发现了基因家族快速进化的证据C.augens公司例如,我们发现了嗜离子受体基因家族的大规模扩张,这可能会弥补视力的丧失。我们还描述了与解毒和碳水化合物代谢相关的基因家族的扩张,这可能反映了C.augens公司'觅食行为和凋亡基因的复制,这可能是其再生潜力的基础。有趣的是,我们在基因组中发现了推测的内源性病毒成分残余物,类似于正氧病毒科的负性单链RNA病毒,正氧病毒是包括流感病毒在内的一个病毒家族。Diplura代表昆虫纲的姊妹分支C.augens公司为研究昆虫化学传感系统等昆虫创新的出现提供了重要的外部参考,并为研究尚未开发的双氟醚生物学开辟了新的机会。

材料和方法

样品采集和排序

孔雀样品采集于奥地利Rekawinkel(48°11′06,68〃N,16°01′28,98〃E),并根据巴利萨语(1964)补充了最新的分类信息(凭证标本ID:NOaS 220-244/2019,保存在维也纳自然历史博物馆)。孔雀根据下面给出的方案,通过流式细胞术估计基因组大小为~1.2 GbDeSalle等人。(2005)使用居屋艾蟋作为尺寸标准(约3.9 Gb)。两名成年女性被用于基因组测序。在提取DNA之前,对个体进行仔细清洗,以去除可能附着在体表的任何非目标生物。基因组DNA是使用Qiagen DNeasy Blood&Tissue试剂盒(德国希尔登市Qiagene)提取的,并遵循制造商描述的“昆虫”核酸分离协议。使用Illumina的TruSeq DNA Nano试剂盒(Illuminia,San Diego,CA)按照标准方案构建了四个Illumiana配对基因(PE)测序文库,插入大小为2×350-和2×550-bp。使用Illumina的Nextera mate pair试剂盒准备了四个额外的配对(MP)库(3-、6-、9-和12-kb插入大小),并在预制E-gel(Life Technologies,Europe BV)0.8%琼脂糖凝胶上进行了尺寸选择。在HiSeq 2500平台(Illumina)上使用2×100 bp的阅读长度配置对文库进行测序。所有原始读取(总计约21亿)都保存在NCBI序列读取档案(SRA)中,注册号为SRX3424039–SRX342046(生物项目:PRJNA416902)。

基因组组装

使用trimmomatic v0.36对低质量读数和带有适配器和垫片序列的读数进行修剪(Bolger等人。2014). 使用KmerGenie v1.7023计算短插入库中读取的kmer内容(2014年奇奇和梅德韦杰夫). 基因组示波器v1.0(Vurture等人。2017)用于评估杂合性水平。所有文库最初都通过parallel-meta v3程序进行筛选,以检测来自细菌和古生物物种16S基因的读码(Jing等人。2017)使用“猎枪”选项。与Kraken一起对读数进行了进一步筛选(伍德和萨尔茨堡2014),使用一组代表古菌、细菌、真菌、线虫、植物、原生动物、病毒和蠕虫的完整基因组的自定义数据库。使用sparseassembler从短插入库构建的初始草图组件(Ye等人。2012)用于通过分类注释GC-Coverage图评估污染的存在,如Blobtools(2017年Laetsch和Blaxter). 对于草案续文的分类注释,结果来自MegaBLAST v2.3.0+(Camacho等人。2009)使用NCBI核苷酸数据库以及Diamond v0.8.34.96(Buchfink等人。2015)带有UniRef90蛋白质数据库(Suzek等人。2015)被用作Blobtools的输入(使用“bessumorder”规则运行)。通过使用BWA v0.7.13将四个库映射到草图组件,计算每个控件的读取覆盖率(李和杜宾2009). 我们用PhylOligo进一步分析了该组件(Mallet等人。2017)使用分层DBSCAN聚类(phyloselect.py)和Anvi'o(Eren等人。2015)遵循中所示的步骤Delmont和Eren(2016)为了可视化组件(仅contigs>2.5 kb)以及GC内容和映射配置文件,以检测潜在污染物。为了识别C.augens公司线粒体序列、草图对照与BLASTN比较(Camacho等人。2009)两种双氟醚的线粒体基因组(脆弱的Campodea fragilis卡波迪亚·卢博基) (Podsialowski等人。2006). 上述分析的结果用于过滤原始读数:与假定污染物的主要接触簇或接触簇相比,覆盖率/GC组成有显著不同的轮廓用于通过BWA映射过滤读数。然后使用杂合软件汇编程序Platanus v1.2.4重新组装过滤后的短插入文库(Kajitani等人。2014)使用其默认参数。冗余v0.13a(Pryszcz和Gabaldón 2016)用于减少杂合区域单独组装时出现的组装冗余(Kelley and Salzberg 2010年). 使用SSPACE v3.0搭建contigs脚手架(Boetzer等人。2011)同时使用短插入库和MP库。使用AGOUTI v0.3.3完成脚手架的最后一步(Zhang等人。2016)使用C.augens公司从1KITE项目背景下产生的全身RNA-seq数据中重组原始读取(SRR921576)获得的转录本(网址:www.1kite.org; 上次访问时间为2019年5月9日)。筛选出小于1 kb的支架,除非它们与NCBI非冗余(nr)数据库中的条目存在显著的相似性(e值<1e−05)。为了评估组件的质量并监测组件质量的改善,使用BUSCO v3.0.2对每个步骤进行监测(Waterhouse等人。2018),使用节肢动物数据库9数据集。通过使用BWA将PE读数映射到组装,并使用TopHat将组装的转录本映射到基因组组装,进一步评估基因组组装的完整性和准确性(Trapnell等人。2009). 该全基因组鸟枪项目已于加入时存放在DDBJ/ENA/GenBankVUNT00000000。本文中描述的版本是VUNT01000000。孔雀使用NOVOPlasty v2.6.7分别组装线粒体基因组(Dierckxsens等人。2017),并使用MITOS进行注释(Bernt等人。2013). 有丝分裂基因组序列以登录号存放在GenBankMN481418号组件和其他信息,如短(<1 kb)脚手架,也可以从http://cegg.unige.ch/campodea_augens; 上次访问时间为2019年11月29日。

基因组注释

一种风俗C.augens公司repeat库是使用RepeatModeler和RepeatClassifier构建的(http://www.repeatmasker.org/; 上次访问时间为2019年11月29日)。物种特异性重复序列库和RepBase(Bao等人。2015)库(2017年3月2日更新)用于用RepeatMasker v4.0.7屏蔽基因组(http://www.repeatmasker.org; 上次访问时间为2019年11月29日)。使用MAKER管道v2.31.8执行自动注释(霍尔特和扬戴尔2011)在遮蔽的基因组支架上。使用从OrthoDB v9获得的八个节肢动物蛋白质组推断基于证据的基因结构注释(Zdobnov等人。2017),SwissProt数据库中的所有条目(Boutet等人。2016)、和C.augens公司通过重组来自全身RNA-seq数据的原始读取(SRR921576)获得的转录本。MAKER被设置为从所有证据(不仅是转录本)中推断基因模型,并且允许在没有转录证据的情况下进行基因预测。八月v3.2(斯坦克和摩根斯顿2005),使用从中获得的参数进行训练C.augens公司BUSCO鉴定的单拷贝基因(Seppey等人。2019),用于从头算基因预测。

这个C.augens公司基因组连同基因预测、原始读数和其他轨迹被载入阿波罗号(Lee等人。2013),用于可视化和手动策划感兴趣家族的基因模型。嵌合基因模型被分割成单个基因,错误分割的基因模型被连接,外显子-内含子边界被根据转录证据修正。这导致了23992个基因模型,它们被分配了从CAUGE_ 000001到CAUGE_023992的标识符(其中“CAUGE”代表Campodea AUGEns)使用InterProScan对预测的蛋白编码基因进行功能注释,以找到保守结构域。此外,根据Uniref50数据库搜索蛋白质(Suzek等人。2015)并在OrthoDB v10中群集(Kriventseva等人。2019)寻找守恒函数。

分配C.augens公司将预测的基因集与OrthoDB v10数据库中169个节肢动物的基因集进行聚类(Kriventseva等人。2019). 随后,基于371个共享的单拷贝基因进行了系统发育分析C.augens公司以及13种其他节肢动物,包括1)昆虫物种:雌蕊棘吸管(豌豆蚜虫),蜜蜂(蜜蜂),红萼(绑着的小妞),丛状达瑙斯(帝王蝶),黑腹果蝇(果蝇),人足类(体虱),以及栗Tribolium castaneum(红粉甲虫);2) 祖先无翼六足类的代表:Acerentomon公司sp.(锥头),短吻Catajapyx aquilonaris(北部钳尾),土壤污染对弹尾目(弹尾),朱子兰(弹尾);和3)两种非六足类物种:水蚤(水蚤)和马里蒂玛纹虫(蜈蚣)。Protura目没有可用的基因组,但由于该分类单元在我们的系统发育分析中至关重要,我们重新组装了Acerentomon公司从SRA(SRR921562)保存的原始读数中分离出的sp.,并将所得的组装物用作系统发育标记的来源。这个Acerentomon公司使用Trinity组装sp.转录组(Grabherr等人。2011)使用其默认参数。为了提取单拷贝基因并进行系统发育分析,我们遵循了Waterhouse等人。(2018)简单地说,MAFFT(Katoh和Standley 2013年)用于生成氨基酸序列的多序列比对,然后使用Trimal v1.2.59自动修剪比对(Capella-Gutiérrez等人。2009)和RAxML v8(Stamatakis 2014年)用于根据最大似然法推断系统发育树(补充说明,补充材料在线)。使用R包ggtree查看并注释生成的系统发育树(Yu等人。2017).

基因家族进化(扩张和收缩)

为了研究基因家族进化,我们首先使用基因家族进化计算分析(café)软件分析了基因家族的扩张和收缩(Han等人。2013)和OrthoDB群集(Kriventseva等人。2019). 此外,检测双氟醚之间基因家族的主要大小变化C.augens公司以及最近的六足类谱系,我们还比较了C.augens公司分析中包括了六种昆虫的平均基因数和中位数。将OrthoDB中节肢动物水平的聚类数据转换为CAFE输入文件,使用CAFE v4.1计算平均基因扩张/收缩率,并识别发生显著大小变化的基因家族(P(P)<0.01)。如前一节所述,用RAxML推断出分析所需的根系统发育树,不包括原核生物的数据Acerentomon公司尚未获得其基因组。使用r8s程序估计时间校准的系统发育(桑德森2003)使用从timetree.org检索的校准点(Kumar等人。2017)和来自Misof等人。(2014).CAFE使用默认值运行-计算了树上普通λ下以及弹尾目、双尾目、昆虫纲和非六足类物种在不同λ下的阈值和估计出生率(λ)和死亡率(μ)。

使用OrthoDB聚类,我们还鉴定了C.augens公司使用R中的双尾Fisher精确测试,昆虫(s.str.)的平均计数显著大于或小于-使用Benjamini和Hochberg方法对值进行顺序校正(本杰米尼和霍奇伯格1995)在R中,并且只有校正后的基因家族-值<0.01被认为是显著不同的。

我们通过进行整体蛋白质结构域分析来补充基因家族的分析。我们使用InterProScan分析了系统发育分析中所有13种节肢动物的蛋白质组(Jones等人。2014)并搜索已知的Pfam蛋白结构域,筛选出包含<75%相应Pfam隐马尔可夫模型(HMM)的条目。应用与上述相同的Fisher检验,我们在C.augens公司相对于昆虫种类的平均值。

内源病毒因子的鉴定及系统发育分析

孔雀提取出与病毒肽高度一致的序列,并用于筛选GenBank nr数据库特伯拉斯坦搜索。对假定的插入位点进行分析(即,位点和相应侧翼区域的原始读取覆盖率,周围区域中存在宿主基因,以及系统发育分析),以排除处理装配伪影的可能性。为了进行系统发育,假定内源性病毒元件的区域被翻译成氨基酸序列,并分别与从GenBank数据库检索到的正粘病毒聚合酶碱性蛋白1(PB1)的氨基酸序列对齐(补充表13,补充材料在线)。使用MAFFT生成对齐(Katoh和Standley 2013年)使用邻接连接方法和非参数bootstrap分析(1000个重复)构建系统发育树。生成的树在Evolview中进行了可视化和注释(He等人。2016).

感兴趣基因的深入分析

人工注释GR和IR家族中的化学受体基因。试图建立包括至少一半相关全长IRs编码区的所有模型,包括因基因组组装问题(序列缺口或单个Ns指示的组装错误)而截断的基因和假基因。孔雀IR是从Ir101开始的系列中命名的(Ir101-117共享一个内含子),以避免与D.黑腹果蝇这些基因以其细胞学位置命名,因此以Ir100a命名。TBLASTN搜索昆虫代表,如豆娘红萼(Ioanidis等人。2017),用于识别基因,不使用针对低复杂性区域的过滤器,单词大小为2,E值为1000。在阿波罗基因组浏览器中建立了GR和内含子IR的模型(Lee等人。2013)使用MAKER和RNA-seq的自动化模型提供支持。由于伪基因模型很难在Apollo浏览器中构建,因此大量无内含子IR模型及其许多伪基因都是在文本编辑器中构建的。使用ClustalX v2.0将编码蛋白与其他物种的代表进行比对(Larkin等人。2007),并根据这些路线优化模型。使用TrimAl v4.1修剪最终路线(Capella-Gutiérrez等人。2009)GR使用“gappyout”选项,IR使用“strictplus”选项,这两个选项的长度变化比GR大。该分析排除了两个早期分化昆虫目(Archaeoganaha和Zygentoma)中少数可用的部分GR序列(Missbach等人。2014). 不幸的是,这两个目的现有基因组草图过于零碎,无法可靠地注释它们的GR(Brand等人。2018)和GR只对Collembola的三个基因组草图中的一个进行了部分注释(Wu等人。2017). 鉴于双氟类与弹尾目和祖先无翅昆虫(即古颚类和颧类)之间的系统发育距离,将它们的GR包含在内不太可能改变我们对双氟类GR补体的评估。使用PhyML v3.0进行最大似然系统发育分析(Guindon等人。2010)使用软件的默认设置在PhyML Web服务器上(http://www.atgc-montpellier.fr/phyml网站/; 上次访问时间为2019年3月15日)。使用FigTree v1.4.2准备树木(http://tree.bio.ed.ac.uk/software/figtree/; 上次访问时间为2019年3月15日)。使用一组已知蛋白质和InterProScan结果,用TBLASTN在基因组组装上搜索Hox基因、光感受器和时钟基因。基因模型在Apollo浏览器中进行检查和管理。对于候选视蛋白C.augens公司使用16种参考视蛋白扫描基因集和全基因组(Hering和Mayer,2014年)分别使用BLASTP和TBLASTN,e值<1e−4的匹配物被保留为候选视蛋白。此外,为九个主要视蛋白分支(蛇蝎蛋白、脊椎动物c-视蛋白、翼状视蛋白、第4组视蛋白、节肢蛋白、黑视蛋白、非节肢动物r-视蛋白,节肢动物视觉视蛋白和甲状腺素)创建了HMM图谱(Hering等人。2012)用于扫描C.augens公司基因集。

结果和讨论

这个C.答乌根斯基因组

我们组装了双氟醚的基因组C、。奥根(图1;补充图1,补充材料在线)使用120 Gb Illumina PE读取数据,代表约100×基因组覆盖率,以及额外的90 Gb mate-pair读取(补充图2表1,补充材料在线)。推断的草图组件跨度为1.13 Gb,接近通过流式细胞术估计的1.2 Gb的基因组大小,表明大多数基因组可能存在于组件中(补充说明以及表2,补充材料在线)。BUSCO也证实了高度的完整性(Waterhouse等人。2018)详见下文。虽然许多六足类的基因组最近已经测序,但只有少数六足类来自祖先无翅的六足类:四种跳蚤(土壤污染对弹尾目,辛克塔兰花(Orchesela cincta)、多刺荷兰花(Holacanthela duospinosa)、和曲线Sinella curvesta) (Faddeeva-Vakhrusheva等人,2016年,2017;Wu等人。2017;Zhang等人。2019),其基因组已发表;和双氟醚(短吻Catajapyx aquilonaris)已在i5k倡议的背景下排序(https://i5k.nal.usda.gov/; 上次访问时间为2019年11月29日)。目前,还没有蛋白质的测序基因组。

-Campodea的侧视图和背视图变大。
. 1.

-侧视图和背视图孔雀.

表1

与解毒酶相关的蛋白Pfam结构域计数孔雀和12个其他节肢动物

弹尾目动物
双氟拉
昆虫纲
基因家族pfamID斯马尔德普Fcan公司奥辛卡库增三和弦Cspl公司阿皮斯艾梅尔Tcas公司Dple公司德梅尔
ABC运输车PF00005型747014011359229531263951776056
PF00664型28165044225623311216422822
PF06472型5222222
羧酸酯酶(CCE)PF00135型21401201103214747482226515735
细胞色素P450(CYP)PF00067型487521426071202908239461257389
谷胱甘肽S-转移酶(GST)PF00043型466472581974221325
PF02798型618523252211126612915
PF13417型4811951851765221424
UDP糖基转移酶(UGT)PF00201型1624515781041872412403635
总计204260647632212808258409137168393292303
弹尾目动物
双氟拉
昆虫纲
基因家族pfamID斯马尔德普Fcan公司奥辛卡库增三和弦Cspl公司阿皮斯艾梅尔Tcas公司Dple公司德梅尔
ABC运输车PF00005型747014011359229531263951776056
PF00664型28165044225623311216422822
PF06472型5222222
羧酸酯酶(CCE)PF00135型21401201103214747482226515735
细胞色素P450(CYP)PF00067型487521426071202908239461257389
谷胱甘肽S-转移酶(GST)PF00043型466472581974221325
PF02798型618523252211126612915
PF13417型4811951851765221424
UDP糖基转移酶(UGT)PF00201型1624515781041872412403635
总计204260647632212808258409137168393292303

德梅尔,黑腹果蝇; 深蓝色,丛状达瑙斯; Tcas、,栗Tribolium castaneum; 阿梅尔,蜜蜂; 弗姆,人足类; 阿皮斯,雌蕊棘吸管; 堵头,孔雀; Cspl、,红萼; 卡曲,短吻Catajapyx aquilonaris; Fcan,土壤污染对弹尾目; 奥辛,朱子兰; 德普,水蚤; 斯马尔,马里蒂玛纹虫.

表1

与解毒酶相关的蛋白Pfam结构域计数孔雀和12个其他节肢动物

弹尾目动物
双氟拉
昆虫纲
基因家族pfamID斯马尔德普Fcan公司奥辛卡库增三和弦Cspl公司阿皮斯艾梅尔Tcas公司Dple公司德梅尔
ABC运输车PF00005型747014011359229531263951776056
PF00664型28165044225623311216422822
PF06472型5222222
羧酸酯酶(CCE)PF00135型21401201103214747482226515735
细胞色素P450(CYP)PF00067型487521426071202908239461257389
谷胱甘肽S-转移酶(GST)PF00043型466472581974221325
PF02798型618523252211126612915
PF13417型4811951851765221424
UDP糖基转移酶(UGT)PF00201型1624515781041872412403635
总计204260647632212808258409137168393292303
弹尾目动物
双氟拉
昆虫纲
基因家族pfamID斯马尔德普Fcan公司奥辛卡库增三和弦Cspl公司阿皮斯艾梅尔Tcas公司Dple公司德梅尔
ABC运输车PF00005型747014011359229531263951776056
PF00664型28165044225623311216422822
PF06472型5222222
羧酸酯酶(CCE)PF00135型21401201103214747482226515735
细胞色素P450(CYP)PF00067型487521426071202908239461257389
谷胱甘肽S-转移酶(GST)PF00043型466472581974221325
PF02798型618523252211126612915
PF13417型4811951851765221424
UDP糖基转移酶(UGT)PF00201型1624515781041872412403635
总计204260647632212808258409137168393292303

德梅尔,黑腹果蝇; 深蓝色,丛状达瑙斯; Tcas、,栗Tribolium castaneum; 阿梅尔,蜜蜂; 弗姆,人足类; 阿皮斯,雌蕊棘吸管; 堵头,孔雀; Cspl、,红萼; 卡曲,短吻Catajapyx aquilonaris; Fcan,土壤污染对弹尾目; 奥辛,朱子兰; 德普,水蚤; 斯马尔,马里蒂玛纹虫.

祖先无翅六足类的基因组很难测序,因为它们通常很大(如C.augens公司)因为许多物种通常很难饲养。因此,几乎不可能减少自然杂合度(例如通过近亲繁殖实验),这可能会影响基因组组装工作(理查兹和穆拉利2015). 我们的C.augens公司组件比的组件大得多无鞭毛梭菌(312 Mb)和四个弹簧头(221–381 Mb)(补充图3和t表2,补充材料在线)。大基因组C.augens公司很可能是由重复序列的增殖所解释的,重复序列占总序列的~46%(补充表3,补充材料在线)。大多数重复序列都是未分类的,占总序列的33%(376 Mb)。在所识别的重复元素中小时自动变速器超家族是最丰富的DNA转座子,占基因组序列的5.9%(补充表3,补充材料在线)。高水平重复对基因组组装提出了挑战,导致共有18765个支架含有N50连续骨和支架的值分别为33 kb和235 kb(补充图3和t表2,补充材料在线)。的注释基因集C.augens公司包含23978个预测蛋白编码基因,数量超过无鞭毛梭菌然而,它与F.念珠菌(22100)和辛克塔乳酪(20,247) (补充表4,补充材料在线)。超过90%的基因模型得到了C.augens公司抄本。大约74%的预测蛋白质与Uniref50数据库中的现有条目显示出显著的氨基酸相似性(BLASTP e值<1e−10),而~95%的蛋白质包含InterProScan指定的域,为注释的准确性提供了很高的置信度。使用基准通用单拷贝正射影像(BUSCO)进行评估(Waterhouse等人。2018)在1066个预期在节肢动物中保存的BUSCO中,鉴定出97.0-97.6%(90.4-91.8%)的BUSCOs,表明组装和基因模型的高度完整性(补充图4和表5,补充材料在线)。基因集的完整性还可以通过成功鉴定所有霍克斯已知基因F.念珠菌(实验室,hox3,pb,ftz,src,dfd,antp,ubx,abd-A、和阿卜杜勒-B). C.augens公司然而,这些基因分布在五个支架上(补充图5,补充材料在线),跨度超过1Mb。

每个基因的内含子/外显子数量和外显子长度C.augens公司无鞭毛梭菌还有那些跳蚤(补充表4,补充材料在线)。然而,基因模型的中位数C.augens公司大约是中的四倍长无鞭毛梭菌比跳蚤长三到五倍(补充表4和图6,补充材料在线)。这主要是由于C.augens公司(图2;补充表4图6,补充材料在线)。事实上,内含子显著跨越了27%的C.augens公司基因组,总计306 Mb,相当于整个基因组的大小无鞭毛梭菌基因组.有人提出,较长的内含子与代谢成本增加有关(维诺格拉多夫1999),所以对长内含子的强烈选择是意料之中的。各种因素可能促进了大内含子在C.augens公司从漂移到低全基因组重组率,还有待研究.C组之间基因含量、基因组大小和内含子大小的差异.奥根无鞭毛梭菌这表明这两个双氟醚基因组彼此之间有很大的差异,可能是通过在C.augens公司.

-普通Campodea augens和其他13种节肢动物的物种系统发育、亲缘关系、基因家族扩张/收缩和内含子长度分布。(a) 14种节肢动物的系统发育基因组树,包括祖先无翼六足类:2个双足目、2个弹尾目和1个前足目(前足目的数据来自转录组)。以蜈蚣(Strigamia maritima)为外群,根据371个单拷贝同源序列的对齐蛋白序列估计最大似然系统发育。分支长度表示每个站点的替换。节点上的黑色圆圈表示引导支持>0.95。Dmel,果蝇(果蝇);Dple,Danaus plexippus(帝王蝶);Tcas、赤拟谷盗(Tribolium castaneum);Amel,Apis mellifera(蜜蜂);Phum,Pediculus humanus(体虱);豌豆蚜;Cspl,Calopteryx splendens(带状蠕形螨);Caqu,Catajapyx aquilonaris(北部钳尾);Acer,Acerentomon sp.(锥头);念珠菌(弹尾);Ocin、Orchesella cincta(弹尾);水蚤;Smar,Strigamia mari tima(蜈蚣)。(b) 横线:按物种分类的总基因数,分为以下类别:所有13个物种或除一个物种外的所有物种中的单拷贝直系同源基因,除一个允许基因复制的物种外,所有物种中都存在单拷贝直属同源基因,谱系特异性直系同源(六足目、“昆虫纲”、弹尾目、双盲目和昆虫纲),基因仅存在于1个物种中(其他物种中不存在),具有所有其他直系亲属关系的基因,且没有可识别的直系亲属;饼图:使用CAFE估算的物种特定基因家族扩张(黄色)、收缩(橙色)和稳定基因家族(灰色)的比例(这些比例包括非显著扩张/收缩的数量,详见文本和补充图8,在线补充材料)。(c) 系统发育中相应物种内含子长度分布的小提琴图。垂直条对应于中位数、下限和上限四分位数。轮廓图像来自PhyloPic(http://phylopic.org; 上次访问时间为2019年3月10日)。除Maxime Dahirel的Calopteryx splendens外,其余均为公共领域;Birgit Lang创作的Protura、Orchesella springtail和Strigamia蜈蚣;所有许可均根据Creative Commons Attribution 3.0 Unported许可(http://creativecommons.org/licenses/by/3.0/; 上次访问时间:2019年3月10日);Joseph Hughes根据Creative Commons Attribution Non-Commercial-ShareAlike 3.0 Unported许可证授权的Acyrthosipha pisum(https://creativecommons.org/licenses/by-nc-sa/3.0/; 上次访问时间为2019年3月10日)。
. 2.

-物种系统发育、亲缘关系、基因家族扩张/收缩和内含子长度分布孔雀以及其他13种节肢动物。()14种节肢动物的系统进化树,包括祖先无翅的六足类:2个双氟类、2个弹尾类和1个原尾类(原尾类的数据来自转录组)。利用蜈蚣、,马里蒂玛纹虫作为外群体。分支长度表示每个站点的替换。节点上的黑色圆圈表示引导支持>0.95。德梅尔,黑腹果蝇(果蝇);深蓝色,丛状达瑙斯(帝王蝶);Tcas、,栗Tribolium castaneum(红粉甲虫);阿梅尔,蜜蜂(蜜蜂);弗姆,人足类(体虱);阿皮斯,雌蕊棘吸管豌豆蚜;Cspl、,红萼(绑着的小妞);卡曲,短吻Catajapyx aquilonaris(北部钳尾);宏碁,Acerentomon公司sp.(锥头);Fcan,土壤污染对弹尾目(弹尾);奥辛,朱子兰(弹尾);德普,水蚤(水蚤);斯马尔,马利提马纹虫(蜈蚣)。(b条)横线:按物种分类的总基因数,分为以下类别:所有13个物种或除一个物种外的所有物种中的单拷贝直系同源基因,除一个允许基因复制的物种外,所有物种中都存在单拷贝直属同源基因,谱系特异性直系同源(六足目、“昆虫纲”、弹尾目、双盲目和昆虫纲),基因仅存在于1个物种中(其他物种中不存在),具有所有其他直系亲属关系的基因,且没有可识别的直系亲属;饼图:使用CAFE估算的物种特定基因家族扩张(黄色)、收缩(橙色)和稳定基因家族(灰色)的比例(这些比例包括非显著扩张/收缩的数量,见正文和补充图8,补充材料在线了解更多详细信息)。(c(c))系统发育中相应物种内含子长度分布的小提琴图。垂直条对应于中位数、下限和上限四分位数。轮廓图像来自PhyloPic(http://phylopic.org; 上次访问时间为2019年3月10日)。除以下内容外,所有内容均为公共领域:红萼马克西姆·达希尔(Maxime Dahirel);普罗图拉,兰花属弹尾,以及纹状体比吉特·朗的蜈蚣;所有许可均根据Creative Commons Attribution 3.0 Unported许可(http://creativecommons.org/licenses/by/3.0/; 上次访问时间:2019年3月10日);雌蕊棘吸管由Joseph Hughes根据Creative Commons Attribution Non-Commercial-ShareAlike 3.0 Unported许可证授权(https://creativecommons.org/licenses/by-nc-sa/3.0/; 上次访问时间为2019年3月10日)。

系统发育学和正畸学

虽然六足类的单系性现在得到了很好的支持(格里马尔迪2010;Sasaki等人。2013;Misof等人。2014)关于Protura、Collembola和Diplura(传统上被归为“Entognatha”)之间的关系以及它们相对于外颚六足类(昆虫纲)的位置一直存在很大争议。关于双蚤的系统发育位置,存在以下假设:1)双蚤是原蚤和弹尾蚤的姊妹群(Entognatha假设)(von Reumont等人。2009); 2) 双lura是Protura的姐妹群(无眼类假说)(Luan等人。2005;Meusemann等人。2010;安德鲁2011); 和3)作为昆虫纲姊妹类群的双盲蝽不锈钢。(库卡洛娃-佩克1998;Misof等人。2014)“Entognatha”是泛型。尽管双氟醚类化石记录很差,但已知最古老的化石来自巴西下白垩统沉积物(Wilson和Martill 2001年),它们可能起源于早泥盆世(Misof等人。2014). 利用14种节肢动物的358个串联单拷贝蛋白编码基因的超矩阵进行系统发育分析,支持“昆虫门”是泛系的观点,双盲蝽代表昆虫门的姐妹类群(图2a). 这一结果与以前分析系统发育数据的系统发育研究一致(Misof等人。2014),Sanger测序的核编码蛋白编码基因(Regier等人。2004)或研究化石(库卡洛娃-佩克1987),形态学(Giribet等人。2004),和比较胚胎学(池田和马奇达2001;Tomizuka和Machida 2015)证据。然而,需要对弹尾目、双盲目和原虫的基因组进行更广泛的采样,以提高推断的系统发育关系的可信度。

通过聚类分析基因同源性的结果C.augens公司其他169种节肢动物的基因集可从OrthoDB v10获得(Kriventseva等人。2019) (https://www.orthodb.org/; 上次访问时间为2019年11月29日)。分析确定的19063整套OGC.augens公司在OrthoDB中包含的至少一个其他节肢动物基因组中具有同源基因的基因。其中,17871个基因在研究中的12个基因组中至少有一个具有同源性图2相反,4929C.augens公司基因与其他节肢动物的基因没有可识别的亲缘关系(仅考虑物种时,还有6121个基因图2)这两种跳蚤的情况也类似。这些预测基因的中位蛋白质长度为209个氨基酸,其中一些可能是基因片段。总共有3008个和3896个蛋白质至少命中了一个PFAM结构域,并且至少命中了其他分类蛋白质中的另一个蛋白质C.augens公司蛋白质组(e值<1e−05)。需要对其他祖先无翼六足类和密切相关的外类群(如雷米足类)的基因组进行测序,以揭示这些基因中哪些部分确实是独特的C.augens公司或者说它们是否在节肢动物的历史上进化得更早。

基因家族进化

为了详细研究无翼六足类祖先基因库中最显著的变化,我们使用CAFE方法模拟了基因家族的进化动力学(Han等人。2013). 我们检测到显著(P(P)<0.01)导致双氟拉(19次扩张,0次收缩)和弹尾线虫(45次扩张,7次收缩)的两个分支上OG的基因拷贝数变化(补充图8和t表8,补充材料在线)。祖先无翼六足类中物种特有的显著扩张和收缩的数量各不相同(F.念珠菌:+49/−12;辛克塔乳酪: +28/−9;无鞭毛梭菌:+6/−30),带C.augens公司显示最大数量的扩张和最小数量的收缩(+90/−1)(图2b). 在扩大的基因家族中C.augens公司有化学感受器家族,特别是味觉(GR)和离子感受器(IR)。下文对这些基因进行了详细分析,其中我们报告了IR基因家族的大规模扩张,占整个基因集内容的约8%。CAFE检测到的其他扩展基因家族参与解毒和糖代谢/转运,这可能与C.augens公司以及在凋亡中,这可能在细胞的高再生能力中起作用C.augens公司(补充表8、9和图9,补充材料在线)。

基因库C.augens公司反映了祖先外部感光器官的继发性缺失

双氟醚缺乏外眼和单眼可能是在黑暗土壤环境中无功能组织退化过程的结果。无眼跳蚤F.念珠菌检测紫外线和白光(Fox等人。2007;Gallardo Ruiz等人。2017),并且假设F.念珠菌由非视觉光感受器介导(Fox等人。2007). Campodeids也会避开光线,并可能在其身体表面感应光线(乔治1963)有薄而弱硬化的角质层。内部感光细胞或细胞器的类似机制可能适用于C.augens公司这种光敏性可能足以满足需要光感知但不需要空间光分辨率的生物体。然而,不能排除其他环境触发因素,如气温或相对湿度,在观察到的C.augens公司(乔治1963). 我们搜索了C.augens公司已知光感受器基因的基因集,如视蛋白,与分子发色团复合体对特定波长的光敏感。虽然我们发现了149个G蛋白偶联受体视紫红质样结构域(Pfam PF00001),但相应的蛋白均不属于视紫红蛋白亚家族。使用已知视蛋白的剖面HMM和基因组的TBLASTN搜索,我们发现了两个对紫外线敏感视蛋白最敏感的推测视蛋白片段。一个片段包含视蛋白视网膜结合位点(原生质体标识符:PS00238)。视蛋白片段是否是功能基因的一部分,并在报道的双氟醚避光行为中发挥作用,有待进一步研究。在苍蝇中,Gr28b受体组包括一些与光热感知有关的受体(Xiang等人。2010;Ni等人。2013)在缺乏功能性视蛋白的情况下,这些GR的亲缘可能会赋予坎波迪亚和其他二氟醚。我们没有在以下基因组中确定DmGr28a/b谱系的明确亲属:C.augens公司无鞭毛梭菌(图3)然而,其他GR也可能在双氟醚中进化出这种功能。此外,我们没有发现DNA光解酶,它可以修复紫外线引起的DNA损伤(补充表10,补充材料或隐色素蛋白,它们是节肢动物中央昼夜节律钟的组成部分。蜈蚣中未发现DNA光解酶或隐色素马里蒂玛纹虫(Chipman等人。2014)并且似乎也不存在于双氟醚中无鞭毛梭菌和跳蚤F.念珠菌三个都是无眼的。有趣的是,跳蚤辛克塔乳酪具有简单的眼睛,具有DNA光解酶(补充表10,补充材料在线)。因此,隐花色素和DNA光解酶的丢失似乎是具有地下生活方式的盲人节肢动物的常见特征。由于光感受器基因的缺乏C.augens公司因此,在基因组水平上反映了祖先外部感光器官的继发性丢失。隐花色素的缺乏也使人们对经典昼夜节律时钟系统的存在产生了质疑,该系统在大多数生物体中调节各种行为、生物化学和生理功能,并由光调节。搜索节肢动物昼夜节律钟的主要调节反馈回路的组成部分(例如。,时钟,周期,时差,周期、和永恒的)只显示了的部分同源永恒的时钟.隐色素和其他已知生物钟基因的缺失,如周期,时差、和周期可能表明C.augens公司没有保持典型的昼夜节律,因此可能主要保留了方向和栖息地选择的光敏感性。

-Campodea扩大了GRs与其他昆虫代表的系统发育关系。根据糖和二氧化碳受体分支在整个动物GR/GRL家族树木中的位置,将其定义为外群(Robertson,2015年)。主要亚科或世系以颜色突出显示,并在圆圈外指示。Campodea augens GR为蓝色。其他昆虫的代表性GR包括豆娘C.splendens(Cspl,紫色)(Ioanidis等人,2017年)、湿木白蚁Z.nevadensis(Znev,棕色)(Terrapon等人,2014年)和选定的黑色内翅目。比例尺表示每个站点的替换,节点上填充圆的大小表示从PhyML v3.0到1的近似似然比测试(aLRT)。
第3条。

-孔雀具有其他昆虫代表的GR。糖和二氧化碳受体分支根据其在整个动物GR/GRL家族树木中的位置被定义为外群(罗伯逊2015). 主要亚科或世系以颜色突出显示,并在圆圈外指示。孔雀GR为蓝色。其他昆虫的代表性GR包括豆娘C.芨芨(Cspl,紫色)(Ioanidis等人。2017)、湿木白蚁内华达州(Znev,棕色)(Terrapon等人。2014)和选定的黑色内孢子。比例尺表示每个站点的替换,节点上填充圆的大小表示从PhyML v3.0到1的近似似然比测试(aLRT)。

GR和IR家族的大规模扩张可能会弥补失明

触角是昆虫最重要的嗅觉器官之一C.augens公司拥有一对长长的肌腱(珠状)触角,触角包含从头部突出的肌肉,两侧均有神经支配,可以控制触角的运动(Böhm等人。2012). 在中枢神经系统中,C.augens公司有两个蘑菇体和两种不同类型的嗅觉肾小球:四到五个大而细长的腹侧肾小球和一组小的球状背侧肾小球(Böhm等人。2012)由触角支配。这些解剖特征表明,双盲蝽具有高级嗅觉系统(Böhm等人。2012). 事实上,由于失明,双氟醚C.augens公司它们必须在很大程度上依赖嗅觉、味觉和触觉来适应环境,这体现在它们在四处走动时不断使用长触角。鉴于双盲蝽可能与昆虫有姊妹类群关系,它是理解昆虫化学感受系统进化起源的关键分类单元。然而,对双氟拉的基因组化学感觉便利性的研究很少。Brand等人。(2018)注意到双氟醚的基因组测序无鞭毛梭菌不含气味受体(OR)基因家族成员。我们同样无法在C.augens公司基因组。此外,在三个跳虫基因组中没有OR(Wu等人。2017),这一观察结果通过以下方面证实了结论Brand等人。(2018)OR基因家族是在昆虫的茎谱系中进化而来的。相反,CAFE和结构域分析所强调的GR和IR基因家族的人工管理确定了一个由41个GR组成的中等规模家族和一个由2431个IR组成的庞大家族。这种庞大的化学感受基因库可能提供C.augens公司具有复杂的化学传感系统。其中7个GR是明显的假基因,几个基因片段表明存在额外的假基因残留物。节肢动物GR中最显著的亚家族是糖受体,糖受体也存在于甲壳动物中,例如水蚤(Peñalva-Arana等人。2009)和阿兹特卡海莱拉(Poynton等人。2018)和二氧化碳受体(及其亲属),它们在早期不同的昆虫谱系中发现,如蜻蜓(Ioanidis等人。2017;罗伯逊2019).坎波迪亚奥根有13个候选糖受体与该亚科昆虫代表聚集(图3)并在第七跨膜结构域中保守的TYhhhhh hQF基序的TY之后立即共享谷氨酸(其中h通常是疏水性氨基酸)。相反,没有证据表明存在二氧化碳受体亚家族或果糖受体的独特谱系,这两种受体都存在于昆虫基因组中(图3). 其余28个GR聚集在一起,在昆虫中没有近亲,类比昆虫的GR可能包括各种“苦味”植物化合物和表皮碳氢化合物的受体(罗伯逊2019). 巨大的2431套C.augens公司IR包含3个保守共受体中的每一个的代表,以它们的名字命名黑腹果蝇直向同源物(Ir8a、25a和76b),重复导致Ir25a的四个拷贝(旁系同源物)(我们还检测到可能第五个拷贝的片段)。大多数昆虫都有一组额外的单拷贝IR(Ir21a、40a、68a和93a)参与温度和湿度的感知(Knecht等人。2017),但只有Ir93a在C.augens公司有趣的是,Ir93a也是这四种IR中唯一一种在其他几种节肢动物群中被鉴定出来的,如蜱、螨、蜈蚣和甲壳动物(罗伯逊2019). 然而,桡足类仿射优藻似乎编码了Ir21的远亲(Eyun等人。2017;Poynton等人。2018)这意味着Ir21a已经存在于六足类的茎群中,并且很可能已经从C.augens公司和其他节肢动物。昆虫中广泛存在的其他IR谱系没有亲缘关系,例如,Ir75谱系参与对多种酸的感知(Prieto Godino等人。2017),似乎出现在C.augens公司基因组(图4;补充图10,补充材料在线)。另一方面,我们发现2424个主要为无内含子的IR基因异常扩增,命名为Ir101到Ir2525,其中901个为假基因(定义为编码至少50%长度的相关IR,存在无数额外的短基因片段)。这些基因中的绝大多数在编码区是无内含子的,然而,有几个谱系有一个或两个内含子干扰编码区,所有这些基因显然都是从无内含子祖先那里独立获得的,这是以前在一些昆虫中观察到的,例如蟑螂德国蟑螂(Robertson等人。2018)其中IR系列的扩展明显代表了一个独立于C.augens公司因此,Ir101-118有一个第2期内含子,大约位于编码区的三分之一,尽管其中一些内含子的第一外显子没有分化。这些IRs的分歧亚家族是通过TBLASTN搜索中的弱匹配发现的,因此只有在迭代搜索过程接近尾声时才检测到额外的含有内含子的基因(因为当编码区被内含子分裂时,匹配较弱)。因此,Ir2291–2334也有大约三分之一的第二阶段内含子。Ir2335-2371和Ir2372-2413在编码区中部附近有一个0相内含子,但大约三分之一的位置不同。最后,Ir2497–2523有一个0期内含子,然后是2期内含子。所有这六个内含子不仅处于两个不同的阶段,而且在编码序列中位于不同的位置,如所示补充图10,补充材料在线上,每一个都是在一个不同的基因谱系中,所以这六个内含子是独立获得的,有些令人惊讶的是,它们从未从这些谱系中的任何基因中丢失过。这些IR基因表现出许多高度扩展的基因家族所共有的特征,如其他动物中的化学受体,包括一些大型阵列,尽管通常在两条链上都有基因,这意味着由不平等交叉造成的复制导致的原始串联定向发生了相当大的短程反转。偶尔,人们会注意到一种复杂的模式,在这种模式中,几个支架中有可比的套件,而这些套件中的基因原本是远缘相关的,这表明片段复制也在这个基因家族的扩展中起了作用,因此也在基因组中起到了作用。然而,大量的基因以单子形式存在于支架中,或者在大型支架中远离其他基因,所以在这个基因组中存在着巨大的基因组流动,甚至单个基因也在流动。这些无内含子和发散的IRs由许多基因谱系扩展组成,如短枝所示,其中许多是最近的,并且充满假基因和片段,表明IRs在C.augens公司(图4;补充图10,补充材料在线)。大基因家族通常有许多假基因,实际上至少901个(37%)是假基因,如上所述,有无数明显的假基因片段。这接近节肢动物中化学受体假基因百分比的顶端(罗伯逊2019),但少于某些哺乳动物,超过50%的假基因很常见(Niimura 2014年). 这些假基因分布在整个家族中(补充图S10,补充材料尽管有一种趋势,即最高度和最近扩展的谱系具有最高频率的假基因,例如,在这个循环树的下半部分。这在树上很明显,因为这些假基因名称的末尾有一个P,使得它们比相关的完整基因名称长。记录每个假基因的明显假基因突变数量(终止密码子、移码和大缺失)和直方图(补充图11,补充材料在线)揭示了大多数都有单一突变,这是以前蟑螂IRs的一种模式(Robertson等人。2018)与最近基因谱系扩展中大多数假基因的年轻性一致。据推测,大多数较老的假基因最终也会遭受重大缺失,从而减少到观察到的无数片段。

-Campodea augens IR家族的系统发育树。(a) 根据Ir8a和25a谱系在大树中的基本位置,包括IRs进化所依赖的离子型谷氨酸受体,将其宣布为外群,从而使该树生根。蓝色三角形代表C.augens IR家族的大规模扩张。除了五个具有特殊获得内含子的谱系外,这2424个IR中的大多数都是无内含子的(详见补充图10,在线补充资料)。红锥虫(Caug)蛋白质为蓝色,红锥虫中具有直系同源基因的七个保守IR的果蝇黑腹果蝇(Dmel)蛋白质以及Ir75分支为黑色,而巨萼(Cspl)蛋白质为紫色。四个保守的血统用黑条标记。Campodea增强红外共感受器标有一颗星。比例尺指示每个站点的替换。灰色圆圈表示近似似然比测试(aLRT)>0.75的节点。(b) 表中显示了具有最大IRs库的动物物种。迄今为止,孔雀拥有动物中已知的最大的IR家族。轮廓图像来自PhyloPic(http://phylopic.org; 上次访问时间为2019年3月10日)。所有这些都属于公共领域。
. 4.

-的系统发生树孔雀IR系列。()根据Ir8a和25a谱系在大树中的基本位置,包括IRs进化所依赖的离子型谷氨酸受体,将其宣布为外群,从而使该树生根。蓝色三角形表示C.augens公司IR系列。除了五个具有特殊获得内含子的谱系外(参见补充图10,补充材料在线获取详细信息)。这个C.augens公司(Caug)蛋白质为蓝色黑腹果蝇7个保守IRs的(Dmel)蛋白C.augens公司以及Ir75分支都是黑色的,而红萼(Cspl)蛋白呈紫色。四个保守的血统用黑条标记。孔雀红外共感受器上有一颗星星。比例尺指示每个站点的替换。灰色圆圈表示近似似然比测试(aLRT)>0.75的节点。(b条)表中显示了具有最大IR库的动物物种。孔雀拥有迄今为止已知动物中最大的IR家族。轮廓图像来自PhyloPic(http://phylopic.org; 上次访问时间为2019年3月10日)。所有这些都属于公共领域。

共有2472个化学受体基因,与某些哺乳动物中的最大数量相比,如奶牛中的2294个ORs、马中的2658个ORs和大象中的4267个ORs(Niimura 2014年),尽管这些计数不包括其犁鼻或味觉受体,并且远大于其他节肢动物中已知的任何化学受体库,但迄今为止,蜘蛛螨中最高的两个是825荨麻疹叶螨(Ngoc等人。2016)和1576英寸德国双歧杆菌(Robertson等人。2018). IR家族的这种显著扩展甚至超过了640和897只蟑螂的基因组(Li等人。2018;Robertson等人。2018)使其成为动物中已知的最大IR家族。该基因组中化学受体IR家族的大规模扩张可能反映了这种双氟醚对其嗅觉和味觉的化学感觉的依赖性。

外源性脱毒和凋亡相关基因家族的扩展

对基因集的分析表明C.augens公司在被检测的13种物种中,拥有与解毒相关的最大一组酶(808个基因),包括主要六足目的代表(表1). 这些家族被发现是扩展的,包括ATP结合盒转运蛋白(ABC转运蛋白)、羧酸酯酶(CE)、细胞色素P450(CYPs)、UDP葡糖醛酸基/葡糖基转移酶(UGTs)和谷胱甘肽S-转移酶(GSTs)(补充表8和9,补充材料在线)。孔雀拥有最大的ABC转运蛋白组,总计290个,因此是水螅虫中第二大ABC转运蛋白的1.5倍F.念珠菌(共193个)。同样,羧酸酯酶在C.augens公司(147)蛇蝎的剧目几乎和蛇蝎一样多(F.念珠菌,120个基因;辛克塔乳酪,110个基因)。细胞色素P450结构域C.augens公司(共202只)数量与跳蚤相似(F.念珠菌, 214;辛克塔乳酪,260),但它们比所有其他被检测的节肢动物都要高。GST计数在其他物种中观察到的范围内,而UGT在C.augens公司(共104例),是弹尾目动物(分别为51例和57例)的两倍,是密切相关的双氟醚的10倍无鞭毛梭菌(共8个)。其中一些基因聚集在C.augens公司例如,基因组在scaffold_1992上由5个P450和4个GST组成,在scaffeld_1829上由6个UGT组成(补充图11,补充材料在线)。假设两个跳蚤(Faddeeva-Vakhrusheva等人。2016,2017),解毒酶的大量储备C.augens公司可能反映了对土壤环境的适应。解毒基因在无鞭毛梭菌(共212只),也生活在土壤中,可能反映了它的取食行为,这与C.augens公司。尽管C.augens公司这两种跳蚤是草食性或有害性的,无鞭毛梭菌是一种捕食者,以小型节肢动物为食。因此,无鞭毛梭菌可能没有与之相同的排毒需求C.augens公司后者可能需要处理摄入持久存在于腐烂有机物中的外来化合物,如植物抗草食毒素、木质纤维素副产品和喂食威慑剂。

与其他六足类动物相比,双氟龙具有非凡的能力,能够在一系列蜕皮过程中再生丢失的附肢(触角、尾鳍和腿),甚至在成年时也是如此(劳伦斯1953;孔德1955;Maruzzo等人。2005;Whalen和Sampedro 2010;Tyagi and Veer 2016年). 迄今为止,尚未对促进这些适应的遗传便利性进行调查。然而,与组织再生能力相关的候选基因已经在模型生物中进行了研究(Bergmann和Steller,2010年). 例如,半胱氨酸天冬氨酸蛋白酶是参与程序性细胞死亡的蛋白酶,在一些动物模型中也在组织再生和分化中发挥作用(Bergmann和Steller,2010年;太阳和欧文2014),包括D.黑腹果蝇再生组织中检测到凋亡和caspase活性(Boland等人。2013;Shalini等人。2015). C.augens公司,我们鉴定了caspase基因家族、C型凝集素样蛋白和凋亡抑制蛋白的扩增,这些蛋白可以结合并抑制caspase和其他参与凋亡的蛋白。特别是,我们在C.augens公司(35种蛋白质),而在其他12种考虑中的节肢动物中,计数范围为4个丛枝D.丛枝至18英寸D.普勒斯(补充表11,补充材料在线)。与凋亡和再生相关的基因家族的扩张是否确实与细胞的高再生潜能有关C.augens公司需要进一步的实验评估。再生组织中的转录组学和蛋白质组学研究可能有助于解释这些观察到的基因组模式。

人类基因组中的内源性病毒成分C.augens公司

我们在C.augens公司与Quaranjavirus属的病毒序列相似,与武汉路易斯蝇病毒3、武汉蚊子病毒3和5、双澳昆虫病毒4和Wellfleet Bay病毒的相似性最高(补充表12,补充材料在线)。夸兰贾病毒属于正粘病毒科,是一种分段阴性单链RNA病毒(-ssRNA)家族,也包括流感病毒(Presti等人。2009). 发现的所有类quaranjavirus插入物C.augens公司编码PB1蛋白(聚合酶碱性蛋白1)(补充表12,补充材料在线),RNA依赖性RNA聚合酶(RdRp)的一个亚单位,在正粘病毒科中,该亚单位通常是异源三聚体复合物(由PA、PB1和PB2蛋白形成)(Stubbs and te Velthuis 2014年)与来自其他RNA病毒(例如,双链和阳性标记RNA病毒)的RdRps相反,这些病毒通常是单体的(Wolf等人。2018). 然而,PB1蛋白相应的开放阅读框是不完整的,并且包含终止密码子和/或移码突变(补充Fasta,补充材料在线),表明这些元素不起作用。正如在图5以及补充图13和14,补充材料在网上,推测的病毒插入与节肢动物样本中通过宏基因组RNA测序鉴定出的一簇夸兰贾病毒更为密切相关(Li等人。2015)而不是其他夸兰贾病毒(例如,约翰斯顿环礁夸兰贾病毒和夸兰菲尔夸兰贾文病毒)(补充表12,补充材料在线)。此前在黑卵蜱的基因组中只描述过一例类夸氏病毒插入(Katzourakis和Gifford 2010). 然而,该序列与约翰斯顿环礁夸兰贾病毒的序列关系更密切,编码不同的病毒蛋白(补充图14,补充材料在线)。原粘病毒样NIRV的存在C.augens公司特别令人感兴趣的是,正粘病毒科包括流感病毒。最近的研究表明节肢动物在病毒物种的起源和进化中起着重要作用(Li等人。2015;杜达斯和奥巴德2015;Shi等人。2016)和NIRV有助于研究病毒与宿主的相互作用(Aswad和Katzourakis 2016;Olson和Bonizzoni 2017)并了解病毒的长期进化。

-螺旋锥虫基因组中与正粘病毒科-ssRNA病毒相关的假定内源性病毒成分的系统发育关系。在普通梭菌中发现的所有内源性病毒元件对应于原粘病毒聚合酶碱性蛋白1(PB1)(Pfam Id PF00602;“Flu_PB1”)(另请参见补充图12和13,在线补充材料)。使用正粘病毒科代表性EVE和BP1蛋白的氨基酸序列构建邻接树。使用1000个伪复制来评估对树的支持。节点值对应于引导支持。比例尺表示每个位点的氨基酸替换。绿色方框突出显示Quaranjavirus属的病毒,而浅蓝色方框表示Thogoto病毒属。
. 5.

-推测内源性病毒元件的系统发育关系孔雀与正粘病毒科的ssRNA病毒相关的基因组。发现的所有内源性病毒成分C.augens公司对应于原粘病毒聚合酶碱性蛋白1(PB1)(Pfam Id PF00602;“Flu_PB1”)(另见补充图12和13,补充材料在线)。使用正粘病毒科代表性EVE和BP1蛋白的氨基酸序列构建邻接树。使用1000个伪复制来评估对树的支持。节点值对应于引导支持。比例尺表示每个位点的氨基酸替换。绿色方框突出显示Quaranjavirus属的病毒,而浅蓝色方框表示Thogoto病毒属。

结论

我们对1.2-Gb基因组进行了测序和注释C.augens公司,一种盲的、祖先无翼的六足类动物,属于系统双足目。基因结构分析强调了基因组范围内长内含子的趋势,内含子跨越27%的组装。我们发现,在基因组水平上,感光细胞基因的缺乏反映了祖先外部感光器官的继发性丢失,相比之下,动物王国中存在着最大的离子性受体基因库,占总基因库的~8%C.augens公司基因集。我们进一步检测到与解毒和碳水化合物代谢相关的基因家族的扩张,这可能反映了C.augens公司'觅食行为。到目前为止,关于双氟醚的大多数现有和最新实验数据来自C.augens公司无鞭毛梭菌例如,对大脑解剖和循环器官的研究(Gereben-Krenn和Pass 1999;Böhm等人。2012). 因此,我们认为C.augens公司无鞭毛梭菌作为双氟醚的模型物种,代表了良好的候选者。其基因组的可用性可以进行详细的分子研究,并发掘将双氟醚的特殊形态/行为特征与遗传证据联系起来的潜力。这个C.augens公司基因组为研究尚未开发的双氟醚生物学以及昆虫基因家族的起源和进化提供了新的机会。

数据可用性

该全基因组鸟枪项目已于加入时存放在DDBJ/ENA/GenBankVUNT00000000。本文中描述的版本是VUNT01000000。原始测序数据已存放在NCBI序列读取档案(SRA)中,编号为SRX3424039–SRX3424046。注释的线粒体基因组序列以登录号存放在GenBank中MN481418号基因组和线粒体集合、基因集和其他数据,如短支架(<1kb)、策划的化学受体基因和用于物种系统发育的超矩阵图2也可以从以下位置获得http://cegg.unige.ch/campodea_augens; 上次访问时间为2019年11月29日。应要求提供访问Apollo浏览器的凭据。

补充材料

补充数据可在基因组生物学与进化在线。

数据沉积:该项目已根据生物项目注册号PRJNA416902存放在NBCI。

致谢

这项工作得到了瑞士国家科学基金会对E.M.Z.R.M.W.的资助[31003A_143936]。R.M.W.R.M.W感谢瑞士国家科学委员会的资助[PP00P3_1706642]。我们感谢斯蒂芬·理查兹(贝勒医学院)允许我们使用未发表的aquilonaris卡塔水母。

作者的贡献

E.Z.M.和M.M.负责管理和协调研究;M.M.进行基因组组装、注释、正畸学和随后的分析;F.A.S.对样品进行排序;B.M.和O.N.根据流式细胞术提供基因组大小估计值,并组织样本收集;野生S.N.采集C.augens公司样品;H.M.R.进行了化学受体基因的鉴定和表征;M.A.G.组装了有丝分裂基因组并分析了霍克斯基因;M.M.写了手稿补充信息由R.M.W.、O.N.、B.M.、H.M.R.和E.Z.M.出资。;H.M.R.写下了化学受体基因的结果;M.M.为手稿准备了图表补充信息; 所有作者都阅读、更正并评论了手稿。

引用的文献

安得烈
博士。
2011
.
昆虫与甲壳动物关系的新观点2。表达序列标签的推断及其与神经分支系统学的比较
.
节肢动物结构开发
.
40
:
289
302
.

阿斯瓦德
A类
,
Katzourakis公司
答:。
2016
古病毒学:对内源性病毒成分的研究。In:Weaver SC、Denison M、Roossinck M、Vignuzzi M编辑。
病毒进化:当前研究和未来方向
.
凯斯特学术出版社
第页。
273
292
.

W公司
,
小岛
KK公司
,
科哈尼
O。
2015
.
Repbase update,真核生物基因组中重复元素的数据库
.
移动DNA
6
(
1
)以下为:
11
.

本杰米尼
Y(Y)
,
霍克伯格
年。
1995
.
控制错误发现率:一种实用而有效的多重测试方法
.
J Roy Stat Soc Ser B(卫理公会)
57
(
1
)以下为:
289
300
.

伯格曼
A类
,
Steller公司
H。
2010
.
细胞凋亡、干细胞和组织再生
.
科学信号
(
145
)以下为:
第8版
.

伯尔尼
M(M)
, 等。
2013
.
MITOS:改进的新生后生动物线粒体基因组注释
.
分子系统进化
.
69
(
2
)以下为:
313
319
.

泰吉
V(V)
,
Veer公司
英国。
2016
.
Doon Valley(Garhwal Himalaya)的昆虫学是昆虫研究的大本营
.
印度:科学出版社
.

博泽
M(M)
,
汉高(Henkel)
个人简历
,
詹森
HJ公司
,
巴特勒
D类
,
皮罗瓦诺
西。
2011
.
使用SSPACE搭建预装配连体脚手架
.
生物信息学
27
(
4
)以下为:
578
579
.

伯恩
A类
,
苏契奇
国立大学
,
通过
G.公司。
2012
.
双足类(六足类)的脑解剖
.
前Zool
.
9
(
1
)以下为:
26

博兰德
K(K)
,
弗拉纳根
L(左)
,
普雷恩
金华。
2013
.
半胱氨酸蛋白酶-3对组织再生和细胞增殖的旁分泌调控
.
细胞死亡病
.
4
:
e725(电子725)
.

博尔格
调幅
,
洛泽
M(M)
,
乌萨德尔
B。
2014
.
Trimmomatic:Illumina序列数据的灵活微调器
.
生物信息学
30
(
15
)以下为:
2114
2120
.

布泰
E类
, 等。
2016
.
UniProtKB/Swiss-Prot,UniProt知识库的手动注释部分:如何使用条目视图
.
摩尔生物法
.
1374
:
23
54
.

品牌
, 等。
2018
.
昆虫气味受体基因家族的起源
.
埃利夫
7
:
e38340电话
.

布奇芬克
B类
,
C类
,
胡森
DH(决断高度)。
2015
.
使用DIAMOND快速而敏感的蛋白质比对
.
Nat方法
12
(
1
)以下为:
59
60
.

卡马乔
C类
, 等。
2009
.
BLAST+:体系结构和应用程序
.
BMC生物信息学
10
(
1
)以下为:
421
.

卡佩拉·古铁雷斯
S公司
,
西拉马丁内斯
吉咪
,
加巴登
T。
2009
.
trimAl:大规模系统发育分析中自动校准的工具
.
生物信息学
25
(
15
)以下为:
1972
1973
.

木匠
答:。
1988
.
草原土壤中斑叶蜂的生物学(斑叶蜂科:双盲蝽)
.
土壤生物学
.

希基
R(右)
,
梅德韦杰夫
第页。
2014
.
基因组组装的信息和自动化k-mer大小选择
.
生物信息学
30
(
1
)以下为:
31
37
.

奇普曼
广告
, 等。
2014
.
第一个多足类基因组序列揭示了蜈蚣中节肢动物保守的基因含量和基因组组织马里蒂玛纹虫
.
公共科学图书馆生物
.
12
(
11
)以下为:
e1002005年
.

康德
B。
1955
。《Campodéidés外交官专著》材料。巴黎国家历史博物馆回忆录XII。

德尔蒙
收件人
,
埃伦
是。
2016
.
用先进的可视化和分析方法识别污染:真核生物基因组组装的宏基因组方法
.
同行J
4
:
e1839(电子1839)
.

DeSalle公司
R(右)
,
伊根
MG公司
,
西达尔
M。
2005
.
不神圣的三位一体:分类学、物种界定和DNA条形码
.
Phil Trans R足球俱乐部B
360
(
1462
)以下为:
1905
1916
.

迪尔克克森斯
N个
,
马杜林
,
史密茨
G.公司。
2017
.
NOVOPlasty:从全基因组数据中重新组装细胞器基因组
.
核酸研究
.
45
(
4
)以下为:
e18(电子18)
.

杜达斯
G公司
,
奥巴德
DJ(DJ)。
2015
.
系统发育:节肢动物是病毒进化的核心吗?
电子生活
4
:
电子06837
.

埃伦
调幅
, 等。
2015
.
Anvi'o:先进的组学数据分析和可视化平台
.
同行J
:
第319页
.

鄂云
S-I系列
, 等。
2017
.
节肢动物化学感受相关基因家族的进化史
.
分子生物学进化
.
34
(
8
)以下为:
1838
1862
.

Faddeeva-Vakhrusheva公司
A类
, 等。
2017
.
应对土壤中的生活:单性生殖跳鼠的基因组土壤污染对弹尾目
.
BMC基因组学
18
(
1
)以下为:
493
.

Faddeeva-Vakhrusheva公司
A类
, 等。
2016
.
基因家族进化反映了跳虫基因组对土壤环境胁迫源的适应朱子兰
.
基因组生物进化
.
8
(
7
)以下为:
2106
2117
.

福克斯
德国劳埃德船级社
,
科伊尔-汤普森
加利福尼亚州
,
贝林格
PF公司
,
科恩
RW公司。
2007
.
包括无眼类在内的各种跳蚤对紫外线和白光的趋光反应,土壤污染对弹尾目
.
昆虫科学杂志
.
7
:
22
.

加拉多·鲁伊斯
M(M)
,
勒加利亚德
J-F公司
,
塔利
T。
2017
.
无眼弹尾虫光视觉和光依赖运动行为的遗传变异土壤污染对弹尾目
.
土壤生物学
61
:
33
41
.

乔治
M。
1963
.
Campodea(Diplura)的研究:头部腺体和感觉器官的解剖
.
细胞科学杂志
.
第3-104页
:
1
21
.

格瑞本·克伦
B-A公司
,
通过
G.公司。
1999
.
双足动物的循环器官:六足动物的基本设计?
国际昆虫形态胚胎学杂志
.
28
(
1–2
)以下为:
71
79
.

希里韦特
G公司
,
埃奇科姆
天然气
,
木匠
吉咪
,
德黑斯
加利福尼亚州
,
惠勒
厕所。
2004
.
Ellipura是单系动物吗?以昆虫起源为重点的基本六足类关系的综合分析
.
生物潜水员进化
.
4
:
319
340
.

抓斗
MG公司
, 等。
2011
.
Trinity:从RNA-Seq数据重建无基因组的全长转录组
.
Nat生物技术
.
29
(
7
)以下为:
644
652
.

格里马尔迪
陆军部。
2010
.
六足动物4亿年:六足动物的起源和早期进化
.
节肢动物结构开发
.
39
:
191
203
.

金登
S公司
, 等。
2010
.
估计最大似然系统发育的新算法和方法:评估PhyML 3.0的性能
.
系统生物
.
59
(
)以下为:
307
321
.

汉族
中压
,
托马斯
GWC公司
,
卢戈·马丁内斯
J型
,
哈恩
兆瓦。
2013
.
使用CAFE 3估计基因组组装和注释中存在错误时的基因增益和丢失率
.
分子生物学进化
.
30
(
8
)以下为:
1987
1997
.

Z轴
, 等。
2016
.
Evolview v2:用于定制和注释系统发育树的在线可视化和管理工具
.
核酸研究
.
44
(
第1周
)以下为:
W236号机组
W241型
.

Hering公司
L(左)
, 等。
2012
.
甲状虫(丝绒虫)中的Opsins表明节肢动物的视觉色素来源单一,随后也发生了多样化
.
分子生物学进化
.
29
(
11
)以下为:
3451
3458
.

Hering公司
L(左)
,
迈耶
G.公司。
2014
.
缓步动物视蛋白储备分析杜贾迪尼丝虫提供了对灵长类视蛋白基因进化的见解
.
基因组生物进化
.
6
(
9
)以下为:
2380
2391
.

霍尔特
C类
,
扬戴尔
M。
2011
.
MAKER2:用于第二代基因组项目的注释管道和基因组数据库管理工具
.
BMC生物信息学
12
(
1
)以下为:
491
.

池田
Y(Y)
,
马奇达
R。
2001
.
双氟醚的胚胎发生勒皮多坎帕·韦贝里·奥德曼斯六足类:双足类,蟾蜍科:背器官的形成及相关现象
.
J形态
.
249
(
)以下为:
242
251
.

约安尼迪斯
, 等。
2017
.
豆娘的基因组特征红萼代表大多数昆虫目的姐妹分支
.
基因组生物进化
.
9
(
2
)以下为:
415
430
.

G公司
, 等。
2017
.
Parallel-META 3:用于高效比较微生物群落的综合分类和功能分析平台
.
科学代表
.
7
(
1
)以下为:
40371
.

琼斯
, 等。
2014
.
InterProScan 5:基因组尺度蛋白质功能分类
.
生物信息学
.
30
(
9
)以下为:
1236
1240
.

卡吉塔尼
R(右)
, 等。
2014
.
高效从头组装全基因组鸟枪式短阅读的高度杂合基因组
.
基因组研究
.
24
(
8
)以下为:
1384
.

加藤
K(K)
,
斯坦德利
DM公司。
2013
.
MAFFT多序列比对软件版本7:性能和可用性的改进
.
分子生物学进化
.
30
(
4
)以下为:
772
780
.

Katzourakis公司
A类
,
吉福德
RJ公司。
2010
.
动物基因组中的内源性病毒元件
.
公共科学图书馆-基因
.
6
(
11
)以下为:
e1001191号
.

凯利
博士
,
萨尔茨堡
斯里兰卡。
2010
.
基因组组装错误引起的假片段重复的检测与纠正
.
基因组生物学
.
11
(
)以下为:
28兰特
.

尼赫特
南非
, 等。
2017
.嗜离子受体依赖的湿细胞和干细胞控制果蝇属.电子生活,6:e26654。

科赫
M。
2009
。第75章-双氟醚。在:
Resh(休息)
VH公司
,
卡德
RT公司
,编辑。
昆虫百科全书
,第2版。
圣地亚哥(加利福尼亚州
)以下为:
学术出版社
第页。
281
283
.

克里文特斯娃
电动汽车
, 等。
2019
.
OrthoDB v10:对动物、植物、真菌、原生生物、细菌和病毒基因组的多样性进行采样,以便对同源基因进行进化和功能注释
.
核酸研究
.
47
(
第1页
)以下为:
D807型
D811号
.

库卡洛娃-佩克
J。
1998
节肢动物系统发育和“基本”形态结构。在:
福蒂
无线电高度表
,
托马斯
右侧
,编辑。
节肢动物关系,系统学协会特别卷系列
.
多德雷赫特(荷兰)
:
施普林格
第页。
249
268
.

库卡洛娃-佩克
J。
1987
.
新石炭纪双尾类、莫努拉类和蒂萨努拉类,六足类平面图,以及胸侧叶在翅膀起源中的作用(昆虫纲)
.
Can J Zool公司
.
65
(
10
)以下为:
2327
2345
.

古玛
S公司
,
Stecher公司
G公司
,
苏莱斯基
M(M)
,
对冲
某人。
2017
.
TimeTree:时间线、时间树和发散时间的资源
.
分子生物学进化
.
34
(
7
)以下为:
1812
1819
.

拉伊奇
博士
,
布拉克斯特
毫升。
2017
.
BlobTools:基因组组装查询
.
F1000分辨率
.
6
:
1287
.

拉金
妈妈
, 等。
2007
.
Clustal W和Clustal X 2.0版
.
生物信息学
23
(
21
)以下为:
2947
2948
.

劳伦斯
射频。
1953
森林隐秘动物群的生物学,特别是南非本土森林。森林隐秘动物群的生物学,特别是南非本土森林。

E类
, 等。
2013
.
Web Apollo:基于Web的基因组注释编辑平台
.
基因组生物学
.
14
(
8
)以下为:
93卢比
.

CX公司
, 等。
2015
.
节肢动物中前所未有的RNA病毒基因组多样性揭示了负义RNA病毒的起源
.电子生活4:e05378。

H(H)
,
杜宾
R。
2009
.
使用Burrows-Wheeler变换快速准确地进行短读对齐
.
生物信息学
25
(
14
)以下为:
1754
1760
.

S公司
, 等。
2018
.
美国蟑螂发育可塑性的基因组和功能景观
.
国家公社
.
9
(
1
)以下为:
1008
.

锁定
K(K)
,
阿德莱恩斯
T型
,
史蒂文斯
M。
2010
.
比利时的分布和生态坎波迪亚种(双蚤目:蟾蜍科)
.
欧洲土壤生物学杂志
.
46
(
1
)以下为:
62
65
.

卢安
Y(Y)
,
马尔拉特
吉咪
,
R(右)
,
Y(Y)
,
西。
2005
.
基于核糖体RNA基因序列的三个基性六足类(原尾目、双尾目和弹尾目)的系统发育位置
.
分子生物学进化
.
22
(
7
)以下为:
1579
1592
.

马奇达
R。
2006
.
重建六足类基底支关系的胚胎学证据
.
节肢动物系统发育
64
:
95
104
.

Mallet公司
L(左)
,
Bitard-Feildel公司
T型
,
塞鲁蒂
F类
,
夏培罗
H。
2017
.
PhylOligo:一种用于识别基因组组装中污染物或非靶向生物序列的软件包
.
生物信息学
33
(
20
)以下为:
3283
3285
.

马鲁佐
D类
,
博纳托
L(左)
,
布雷纳
C类
,
富斯科
G公司
,
米内利
答:。
2005
节肢动物的附属物丢失和再生。第页。
215
245
; doi:10.1201/9781420037548.ch9

梅塞曼
K(K)
, 等。
2010
.
解决节肢动物生命树的系统发生学方法
.
分子生物学进化
.
27
(
11
)以下为:
2451
2464
.

米索夫
B类
, 等。
2014
.
系统基因组学解决了昆虫进化的时间和模式
.
科学
346
(
6210
)以下为:
763
767
.

米斯巴赫
C类
, 等。
2014
.
昆虫嗅觉受体的进化
.
电子生活
3:e02115。

Ngoc公司
百分比
, 等。
2016
.
极端多面手切利克拉特食草动物中大规模扩展的化学感受器家族的复杂进化动力学
.
基因组生物进化
.
8
(
11
)以下为:
3323
3339
.

L(左)
, 等。
2013
.
味觉受体旁记录控制快速避温果蝇属
.
自然
500
(
7464
)以下为:
580
584
.

Niimura公司
年。
2014
.
嗅觉受体基因:进化
。输入:
电子LS
美国癌症学会;doi:10.1002/9780470015902.a0020789.pub2

奥尔森
韩国
,
博尼佐尼
M。
2017
.
节肢动物载体中的非逆转录病毒整合RNA病毒:偶然事件还是其他?
Curr Opin昆虫科学
.
22
:
45
53
.

奥加齐
A类
欧洲委员会,联合研究中心。
2016
全球土壤生物多样性图谱。

帕里萨语
答:。
1964
.
Apterygota-Urinsekten水母。
收件人:Brohmer、Ehrmann、Ulmer,编辑。四、 1a、。
柏林(德国
)以下为:
Tierwelt Mitteleuropas模具
第页。
1
407
.

佩纳尔瓦·阿拉纳
直流
,
林奇
M(M)
,
罗伯逊
HM公司。
2009
.
水蚤的化学受体基因水蚤:许多Grs,但没有Ors
.
BMC进化生物学
.
9
(
1
)以下为:
79
.

波德西亚多夫斯基
L(左)
, 等。
2006
.
线粒体基因组脆弱的Campodea fragilis卡波迪亚·卢博基(六足纲:双螺纲):形态统一的分类单元中的高度遗传分化
.
基因
381
:
49
61
.

波因顿
HC公司
, 等。
2018
.
阿兹特卡海勒菌的产毒组:沉积物生态毒理学和进化毒理学模型
.
环境科技
.
52
(
10
)以下为:
6009
6022
.

普雷斯蒂
马来西亚令吉
, 等。
2009
.
夸兰菲尔病毒、约翰斯顿环礁病毒和乍得湖病毒是该家族的新成员正粘病毒科
.
J维罗尔
.
83
(
22
)以下为:
11599
11606
.

普列托·戈迪诺
陆上通信线
, 等。
2017
.
果蝇酸性嗅觉回路的进化
.
神经元
93
(
)以下为:
661
676.电子6
.

普里什茨
有限合伙人
,
加巴登
T。
2016
.
冗余:高度杂合基因组的组装管道
.
核酸研究
.
44
(
12
)以下为:
第113页
.

雷吉尔
JC公司
,
舒尔茨
JW公司
,
卡姆比(Kambic)
重新。
2004
.
基础六足类谱系的系统发育及发散时间估计
.
Ann Entomol Soc Am公司
.
97
(
)以下为:
411
419
.

冯·雷蒙特
BM公司
, 等。
2009
.
能否将全面的背景知识纳入替代模型以改进系统发育分析?主要节肢动物关系的个案研究
.
BMC进化生物学
.
9
(
1
)以下为:
119
.

理查兹
S公司
,
穆拉里
SC.公司。
2015
.
昆虫基因组测序的最佳实践:什么有效,什么无效
.
Curr Opin昆虫科学
.
7
:
1
7
.

罗伯逊
HM公司。
2019
.
节肢动物主要化学受体基因家族的分子进化
.
昆虫学年度回顾
.
64
(
1
)以下为:
227
242
.

罗伯逊
HM公司。
2015
.
昆虫化学受体超家族在动物中由来已久
.
化学传感器
40
(
9
)以下为:
609
614
.

罗伯逊
HM公司
, 等。
2018
.
杂食性德国蟑螂化学感受基因库的巨大扩展德国小蠊
.
J实验动物园(分子发展演变)
330
(
5
)以下为:
265
278
.

桑德森
乔丹。
2003
.
r8s:在没有分子钟的情况下推断分子进化的绝对速率和发散时间
.
生物信息学
19
(
2
)以下为:
301
302
.

沙沙贵
G公司
,
日本人石渡
K(K)
,
马奇达
R(右)
,
宫城县
T型
,
Z-H公司。
2013
.
分子系统发育分析支持了六足类的单系性,并暗示了昆虫亚纲的半系性
.
BMC进化生物学
.
13
(
1
)以下为:
236
.

森德拉
A类
,
吉泽一郎
K(K)
,
费雷拉
左后。
2018
.
日本驼鹿科超大型球虫新种(双尾目)
.
某人
27
:
53
73
.

Seppey公司
M(M)
,
曼尼
M(M)
,
兹多布诺夫
相对长度单位。
2019
BUSCO:评估基因组组装和注释完整性。在:
科尔马尔
M(M)
,编辑。
基因预测:方法和方案。分子生物学方法
.
纽约
:
施普林格
第页。
227
245
.

沙利尼
S公司
,
多斯汀
L(左)
,
达瓦尔
S公司
,
古玛
美国。
2015
.
半胱氨酸天冬氨酸蛋白酶的新旧功能
.
细胞死亡不同
.
22
(
4
)以下为:
526
539
.

M(M)
, 等。
2016
.
节肢动物和脊椎动物中发现的不同病毒改变了黄病毒科和相关病毒的进化历史
.
J维罗尔
.
90
(
2
)以下为:
659
669
.

斯塔马塔基斯
答:。
2014
.
RAxML版本8:一个用于系统发育分析和大型系统发育后分析的工具
.
生物信息学
30
(
9
)以下为:
1312
1313
.

斯坦克
M(M)
,
摩根斯坦
B。
2005
.
AUGUSTUS:真核生物基因预测的web服务器,允许用户定义约束
.
核酸研究
.
33(Web服务器)
:
W465型
W467型
.

树桩
TM(TM)
,
te Velthuis公司
AJ公司。
2014
.
甲型流感病毒的RNA依赖性RNA聚合酶
.
未来病毒
.
9
(
9
)以下为:
863
876
.

太阳
G公司
,
欧文
杜兰特。
2014
第四章-再生过程中的生长控制。在:
加略
B类
,编辑。
发育生物学的当前主题。再生机制
,卷。
108
.
学术出版社
第页。
95
120
.

苏泽克
比利时
,
Y(Y)
,
H(H)
,
麦加维
PB(聚丁二烯)
,
中国。
2015
.
UniRef集群:用于改进序列相似性搜索的全面且可扩展的替代方案
.
生物信息学
31
(
6
)以下为:
926
932
.

Terrapon公司
N个
, 等。
2014
.
白蚁基因组中另类社会组织的分子痕迹
.
国家公社
.
5
(
1
)以下为:
3636
.

富束
S公司
,
马奇达
R。
2015
.
跳虫的胚胎发育,虎皮Tomocerus cuspidatusBörner,1909年:特别提到浆膜的发育和发展潜力(六足目:弹尾目,托莫西里达科)
.
节肢动物结构开发
.
44
:
157
172
.

特拉普内尔
C类
,
Pachter公司
L(左)
,
萨尔茨堡
斯里兰卡。
2009
.
TopHat:使用RNA-Seq发现拼接接头
.
生物信息学
25
(
9
)以下为:
1105
1111
.

维诺格拉多夫
AE公司。
1999
.
内含子-大规模进化中的基因组大小关系
.
分子进化杂志
.
49
(
)以下为:
376
384
.

Vurture公司
格温
, 等。
2017
.
GenomeScope:基于短阅读的快速无参考基因组分析
.
生物信息学
33
(
14
)以下为:
2202
2204
.

Waterhouse公司
马来西亚令吉
, 等。
2018
.
BUSCO从质量评估到基因预测和系统发育学的应用
.
分子生物学进化
.
35
(
)以下为:
543
548
.

威伦
JK公司
,
桑佩德罗
L。
2010
.
土壤生态与管理
.
CABI公司
.

威尔逊
HM公司
,
马蒂尔
DM公司。
2001
.
巴西早白垩世一种新的日本双氟醚
.
古生物学
44
(
5
)以下为:
1025
1031
.

YI(易)
, 等。
2018
.
全球RNA病毒的起源和进化
.
mBio公司
9
(
6
)以下为:
电子02329-18
.

木材
,
萨尔茨堡
斯里兰卡。
2014
.
Kraken:使用精确比对的超快速宏基因组序列分类
.
基因组生物学
.
15
(
)以下为:
46兰特
.

C类
, 等。
2017
.
新西兰大跳虫基因组分析(多刺水仙)揭示六足动物的进化
.
BMC基因组学
18
(
1
)以下为:
795
.

Y(Y)
, 等。
2010
.
避光感光器将果蝇属幼虫体壁
.
自然
468
(
7326
)以下为:
921
926
.

C类
,
兹斯
,
加农炮
中国
,
流行音乐
M(M)
,
数据仓库。
2012
.
利用新基因组组装中的稀疏性
.
BMC生物信息学
13
(
S6系列
)以下为:
S1(第一阶段)
.

G公司
,
史密斯
丹麦
,
H(H)
,
Y(Y)
,
TT-Y公司。
2017
.
ggtree:一个用于可视化和注释系统发育树及其协变量和其他相关数据的r包
.
方法生态进化
.
8
(
1
)以下为:
28
36
.

兹多布诺夫
相对长度单位
, 等。
2017
.
OrthoDB v9.1:动物、真菌、植物、古菌、细菌和病毒直系同源物的进化和功能注释编目
.
核酸研究
.
45
(
第1页
)以下为:
D744号
D749号
.

F类
, 等。
2019
.
高质量基因组草图曲线Sinella curvesta土壤模型生物(弹尾目
).
基因组生物进化
.
11
:
521
530
.

SV公司
,
L(左)
,
哈恩
兆瓦。
2016
.
AGOUTI:利用转录组数据改进基因组组装和注释
.
GigaCi公司
.
5
(
1
)以下为:
31
.

这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/4.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。
副编辑: 多萝西·胡冲(Dorothée Huchon)
多萝西·胡冲(Dorothée Huchon)
助理编辑
搜索此作者的其他作品:

补充数据