跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https公司

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并且被安全地传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2005年1月;15(1):1-18.
doi:10.10101/gr.3059305。

伪暗果蝇的比较基因组测序:染色体、基因和顺式元件进化

附属公司
比较研究

伪暗果蝇的比较基因组测序:染色体、基因和顺式元件进化

斯蒂芬·理查兹等。 基因组研究. 2005年1月.

摘要

我们对第二种果蝇的基因组进行了测序,并将其与主要模式生物果蝇的基因序列进行了比较。在整个进化过程中,绝大多数果蝇基因都保留在同一染色体臂上,但在每一臂内,基因序列都被广泛重组,导致物种之间至少有921个共有基因块。在假暗纹夜蛾基因组中,在相邻的同张力区之间的许多连接处发现了重复序列。对这一新的重复元件家族的分析表明,偏移元件之间的重组可能导致了许多非中心反转,从而导致假隐球菌谱系中基因顺序的改变。基于序列相似性和共有性,10516个假定的同源基因被确定为一个核心基因集,该基因集自伪盲蝽/黑腹角鲨分化以来保存了25-550万年(Myr)。睾丸中表达的基因的氨基酸序列差异高于全基因组平均值,这与性别特异性蛋白质的快速进化一致。顺式调节序列在物种之间比随机序列和邻近序列更保守,但差异很小,这表明顺式调节元件的进化是灵活的。总的来说,重复介导的染色体重排模式以及雄性基因和顺调控序列的高度共适应是这些果蝇物种之间基因组差异的重要主题。

PubMed免责声明

数字

图1。
图1。
之间的同步关系D.假遮蔽D.黑腹果蝇.同步点图显示了D.假遮蔽D.黑腹果蝇用于五条染色体臂。在每种情况下D.黑腹果蝇染色体显示在x个-轴和D.假遮蔽染色体-轴。请注意,图中的线条都具有相同的厚度,但长度不同。由于图中固有的压缩性,许多线条短于宽。染色体已进行了颜色编码,以便识别染色体间的合成酶区。例如,在左上角D.假遮蔽染色体4–D.黑腹果蝇染色体2L图,位于D.假遮蔽4号染色体与D.黑腹果蝇可见X染色体。由于缺乏该染色体上的序列锚定数据,因此未显示Muller元件F。
图2。
图2。
映射种内反转断点。(A类)Muller元件C与D.黑腹果蝇和箭头排列D.假遮蔽揭示了附近保守连锁的连接残留的(vg(vg)). 编号段51E2、58E1、49D2和58D8为D.黑腹果蝇与70A、76B、70B和76C切片同源的细胞学位置D.假遮蔽细胞学图谱。vg(vg)将标准排列转换为箭头排列的反转远端断点附近的地图(Schaeffer等人,2003年)。四个PCR引物a、b、c和d的位置显示在标准和箭头物理图上。注意,两个内部引物b和c在两条染色体上发生了切换。(B类)PCR结果。箭头特异性引物组合(a+c和b+d)仅扩增箭头DNA,而标准特异性引子组合(a+b和c+d)只扩增标准排列上的断点。对Standard和Arrowhead背景的PCR产物进行序列分析,验证PCR扩增出了合适的序列。
图3。
图3。
断点内重复序列的结构,将标准基因排列转换为箭头排列。底部的粗线表示Muller元素C,勾号表示箭头反转的近端和远端断点的位置。黑色直方图顶部指出BLAST高核心片段对(HSP)在BLASTN与整个基因组的每个断点比较中包含特定核苷酸的频率(E类-值≤1×10-5). 在位于顶部单个重复序列用三个字母标记,其中第一个字母表示近端或远端,数字表示重复序列家族,最后一个字母表示不同的重复序列。较大的重复可以从较小的重复中产生,例如由相邻的128和315 bp重复产生的443 bp重复。虚线框表示与重排事件有关的假定重复单元,三角形表示DNA断裂相对于重复基序的大致位置。
图4。
图4。
保守连锁群的重排D.黑腹果蝇D.假遮蔽粗水平线表示D.黑腹果蝇D.假遮蔽Muller元素C。绘制垂直线向下(D.黑腹果蝇)或向上的(D.假遮蔽)表示保守的连锁群。80个断点基序的位置和方向用保守连锁群连接处的开放三角形和填充三角形表示。对角线连接两个物种中的同源连锁群,其中断点基序之间的单个反转事件将带来相邻的D.黑腹果蝇基因在一起(虚线和灰线)。第二个例子显示了一对母题之间的异位交换,其中只有一个断点导致相邻的D.黑腹果蝇基因一起用黑色实线表示。
图5。
图5。
“原型基因”不同片段的平均保守性。保守性统计数据是在数千对不同类型的对齐区域上计算出来的,这些区域在不同的参考点对齐。在每个位置,我们计算在该位置具有相同碱基(绿色+紫色层)、具有不匹配碱基(红色)、,黑腹食肉动物与中删除的基准对齐的基准假盲(黄色),或在我们的同步过滤BLASTZ对齐中未对齐(蓝色)。紫色层显示了根据这两个物种在该位置的碱基组成,预计会偶然匹配的碱基比例。由于包含了未对齐和删除的序列,预期的匹配小于25%;如果去掉这些,基线为~28%,因为基因组的AT丰富度较低。垂直面板对应于原型基因的不同片段,如x个-轴。代表原型基因的卡通在下面面板。这些片段由基因片段标记,后跟括号中的片段对齐部分。例如,CDS(5′-端)代表编码序列的开始,由ATG开始序列对齐,而编码外显子(3′-端。(A) RIC,CRE分析的随机基因间对照;(B) 按照-250 bp至+250 bp的顺序从CRE中抵消附近的控制正确的-大多数附近的对照组最接近基因起始点,因此在一个平均更保守的区域。因此,附近的一些控件具有较高的匹配百分比(绿色);然而,作为对齐碱基的一部分,CRE在相同碱基对中的匹配率最高(除了蓝色以外的所有碱基)。(C) 142个Cis公司-文献中50 bp或以下的调节元件;(D) 从50到500,每隔50bp对5′-近端区域进行压缩采样;(E) 靠近转录起始位点(TS)50 bp,在TS处对齐;(F) 5′-UTR的基因组跨度,在TS处排列;(G) 5′-UTR跨度在蛋白质起始位点对齐(PS);(H) 蛋白编码区5′端在PS处对齐;(I) 在供体位点排列的编码外显子的3′端;(J) 内含子在供体位点排列;(K) 内含子在受体处排列;(五十) 5′-内编码外显子末端在受体位点对齐;(M) 蛋白质编码区的3′端与蛋白质末端位点(PE)对齐;(N) 3′-UTR跨度在PE处对齐;(O) 3′-UTR跨度在转录末端对齐;(P) 3′-近端区域50bp在转录末端对齐;(Q) 从50到500,每隔50bp对3′-近端区域进行压缩采样;和(R)全基因组平均值。
图6。
图6。
的分配d日N个,d日S公司以及自由基和保守氨基酸的变化。(A类)的分布d日S公司和(B类)的分布d日N个(每个同义站点的同义替换数和每个非同义站点中的非同义替换量)。(C)比率ω的分布=d日N个/d日S公司对于黑腹食肉动物假盲9184个同源蛋白编码基因的比较。(D类F类)α的分布,即自由基取代率与保守取代率的比率,基于9184个直向同源蛋白质编码基因的比对D.假遮蔽D.黑腹果蝇.剧烈变化影响电荷(D类),极性(E类),或极性和体积(F类)在更大程度上比保守的改变。用最大似然法拟合替代模型来估计这些速率参数。
图7。
图7。
三组顺式-调控元件序列,不包括没有对齐碱基的序列。KS测试可以被视为回答了“这些曲线不同吗?”所有三条曲线都显著不同(见表2)。真正的CRE在80%-90%的同一范围内显示出一个独特的峰值,可能是稳定选择的结果。上升左边是由于未对齐或大部分被删除的序列。
图8。
图8。
具有重复序列基序的染色体反转机制。一条假想的染色体显示有基因A到N和两个反向重复序列基序(开放和黑色箭头)(顶部). 重复的基序在减数分裂期间配对,在配对基序的中间发生重组事件(中间的). 导致中心基因区反转的重复序列基序之间重组事件的解析(底部).

类似文章

引用人

工具书类

    1. Altschul,S.F.、Gish,W.、Miller,W.,Myers,E.W.和Lipman,D.J.,1990年。基本本地对齐搜索工具。分子生物学杂志。215: 403-410.-公共医学
    1. Andersson,B.、Wentland,M.A.、Ricafrente,J.Y.、Liu,W.和Gibbs,R.A.,1996年。改进猎枪库构建的“双适配器”方法。分析。生物化学。236: 107-113.-公共医学
    1. Beckenbach,A.T.、Wei,Y.W.和Liu,H.,1993年。根据线粒体细胞色素氧化酶II序列推断的暗果蝇种群的关系。分子生物学。进化。10: 619-634.-公共医学
    1. Bergman,C.M.,Pfeiffer,B.D.,Rincon-Limas,D.E.,Hoskins,R.A.,Gnirke,A.,Mungall,C.J.,Wang,A.M.,Kronmiller,B.,Pacleb,J.M.,Park,S.等人,2002年。评估比较基因组序列数据对果蝇基因组功能注释的影响。基因组生物学。3:研究0086。-项目管理咨询公司-公共医学
    1. Berman,B.P.、Pfeiffer,B.D.、Laverty,T.R.、Salzberg,S.L.、Rubin,G.M.、Eisen,M.B.和Celniker,S.E.,2004年。发育增强因子的计算鉴定:黑腹果蝇和假暗腹果蝇转录因子结合位点簇的保护和功能。基因组生物学。5:R61。-项目管理咨询公司-公共医学

网站引用

    1. http://bacpac.chori.org/; BACPAC资源。
    1. http://hgsc.bcm.tmc.edu/projects/drosophila(果蝇)/; BCM-HGSC。
    1. http://pipeline.lbl.gov/pseudo/; VISTA基因组浏览器。

出版物类型

关联数据

LinkOut-更多资源