跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
《公共科学图书馆·生物》。2004年5月;2(5):e126。
2004年3月23日在线发布。 数字对象标识:10.1371/journal.pbio.0020126
预防性维修识别码:项目经理374243
PMID:15045028

加速发展ASPM公司控制人脑大小的基因开始于人脑扩张之前

关联数据

补充资料

摘要

原发性小头畸形(MCPH)是一种神经发育障碍,其特征是大脑皮层体积整体缩小。小头人脑的体积与早期原始人相当,这增加了一些MCPH基因可能是哺乳动物尤其是灵长类大脑皮层扩张的进化目标的可能性。中的突变ASPM公司编码对纺锤体功能至关重要的苍蝇蛋白的人类同源物,是MCPH最常见的已知病因。这里我们已经分离出包含完整的ASPM公司通过酵母转化相关重组克隆,获得黑猩猩、大猩猩、猩猩和恒河猴的基因,包括启动子区域和内含子。我们对这些克隆进行了测序,结果表明,尽管ASPM公司在灵长类动物中基本上是保守的,特定片段受到高Ka/Ks比率(非同义/同义DNA变化)的影响,这与进化变化的强正选择一致。这个ASPM公司基因序列显示非洲原始人种分支的进化速度加快,这比原始人种的大脑扩张早了几百万年。大猩猩和人类血统在智商领域的进化速度特别快ASPM公司此外,ASPM公司灵长类动物的正选择区域也是灵长类动物和非灵长类哺乳动物之间分歧最大的区域。我们报道了TAR克隆技术首次直接应用于人类进化研究。我们的数据表明ASPM公司序列与大脑皮层大小的差异密切相关。

基因突变ASPM公司该基因与大脑异常小有关。比较ASPM公司一些灵长类物种的基因表明,它是大脑增大的进化选择目标

介绍

在灵长类动物进化过程中,人脑,尤其是大脑皮层的体积急剧增加,但导致这种膨胀的潜在分子机制尚不清楚。分析导致大脑发育缺陷的基因突变是揭示大脑进化分子机制的一种方法。人类原发性小头综合征是此类缺陷的最佳例子之一。原发性小头症(MCPH)是一种常染色体隐性遗传的神经发育障碍,大脑无法正常生长。受影响的个体大脑尺寸严重缩小;然而,脑回模式保存得相对较好,皮层结构没有重大异常(McCreary等人,1996年;Mochida和Walsh 2001). 此外,除中枢神经系统外,其他器官没有可识别的异常。MCPH最常见的原因似乎是ASPM公司基因(Roberts等人,2002年).

这个ASPM公司该基因编码一个带有28个外显子的10434-bp长编码序列(CDS),在1q31处跨越65 kb的基因组DNA。ASPM公司包含四个可区分的区域:假定的N端微管结合域、钙调素同源域、包含多个IQ重复的IQ重复域(钙调素结合基序)和C端区域(邦德等人,2002年). 虽然人类的确切功能ASPM公司大脑中需要澄清果蝇中的同源物,黑腹果蝇,异常主轴(asp),定位于有丝分裂中心体,在有丝分裂和减数分裂期间对纺锤体两极微管的组织和中央有丝分裂纺锤体的形成至关重要。中的突变阿司匹林导致分裂成神经细胞在中期停滞,导致中枢神经系统发育减少(Ripoll等人,1985年;do Carmo Avides等人,2001年;Riparbelli等人,2001年). 在鼠标中(小家鼠)大脑Aspm公司基因在活跃的神经发生部位特异表达。胚胎脑中的表达在脑室区最大,脑室区是大脑皮层神经发生的部位(Bond等人,2002年). 该表达谱表明Aspm公司调节神经发生。

种间比较ASPM公司直系图显示了它们的整体保守性,但更大的蛋白质大小与更大的大脑大小有一致的相关性(邦德等人,2002年). 跨物种蛋白质大小的增加主要是由于IQ重复次数的增加,这表明ASPM公司可能对中枢神经系统的进化至关重要。

试图重建ASPM公司基因,我们分离出包含整个ASPM公司几个非人灵长类物种的基因。对这些克隆的序列分析表明,它们在编码区和非编码区都具有高度的保守性,并且表明ASPM公司该基因可能在人类中处于正选择状态。这些克隆也可以为将来的研究提供重要的试剂ASPM公司天然序列背景下的基因调控。

结果

基因组组织的比较ASPM公司灵长类的基因

黑猩猩的同源词(泛辉长岩),大猩猩(大猩猩),猩猩(Pongo pygmaeus),和恒河猴(猕猴)在酵母中通过转化相关重组(TAR)克隆分离(酿酒酵母),无需构建基因组文库即可从复杂基因组中直接分离出所需染色体区域或基因的技术(库普里纳和拉里诺夫2003). 该方法利用了酵母转化过程中同源DNA序列之间的高水平重组。由于DNA序列中高达15%的差异并不能阻止酵母体内重组的选择性基因分离(Noskov等人,2003年)为了克隆目的,设计了一种含有短型人类的TAR载体ASPM公司-外显子1和3′非编码区特异的基因特异性靶向钩(见“材料和方法”). 用于隔离ASPM公司非人类灵长类的基因同源物如所示图1. The yield ofASPM公司-来自黑猩猩、大猩猩、猩猩和恒河猴的阳性克隆与来自人类DNA的阳性克隆相同,这表明非人类灵长类的大多数同源区域可以通过使用人类序列开发的靶向钩在酵母中进行体内重组来高效克隆。

保存图片、插图等的外部文件。对象名称为pbio.0020126.g001.jpg
含有ASPM公司TAR克隆人、黑猩猩、大猩猩、猩猩和猕猴的基因

该方法利用了酵母转化过程中同源DNA序列之间的高水平重组酿酒酵母为了进行分离,基因组DNA被转化为酵母球状体以及含有与基因组DNA序列同源的靶向钩的TAR载体。欧洲标准化委员会对应于酵母染色体VI着丝粒;HIS3型是酵母选择性标记。载体和基因组DNA片段之间的重组导致了相关基因/区域的克隆,即YAC。通过TAR克隆可以分离出大小达250 kb的染色体区域。为了进行克隆,设计了TAR载体,其中包含一个外显子1特异的5′钩和一个人类3′端特异的3′钩ASPM公司.利用新制备的每个物种的球形体进行转化实验。要识别ASPM公司-包含克隆,将转化子组合到池中,并通过PCR检测是否存在独特的ASPM公司矢量中不存在序列。产量ASPM公司-灵长类动物的阳性克隆与人类DNA的阳性克隆相同(3%)。由于TAR程序产生多个基因分离物,因此对每个物种的六个独立TAR分离物进行了检查。克隆材料的可检测尺寸与如果整个ASPM公司该基因已被克隆,即所有基因阳性克隆均含有约65kb DNA插入的环状YAC。测定了每个物种的基因图谱,发现每个物种的图谱都是相同的,这表明分离的YAC包含非重组基因组片段。最后将YAC改造为BAC,并通过三种限制性内切酶消化检测其限制性模式。之间没有差异ASPM公司找到了每个物种的克隆。

我们比较了灵长类物种和一个65kb的全尺寸人类的完整基因序列ASPM公司基因。所有分析的基因都被组织成28个外显子,编码3470–3479氨基酸长蛋白。ASPM公司基因起始于一个约800-bp长的CpG岛,该岛包含启动子序列、5′非翻译区和第一个外显子(图2).ASPM公司序列具有高度的保守性(图2H) 和成对DNA的一致性范围从猕猴和大猩猩的94.5%到人类和黑猩猩的99.3%(表1). 基因的多重比对显示indels的比例很低。仅发现10个长度等于或超过50 bp的插入/缺失,所有插入/缺失都位于内含子内(图2B) ●●●●。检测到的7个插入物主要与重复DNA有关:2个(自动变速器)n个微型卫星扩展,三插入,包括阿鲁依9在猩猩-大猩猩-黑猩猩-人类分支中,一种新的猕猴特异性的倒退AluY公司与人类相似的亚科铝Yd2对八种不同猕猴个体的分析表明,这种特殊的插入在猕猴种群中具有多态性(数据未显示),因此插入似乎是最近的。一个245磅长的猕猴特异性插入与一个49磅长的小型卫星阵列的扩展有关。其余猕猴特异性插入(50 bp)为非重复性。更仔细的分析表明,插入物不是已知基因的加工假基因(数据未显示)。

保存图片、插图等的外部文件。对象名称为pbio.0020126.g002.jpg
结构和演变ASPM公司灵长类的基因

所有曲线图的比例对应于基于5的多重对齐获得的一致序列ASPM公司基因。

(A) 路线的示意图。启动子区域、外显子和内含子分别用灰色、红色和蓝色标记。白色部分对应间隙。

(B) 长(50 bp或更长)插入/删除的位置。“O”表示猩猩,“M”表示猕猴,“OGCH”表示猩猩–大猩猩–黑猩猩–人类分支,“GCH”表示大猩猩–猩猩–人类支。

(C) 来自GenBank单核苷酸多态性(SNP)数据库的多态性碱基位置。

(D) CpG岛的位置。大约800-bp长的CpG岛包括启动子、5′UTR、第一外显子和第一内含子的一小部分。

(E) 长度约为3kb的节段复制的位置。

(F) 与人类序列中基因组重排相关的选定基序的位置。括号中的数字反映了与一致基序允许的差异数(短基序为零或两个模棱两可的基序,长基序为两个基序)。

(G) 重复元素的分布。个人ASPM公司除了(B)中标记的indels外,基因共享相同的重复序列。

(H) DNA鉴定和GC含量。这两个图都是使用一个长度为1kb、重叠长度为100bp的滑动窗口绘制的。GC剖面对应于一致序列;各个序列具有几乎相同的轮廓。

表1

对齐灵长类的成对识别ASPM公司基因
保存图片、插图等的外部文件。对象名称为pbio.0020126.t001.jpg

计算了五个完整的成对恒等式ASPM公司基因,因此包括所有启动子区域、内含子和外显子。对角线上方的值显示了去除indels后计算的DNA身份(以百分比表示)。对角线下方是用于与间隙进行比较的值

在检测到的两个缺失中,猕猴特异性72 bp长的缺失似乎与非复制DNA有关。第二个是红毛猩猩的818 bp-long缺失,可能是由同源基因引起的Alu–铝重组(见下文和图S1). 其余指数与短小型卫星阵列的扩展/收缩有关。它要么是由大猩猩-黑猩猩-人类分支中53磅的膨胀引起的,要么是由猕猴和猩猩血统中两个独立的缺失/收缩引起的。

基因组中的多个拷贝中存在外显子4和5之间约3kb长的内含子片段(图2E;图S2). 对人类基因组的进一步分析证实,该区域的拷贝与主要位于染色体1–8、10、11、16、19、20和Y的端粒区域的24个片段重复同源L1P4线路在5′端插入,最密切相关的是7q11-13的三个重复。最相似的拷贝位于7号染色体上,与ASPM公司内含子片段。第1号染色体上有5个重复;最近的副本位于距离ASPM公司基因。

我们在癌症中寻找与基因组断点相关的几个常见基序(Abeysinghe等人,2003年).图2F显示了这些潜在不稳定寡核苷酸的位置。有趣的是,猩猩特异性缺失(图2B) 其5′断点位于序列上游1 bp处,与chi-like共有基序GCWGGWGG完全相同(参见图S1). chi基序在原核生物中被RecBCD介导的重组途径识别,似乎与人类基因组中的重排有关(Dewyse and Bradley 1991年;Chuzhanova等人,2003年). 猩猩删除中的两个删除断点都位于两个的5′部分内序列,表明该缺失是由同源基因造成的Alu–铝重组。类似的同源重组,其断点位于5′区chi-like基序附近序列如前所述(Chen等人,1989年;Rudiger等人,1995年).

总之,尽管存在一些索引ASPM公司同源物显示出显著的保守性。

ASPM蛋白的进化

我们已经分析了ASPM公司六种灵长类动物的CDS:人类、黑猩猩、大猩猩、猩猩、恒河猴和非洲绿猴(细尾丝虫)。除猩猩和恒河猴外,两只或两只以上ASPM公司CDS用于分析。ASPM蛋白显示出相同的总长度和结构域(图3A) ●●●●。IQ重复域包含相同数量的重复,这表明它们的扩展发生在早期灵长类进化中。正如预期的那样,CDS比带有启动子和内含子区域的完整基因序列更保守(表2;表3). 只发现了六个短indels(图3B) ●●●●。

保存图片、插图等的外部文件。对象名称为pbio.0020126.g003.jpg
的结构ASPM公司灵长类CDS与进化

所有图的比例对应于3480-氨基酸长蛋白比对;CDS中的头寸被相应地缩放。

(A) 人类的结构ASPM公司CDS和蛋白质。第一种方案显示了ASPM蛋白中主要结构域的位置(邦德等人,2002年). 假定的微管结合域为灰色,calponin同源域为橙色,IQ重复域为蓝色,末端域为黑色。CDS外显子的位置在第二块中绘制。为了分离单个外显子,奇数外显子被涂成黑色,偶数外显子被涂成白色。

(B) 蛋白质序列中插入/缺失的位置。坐标对应于人类蛋白质序列。“O”表示猩猩、“G”大猩猩、“M”猕猴、“Gm”非洲绿猴和“OGCH”猩猩-大猩猩-黑猩猩-人类分支。

(C) 类人CDS中相对于共同祖先的替代物。预期的祖先CDS是通过在PAML中实现的ML密码子重建得到的。非洲绿猴和恒河猴是外群。非同义/同义(ω=Ka/Ks)比率在所有分支中自由变化。绿色标记的位置对应于相对于祖先序列的同义变化;红色条表示非同义变化。

(D) 人类祖先血统中的同义(红色)和非同义(绿色)变化。aOGCH–aGCH是猩猩分化到大猩猩分化的祖先血统;aGCH–aCH代表从大猩猩发散到黑猩猩共同祖先的血统。aCH–人类对应于黑猩猩分化后的人类血统。有7个同义词和19个非同义词的人类特定替换。方法和描述与(C)中相同。

(E) 非洲绿猴、大猩猩、黑猩猩和人类不同CDS的多态性碱基位置。绿色标记的位置对应同义多态性,红色条表示非同义位点。括号中有被比较序列的数量;对于人类,我们从GenBank SNP数据库中显示了九个多态性位置(四个同义和五个非同义)。ASPM公司MCPH患者中检测到的突变分别显示在(F)中。

(F) MCPH患者报告的19种突变的位置(Bond等人,2002年;邦德等人,2003年). 所有报告的突变都引入了提前终止密码子。位于CpG二核苷酸内的突变位点以红色突出显示。

(G) CpG二核苷酸在人CDS中的位置。

(H) Ka和Ks比率与密码子适应指数(CAI)的比较。Ka和Ks值适用于所有分支(固定ω比);CAI是所有五种灵长类动物的平均值(注意,这五种动物之间的CAI差异非常小)。窗口设置为300 bp(100氨基酸),步长为30 bp(10-氨基酸)。

(I) 灵长类动物核苷酸和蛋白质水平的保护。Y轴对应于CDS和蛋白质排列中保守(相同)位置的比例。该图使用100个氨基酸长的重叠窗口获得,步骤设置为10个氨基酸。在CDS保存的情况下,窗口为300 bp,步长为30 bp。

表2

的成对标识ASPM公司信用违约互换
保存图片、插图等的外部文件。对象名称为pbio.0020126.t002.jpg

计算了六个CDS的成对恒等式。对角线上方的值显示了去除indels后计算的DNA身份(以百分比表示)。对角线下方是用于与间隙进行比较的值

表3

ASPM蛋白质的配对鉴定
保存图片、插图等的外部文件。对象名称为pbio.0020126.t003.jpg

计算了六个蛋白质序列的配对恒等式。对角线上方的值显示了去除indels后计算的DNA身份(以百分比表示)。对角线下方是用于与间隙进行比较的值

从DNA和蛋白质保存情况来看(图3一) ,ASPM公司片段在CDS长度上的演变不同。N端和C端区域以及对应于外显子5–15的区域是保守的。相反,外显子3和4以及完整的IQ重复域(位置1267–3225)更具变异性。的确,原始灵长类动物中的非同义替换(图3C) 和祖先血统(图3D) 和非同义多态性(图3E) 在保守的中央(外显子5-15)和C末端区域几乎不存在。通过同义Ks和非同义Ka比率图,该模式显示了ASPM蛋白的不同进化速率(图3H) 并得到系统发育分析的支持(见下文和图4). 值得注意的是,灵长类动物和小鼠蛋白质的比较也揭示了ASPM蛋白质上保守区和非保守区的相同模式(图S3).

保存图片、插图等的外部文件。对象名称为pbio.0020126.g004.jpg
完备系统发育树和ω比ASPM公司和三个选定段

对于在PAML中实现的密码子,使用ML方法计算树和ω(Ka/Ka)比率。分支长度表示密码子的ML距离,即使用同义和非同义核苷酸位点,并且在所有分支中ω比率自由变化。所有树都按相同的比例绘制。分支标签标记相应分支的ω比率。方括号中的值显示额外cDNA序列的ω(如果可用)。根据基因组拷贝计算默认值和分支长度。列出了选定的测试假设。ωH(H)代表人类血统中的ω率,ωC类在黑猩猩血统中,ω中国在大猩猩分化后的普通人类-黑猩猩祖先谱系中,ωG公司在大猩猩血统中,ω0在所有其他分支中。单个星号表示第页< 0.05, χ2 1= 3.84; 双星号表示第页< 0.01, χ2 1= 6.63.

(A) 完整的系统发育ASPM公司CDS。除了测试人类血统中不同的ω值外,我们还测试了这样一个假设,即完整的大猩猩-黑猩猩-人类分支以恒定的速度进化,这与树的其他分支不同(与装箱的单比率模型相比)。

(B) ASPM公司从第5外显子到IQ结构域开始的保守片段(氨基酸676–1266)衍生出的系统发育。连接人类和黑猩猩共同祖先与大猩猩-黑猩猩-人类共同祖先的分支没有替代,因此无法计算ω比率。

(C) IQ域(氨基酸1267–3225)。我们还测试了这样一个假设,即大猩猩和人类世系的进化速度相同,与树的其他部分不同(与装箱的单比率模型相比)。

(D) 第18外显子1215-氨基酸长片段(氨基酸1640-2855)中八个灵长类序列的系统发育。我们还测试了这样一个假设,即大猩猩和人类世系的进化速度相同,与树的其他部分不同(与装箱的单比率模型相比)。

对非同义/同义替代比(ω=Ka/Ks)的分析表明,人类分支中的值升高(图4A) ●●●●。根据似然比检验,人类ω率与树中其他部分的ω率显著不同(第页< 0.05). 此外,完整的大猩猩-黑猩猩-人类分支进化速度与树上其他分支不同的模型也得到了很好的支持(第页< 0.01). 因为ASPM公司由具有不同程度序列保守性的区域组成(参见图3),我们分别分析了一个保守区域(外显子5-15加上外显子16的一小部分)和一个可变IQ重复域。可以看出(图4B) 保守区的所有分支都较短,表明整体进化速度较慢。在人类世系中,ω比等于零;然而,对人类分支是否具有与其他分支不同(更低)的ω率的测试并没有产生显著的值。相反,基于可变IQ重复域的树显示人类和大猩猩分支的ω值大于1(图4C) ●●●●。似然比检验支持这样一种模型,即人类和大猩猩谱系的进化ω比明显高于树的其他谱系。两只新世界猴的外显子18和附加序列也获得了类似的结果(图4D) ●●●●。如图所示图4A–4D、 非洲绿猴、大猩猩和黑猩猩个体的不同序列导致其相应末端分支的ω值不同。一个黑猩猩序列的外显子18的ω比也大于1(图4D) ●●●●。值得注意的是,无论是密码子偏向还是第三密码子位置的选择似乎都不会强烈影响同义速率Ks(表S1). 因此,人类和大猩猩的高Ka/Ks比率可能是适应性进化的产物。

通过对非洲绿猴、大猩猩和黑猩猩的两个CDS序列进行排序,我们可以寻找ASPM公司这些物种的多态性(参见图3E) ●●●●。人类多态性数据来自ASPM公司突变单倍型不能代表野生型变异,因此没有用于这些比较。对于非洲绿猴,在两个序列之间发现了五个同义和五个非同义变化。特别是大猩猩和黑猩猩CDS显示出明显的高度替代多态性。大猩猩多态性包括35个点突变(15个沉默突变和21个替换)。黑猩猩序列在5个同义和11个非同义位点上存在差异。为了解释这种看似高水平的观察到的多态性,使用McDonald和Kreitman检验比较了种内多样性和种间多样性(McDonald and Kreitman 1991年). 在黑猩猩多态性与人类差异比较的情况下,我们不能拒绝物种间多态性和差异显著不同的无效假设(William的调整G统计值=0.083,1 d.f.的奇方,不显著;基于PAML生成的Ka和Ks值的值使用自由比模型)大猩猩多态性与大猩猩共同祖先和人类-黑猩猩共同祖先之间的差异进行了比较。在这种情况下,我们可以拒绝零假设(William的调整G统计量=122.45,chi-square with 1 d.f。,第页<0.001),从而得出大猩猩多态性的模式与分化模式不同的结论。事实上,大猩猩的多态性比差异引起的变异小:在物种内,大猩猩ω比率为1.43,而大猩猩共同祖先和人类-黑猩猩共同祖先之间的差异为2.2。种内变异虽然在黑猩猩和大猩猩中表现出如此多的替代替代似乎不太寻常,但与我们观察到的结果不太相符ASPM公司物种之间的分歧。因此,选择的放松并不能解释非洲人种中非同义词/同义词替代率高的原因,这进一步支持了适应发生在ASPM公司。

讨论

在本研究中,我们应用TAR克隆技术来研究ASPM公司基因,该基因参与决定人脑的大小,并在其中突变导致MCPH。这个ASPM公司果蝇中的同源基因对纺锤体功能至关重要,这表明该基因在胚胎神经母细胞的正常有丝分裂中起作用。对五种灵长类动物的完整基因同源物进行了分离和测序。与预测的关键作用一致ASPM公司在大脑发育中ASPM公司同源物在人类、其他人种和旧大陆猴子中表现出明显的保守性。在非编码区中发现的差异是进化年轻人的小插入/缺失和谱系特异性插入元素转化为内含子。

对非同义/同义替换比率的分析表明,ASPM蛋白的进化速度不同:人类和非洲类人猿谱系中,部分ASPM是在正选择下进化的,而其他部分是在负(净化)选择下进化。以前曾描述过其他蛋白质的这种“镶嵌”选择(Endo等人,1996年;Crandall等人,1999年;休斯1999;Kreitman和Comeron 1999). 当我们的工作完成时,张支持人类ASPM加速进化的论文发表了(张2003). 然而,由于作者没有分析大猩猩的同源基因,他得出结论,加速序列进化是人类谱系特有的。我们发现这个选择ASPM公司早在大脑扩张之前就开始了,这表明ASPM公司在类人中可能确实是分子“排斥”的一个例子(Gould和Vrba 1982年),其中最初选择的函数为ASPM公司是为了大脑尺寸以外的东西。

在以下情况下ASPM(澳大利亚体育协会),快速进化的残基主要集中在包含多个IQ基序的IQ重复域,即钙调素结合一致序列。虽然目前还没有直接证据,但很可能人类的功能ASPM公司通过钙调蛋白或类钙调蛋白进行调节。以往对ASPM蛋白的种间比较表明,较大的蛋白大小与较大的大脑大小之间存在一致的相关性,这主要是因为IQ重复的数量(邦德等人,2002年). 例如阿司匹林线虫同源物秀丽隐杆线虫包含两个IQ重复,果蝇智商重复24次,老鼠智商重复61次,人类智商重复74次(邦德等人,2002年).ASPM公司这里研究的非人类灵长类的同源物包含与人类相同数量的IQ重复,这支持了这样的观点,即重复扩展发生在类人猿分化之前(导致了新世界猴子、旧世界猴子和类人),甚至可能更早于灵长类进化。IQ基序存在于多种蛋白质中,但灵长类的ASPM蛋白是独特的,因为它们具有已知数量最多的IQ重复序列。鉴于ASPM公司在调节神经元祖细胞分裂时,IQ重复序列中的重复次数和特定氨基酸替换可能与大脑进化密切相关。

人类ASPM公司导致MCPH的基因突变在基因型和表型之间提供了直接联系。ASPM公司这是不断增加的阳性选择基因列表中的另一个例子,这些基因显示人类谱系的进化加速,并与简单的孟德尔疾病有关(Clark等人2003). 然而,ASPM公司是独特的,因为它独特的加速蛋白质进化模式开始于人类谱系中大脑扩张之前的数百万年。猩猩的绝对大脑大小(雄性430克;雌性370克)与大猩猩(雄性530克;雌性460克)和普通黑猩猩(雄性400克;雌性37克)几乎没有区别(托拜厄斯1971),但加速了ASPM公司进化始于大猩猩、黑猩猩和人类的共同祖先,大约700万至800万年前。直到很久以后,原始人的大脑才开始膨胀,大约在200万到250万年前开始膨胀到400到450克,大约在20万到40万年前增长到目前的1350到1450克(Wood and Collard 1999年). 因此ASPM公司在人类大脑进化的显著表型变化之前,至少在目前研究的水平上是这样。分子变化ASPM公司可能会预测猩猩与大猩猩、黑猩猩和人类在早期神经发生方面存在差异,这可能表现为大脑解剖上的细微差异,而不是大脑体积的总体变化。

ASPM蛋白的进化变化如何影响大脑皮层的大小?一种潜在的机制可能是ASPM的改变导致成神经细胞有丝分裂纺锤体的方向发生改变。正常情况下,神经前体细胞可能具有平行于心室或垂直于心室的有丝分裂纺锤体。子细胞在心室区相邻定向的有丝分裂通常是“对称的”,因为单个祖细胞产生两个祖细胞,导致祖细胞池指数膨胀。相反,产生垂直排列的子细胞的有丝分裂通常是“不对称的”,因此一个子细胞成为有丝分裂后的神经元,而另一个子细胞仍然是祖细胞,只导致细胞数量线性增加。对这种增殖对称性的控制会导致大脑皮层大小的显著改变(Chenn和Walsh 2002)因此,ASPM的变化可以通过细微改变纺锤体取向来调节皮层大小。或者,ASPM的进化变化本身可能不会导致大脑大小的增加,但相反,ASPM可能对确保DNA复制的可靠性和染色体的正确分离至关重要。在啮齿类动物中,数量惊人的大脑皮层神经元是非整倍体(Rehen等人,2001年). 也许定向选择ASPM的特定结构域有助于确保染色体的准确分离,从而形成更多的大脑皮层神经元,而不会产生过高的染色体非整倍体发生率。

功能基因组学研究显然需要阐明受以下因素影响的分子机制的确切性质ASPM公司人类的基因进化。在这里,我们已经证明了TAR克隆在人类和其他灵长类动物进化序列比较中的实用性。此外ASPM公司这些研究中分离出的TAR克隆可以为研究提供有价值的试剂ASPM公司自然序列背景下的基因调控。总的来说,我们预计这项技术将在研究其他可能导致独特人类特征的基因的进化方面极为有用。

注释

相关论文由Evans等人(2004年))发布于人类分子遗传学本文提交后不久。

材料和方法

TAR克隆ASPM公司酵母体内重组的基因同源物

隔离全尺寸ASPM公司人类基因(智人),黑猩猩(泛辉长岩),大猩猩(大猩猩),红毛猩猩(Pongo pygmaeus),和恒河猴(猕猴)构建了含有两个独特钩子的TAR载体。根据现有的人类基因组序列,设计了两个靶向序列,分别为131 bp 5′和151 bp 3′ASPM公司(BAC RP11–32D17[GI:16972838]中的位置155758–155888和92922–93071)。使用两个特异引物从基因组DNA中PCR扩增靶序列(表S2). PCR产物被克隆到基本TAR载体pVC604的多聚体中阿帕I–萨尔我和萨尔I–Xba公司I碎片。在转换实验之前,TAR克隆载体用线性化萨尔我要释放瞄准钩。用琼脂糖塞从黑猩猩、大猩猩、猩猩和恒河猴成纤维细胞培养细胞系(美国新泽西州卡姆登科里尔医学研究所)中制备基因组DNA样本。球形体转化实验如前所述库普里纳和拉里诺夫(1999年). 识别阳性克隆ASPM公司,酵母转化子通过PCR检测,使用的诊断引物特异于第2外显子和第27外显子ASPM公司(表S2). 研究了酵母人工染色体(YAC)的完整性及其在酵母中繁殖期间的稳定性问题。从携带ASPM公司每种灵长类的YAC,其大小由不是我先消化,然后是厨师。每个亚克隆携带一个大小相似的YAC,表明这些克隆在酵母中是稳定的。克隆的轮廓由塔克我消化从转化子中分离出的1μg总酵母DNA。样品通过电泳进行分析,转移到尼龙膜上,并与探查。使用BAC/Neo在酵母中通过同源重组将YAC改造为细菌人工染色体(BAC)R(右)改造向量BRV1,然后转换为记录ADH10B型大肠杆菌应变(库普里纳和拉里诺夫1999). 测序前,BAC中插入物的完整性由不是我,Hin公司dIII,生态RI,以及Pst(磅/平方英尺)我消化。黑猩猩、大猩猩、猩猩和恒河猴(约3.2 kb)的启动子区域和红胡子罗望子的外显子18(唇形Saguinus labiatus)和黑手蜘蛛猴(阿特莱斯·杰夫罗伊)使用一对特异性引物进行PCR扩增(约4.7 kb)(表S2)来自灵长类基因组DNA(科里尔医学研究所),然后进行TA亚克隆以进行进一步测序。

的RT-PCRASPM公司编码区域

从灵长类细胞系(非洲绿猴)中提取RNA[灰胸金龟]肾脏,COS-7[美国型培养物收集中心,美国弗吉尼亚州马纳萨斯],黑猩猩外周淋巴母细胞,EB176[JC],大猩猩外周淋巴细胞,EB[JC][欧洲细胞培养物收集站,英国威尔特郡]),使用TRIzol试剂(美国加利福尼亚州卡尔斯巴德Invitrogen)。使用SMART RACE cDNA扩增试剂盒(BD Biosciences,San Jose,California,United States)进行反转录和5′-和3′-RACE反应。

排序

黑猩猩、大猩猩、猩猩和恒河猴TAR克隆包含全尺寸ASPM公司直接从BAC DNA中测序基因(Polushin等人,2001年). 启动子和外显子18的正向和反向测序以及ASPM公司同源物在PE-Applied Biosystem 3100自动毛细管DNA测序仪(美国福斯特市应用生物系统公司)上运行。cDNA测序引物对的设计基于人类ASPM公司mRNA序列。可根据要求提供引物序列。所有序列均根据克隆/加入标识符命名和编号。

序列分析

使用MAVID对基因组序列进行比对(http://baboon.math.berkeley.edu/mavid/) (Bray and Pachter 2004年); 通过DIALIGN2.1对蛋白质和蛋白质编码DNA序列进行比对(http://bibiserv.techfak.uni-bielefeld.de/dialign(英文)/) (Morgenstern 1999年). 在SEAVIEW编辑器中手动编辑路线(http://pbil.univ-lyon1.fr/software/seaview.html) (Galtier等人,1996年). 我们使用了EMBOSS包中的许多程序(http://www.hgmp.mrc.ac.uk/Software/EMBOSS/)用于序列分析。使用FUZZNUC(EMBOSS)搜索与基因组重排相关的短核苷酸模式。我们搜索了以下重组基序:chi-like octamer(GCWGGWGG)、immunoglobin heptamer(GATAGTG)、translin(ATGCAGN(0,4)GCCCWSSW和GCNCWSCTN(0,1)GCCCWS)、拓扑异构酶II(RNYNNNGKNYY)、拓朴异构酶IId(GTNWAYATTNATNR)、拓扑异构酶Ⅱi(YYCNTASYGGKYTNC)和V(D)J重组酶(CACACACAGTN(12/23)ACAAAACC)。对于简短或高度模糊的模式(拓扑异构酶II),不允许出现错配;对于较长的基序(translin,V(D)J重组酶),最多允许两个错配。通过CPGPLOT(EMBOSS)使用默认参数(长度≥200;CpG/GpC≥0.6;GC≥0.5)预测CpG岛。CENSOR标准(http://www.girinst.org/Censor_Server-Data_Entry_Forms.html) (Jurka等人,1996年)和REPEATMASKER(http://repeatmasker.genome.washington.edu/cgi-bin/repeatmasker; 由A.F.A.Smit和P.Green开发)用于识别重复元素。TANDEM REPEAT FINDER探测到小型卫星(本森1999).ASPM公司通过局部BLAT搜索检测到人类基因组中的片段重复(http://genome.ucsc.edu/cgi-bin/hgBlat) (肯特2002). 首先,我们使用ASPM公司掩盖所有重复的基因组序列以检测片段重复。然后通过BLAT与Full(即,包含重复)对齐获得全尺寸复制ASPM公司序列。灵长类CDS是根据ASPM公司基因与人类序列的比对。SNAP检测到同义和非同义替换(http://www.hiv.lanl.gov/content/hiv-db/SNAP/WEBSNAP/SNAP.html). PAML v.3.13中CODEML中的密码子最大似然(ML)(http://abacus.gene.ucl.ac.uk/software/paml.html) (杨1997)已应用于系统发育树重建、祖先序列重建和阳性选择检测。使用单个分支的自由ω比重建分支长度和祖先序列。似然比检验的方法在别处描述(杨1998). 对于大型比对,PAML的初始输入树由PHYLO_WIN中实现的ML估计(http://pbil.univ-lyon1.fr/software/phylowin.html) (Galtier等人,1996年). 通过在同一程序中实现的邻接方法对分段重复进行聚类。PAUP中计算了用于检测种内/种间多样性的距离测量值(Swofford,D.L.2003)。PAUP v.4.0b10;Sinauer Associates,美国马萨诸塞州桑德兰;http://paup.csit.fsu.edu/index.html)并使用Tamura-Nei算法对多次替换进行校正。

支持信息

评论

对密码子使用进行选择可以通过降低同义替换率来增加ω比率(夏普和李1987, 1989). 因此,我们测试了CAI之间的相关性(夏普和李1987)同义替换率(Ks)。我们发现测试变量之间没有显著关联。此外,物种间比较表明,所有比较物种的CAI几乎相同,人类或大猩猩的CAI没有超过其他物种(数据未显示)。另一方面,CAI与蛋白质和DNA鉴定均呈显著负相关。偏相关分析表明,Ka与CAI之间的显著正线性相关仅仅是由Ka与DNA和蛋白质特性之间的强负相关引起的。当我们控制同一性时,Ka和CAI之间的相关性消失了(数据未显示)。这些结果可能表明,在正选择的位点上,蛋白质变化优先于密码子使用的优化,因此导致氨基酸替换的突变不会立即产生最佳密码子。应该注意的是,哺乳动物对密码子用法的选择似乎普遍放宽(Duret和Mouchiroud 2000). 哺乳动物密码子的使用以及非同义取代率可能会因选择有利于第三密码子位置(GC3)的高GC含量(甚至G和C饱和)而产生偏差(伯纳迪和伯纳迪1985;Aota和Ikemura 1986). 然而,ASPM公司是一个富含AT的基因(GC含量36.4%–37%),如预期(伯纳迪和伯纳迪1985;Aota和Ikemura 1986),第三密码子位置也富含AT(GC3含量,30.6%–31.4%),因此远未饱和。总之,无论是密码子偏向还是第三密码子的选择似乎都不会强烈影响同义速率Ks。因此,人类和大猩猩的高Ka/Ks比率可能是适应性进化的产物。

图S1

猩猩特有818-bp-长删除中的重组断点:

两个猩猩断点均位于两个断点的5′处元素。序列守恒的标志是不同的灰度。两者都有将元素与其对应的元素进行比较AluSp公司AluSz公司亚家族一致序列。位于5′断点下游1 bp处的大猩猩、黑猩猩和人类序列与chi-like八聚体一致序列GCWGGWGG完全匹配(第一个方框中,与chi一致序列匹配的位置以黑色显示)。另一方面,3′断点序列偏离了chi共识(第二个方框)。两者都有排列中的元素从第一个位置开始显示,并在同一位置结束,因此一个元素中的位置对应于另一个元素中的位置副本。可以看到,第一个AluSp公司repeat与第二个中的断点位置完全对应AluSz公司元素,表明两个重复序列之间存在同源重组。

(163 KB PDF)。

图S2

第四个内部内含子的片段重复:

从左到右:系统发育、染色体位置、带名、身份到ASPM公司片段(百分比相同),以及片段重复的示意性对齐。这个ASPM公司片段(黑色)与24个片段重复具有相似性,这些片段重复包含额外的序列,并且存在于几个人类染色体上。这个ASPM公司7号染色体上的拷贝和三个重复是相同的L1P4页端子插入,这是所有其他复制中都没有的。左边的树显示了由邻接法估计的重复之间的进化关系。

(169 KB PDF)。

图S3

小鼠和人类ASPM蛋白质的比较:

外显子3、外显子4和IQ结构域的保守区氨基酸同源性分别为85.44%、49.39%和68.74%。此外,虽然保守区域的排列完全没有间隙,但可变域显示出几个间隙,包括小鼠IQ域(人类位置2655–2943)中的大量缺失。

(97 KB PDF)。

表S1

本工程中使用的底漆:

大写字母表示序列与ASPM公司小写字母表示克隆站点。

(118 KB PDF)。

表S2

CDS和蛋白质相关性:

所有相关性都是在相同的100-氨基酸-/300-核苷酸长度的非重叠窗口下获得的。第一个值表示相关系数;第页-值在括号中。对角线上的截面使用皮尔逊(线性)相关系数计算;对角线下是使用斯皮尔曼秩系数(非参数)获得的相关性。非平凡或有趣的显著相关性以粗体和斜体显示。CAI表示所有物种的平均值(单个物种的CAI值几乎相同)。ω比率、Ka和Ks(行/列2、3和4)对应于系统发育树的所有分支。它们是通过对所有分支使用一个固定ω比的ML模型获得的。

接入号码

GenBank(http://www.ncbi.nlm.nih.gov/Genbank/)人类登录号ASPM公司本研究中使用的mRNA序列是NM_018136号黑猩猩、大猩猩、猩猩和恒河猴全长序列数据ASPM公司已以加入号提交给GenBankAY497016型,2015年7月7日,AY497014型、和AY497013型黑猩猩、大猩猩和非洲绿猴的序列数据ASPM公司cDNA已以登录号提交给GenBankAY508452年,AY508451型、和AY486114型蜘蛛猴和罗望子第18外显子的序列数据已按登录号提交给GenBankAY497017号AY497018型.

缩写

美国银行细菌人工染色体
计算机辅助教学密码子适应指数
客户尽职调查编码序列
MCPH公司原发性小头畸形
毫升最大似然
SNP公司单核苷酸多态性
焦油转化相关重组
游艇酵母人工染色体

利益冲突。提交人声明,不存在利益冲突。

作者贡献。NK、JCB、CGW、CAW和VL构思并设计了实验。NK、GHM、GS、WG和Y-H Y进行了实验。AP、GHM、RC、MR、CGW、JJ和VL分析了数据。AP和GS提供了试剂/材料/分析工具。NK、AP、MR、JCB、CAW、JJ和VL撰写了论文。

学术编辑:Joseph Hacia,南加州大学

工具书类

  • Abeysinghe SS、Chuzhanova N、Krawczak M、Ball EV、Cooper DN。人类遗传性疾病和癌症中的易位和总缺失断点。一: 核苷酸组成和重组相关基序。哼,变种。2003;22:229–244.[公共医学][谷歌学者]
  • Aota S,Ikemura T.脊椎动物基因密码子第三位G+C含量的多样性及其原因。核酸研究。1986;14:6345–6355. [PMC免费文章][公共医学][谷歌学者]
  • Benson G.Tandem repeats finder:一个分析DNA序列的程序。核酸研究。1999;27:573–580. [PMC免费文章][公共医学][谷歌学者]
  • 伯纳迪G、伯纳迪G.密码子的使用和基因组组成。分子进化杂志。1985;22:363–365.[公共医学][谷歌学者]
  • Bond J、Roberts E、Mochida GH、Hampshire DJ、Scott S等。ASPM是大脑皮层大小的主要决定因素。自然遗传学。2002;32:316–320.[公共医学][谷歌学者]
  • Bond J、Scott S、Hampshire DJ、Springell K、Corry P等ASPM公司导致大脑大小的可变减少。美国人类遗传学杂志。2003;73:1170–1177. [PMC免费文章][公共医学][谷歌学者]
  • Bray N,Pachter L.MAVID:多序列的受限祖先比对。基因组研究。2004(印刷中)[PMC免费文章][公共医学][谷歌学者]
  • Chen SJ,Chen Z,d'Auriol L,Le Coniat M,Grausz d,et al.Ph1+bcr−急性白血病:染色体易位中发生在新簇区的序列业务连续性审查基因。致癌物。1989;4:195–202.[公共医学][谷歌学者]
  • Chenn A,Walsh CA。通过控制神经前体细胞周期退出来调节大脑皮层大小。科学。2002;297:365–369.[公共医学][谷歌学者]
  • Chuzhanova N、Abeysinghe SS、Krawczak M、Cooper DN。人类遗传性疾病和癌症中的易位和粗略缺失断点。二: 重复序列元素在DNA末端二级结构形成中的潜在参与。哼,变种。2003;22:245–251.[公共医学][谷歌学者]
  • Clark AG、Glanowski S、Nielsen R、Thomas PD、Kejariwal A等。从人类-黑猩猩-小鼠同源基因三组推断非中性进化。科学。2003;302:1960年至1963年。[公共医学][谷歌学者]
  • Crandall KA,Kelsey CR,Imamichi H,Lane HC,Salzman NP。HIV耐药性的平行演变:非同义/同义替代率比率检测选择失败。分子生物学进化。1999;16:372–382.[公共医学][谷歌学者]
  • Dewyse P、Bradley WE。aprt公司CHO细胞中的基因座:与小细胞的序列相似性aprt公司删除。体细胞分子遗传学。1991;17:57–68。[公共医学][谷歌学者]
  • 做Carmo Avides M,Tavares A,Glover DM。Polo激酶和Asp是促进中心体有丝分裂组织活性所必需的。自然细胞生物学。2001;:421–424.[公共医学][谷歌学者]
  • Duret L,Mouchiroud D。哺乳动物基因替代率的决定因素:表达模式影响选择强度,但不影响突变率。分子生物学进化。2000;17:68–74.[公共医学][谷歌学者]
  • Endo T,Ikeo K,Gojobori T。大规模搜索可以进行正向选择的基因。分子生物学进化。1996;13:685–690.[公共医学][谷歌学者]
  • Evans PD、Anderson JR、Vallender EJ、Gilbert SL、Malcom CM等。ASPM的适应性进化,人类大脑皮层大小的主要决定因素。人类分子遗传学。2004;13:489–494.[公共医学][谷歌学者]
  • Galtier N、Gouy M、Gautier C.C.SEAVIEW和PHYLO_WIN:两种用于序列比对和分子系统发育的图形工具。计算应用生物科学。1996;12:543–548.[公共医学][谷歌学者]
  • Gould SJ,Verba ES。考试:形式科学中的一个缺失术语。古生物学。1982;8:4–15. [谷歌学者]
  • 休斯AL。哺乳动物防御素的进化多样性。细胞分子生命科学。1999;56:94–103. [PMC免费文章][公共医学][谷歌学者]
  • Jurka J、Klonowski P、Dagman V、Pelton P.CENSOR:DNA序列中重复元素的识别和消除程序。计算机化学。1996;20:119–121.[公共医学][谷歌学者]
  • 肯特·WJ。BLAT:类似BLAST的对齐工具。基因组研究。2002;12:656–664. [PMC免费文章][公共医学][谷歌学者]
  • Kouprina N,Larionov V.纽约:John Wiley and Sons,Inc;1999.通过TAR克隆选择性分离哺乳动物基因。In:人类遗传学的当前协议。第1卷;第5.17.1–5.17.21页。[公共医学][谷歌学者]
  • Kouprina N,Larionov V.利用酿酒酵母研究复杂基因组的组织。FEMS微生物版。2003;27:629–649.[公共医学][谷歌学者]
  • Kreitman M,Comeron JM。编码序列进化。当前操作基因开发。1999;9:637–641.[公共医学][谷歌学者]
  • McCreary BD、Rossiter JP、Roberston DM。隐性(真实)小头畸形:一例神经病理学观察病例报告。智能禁用研究杂志。1996;40:66–70。[公共医学][谷歌学者]
  • McDonald JH,Kreitman M.在Adh公司基因座果蝇属.自然。1991;351:652–654.[公共医学][谷歌学者]
  • Mochida GH,Walsh CA。人类小头畸形的分子遗传学。神经醇电流。2001;14:151–156.[公共医学][谷歌学者]
  • Morgenstern B.B.DIALIGN 2:改进多序列比对的分段到分段方法。生物信息学。1999;15:211–218.[公共医学][谷歌学者]
  • Noskov VN、Leem S-H、Solomon G、Mullokandov M、Chae J-Y等。基因同源物和片段基因组复制分析的新策略。分子进化杂志。2003;56:702–710.[公共医学][谷歌学者]
  • Polushin N,Malykh A,Malykh O,Zenkova M,Chumakova N等。甲氧基恶酰胺和琥珀酰亚胺前体的2′-修饰寡核苷酸:合成、性质和应用。核苷核苷核酸。2001;20:507–514.[公共医学][谷歌学者]
  • Rehen SK、McConnell MJ、Kaushal D、Kingsbury MA、Yang AH等。发育期和成年哺乳动物神经系统神经元的染色体变异。美国国家科学院程序。2001;98:13361–13366. [PMC免费文章][公共医学][谷歌学者]
  • Riparbelli MG、Callaini G、Glaves DM、do Carmo Avides M。异常纺锤体蛋白组织中央纺锤体微管以进行胞质分裂的需要果蝇属.细胞科学杂志。2001;115:913–917.[公共医学][谷歌学者]
  • Ripoll P、Pimpinelli S、Valdivia MM、Avila J果蝇属主轴功能异常。单元格。1985;41:907–912.[公共医学][谷歌学者]
  • Roberts E、Hampshire DJ、Pattison L、Springell K、Jafri H等。常染色体隐性原发性小头畸形:基因座异质性和表型变异分析。医学遗传学杂志。2002;39:718–721. [PMC免费文章][公共医学][谷歌学者]
  • Rudiger NS、Gregersen N、Kielland-Brandt MC-序列参与人类基因重排,与原核chi具有同源性。核酸研究。1995年;23:256–260. [PMC免费文章][公共医学][谷歌学者]
  • 夏普PM,李伟。肠杆菌基因的同义替换率与密码子使用偏好呈负相关。分子生物学进化。1987;4:222–230.[公共医学][谷歌学者]
  • 夏普PM,李伟。关于DNA序列进化速率果蝇属.分子进化杂志。1989;28:398–402.[公共医学][谷歌学者]
  • 托拜厄斯光伏。北特兰斯瓦尔马卡潘斯加特炉洞出土的人类骨骼遗骸。Am J Phys人类学杂志。1971;34:335–367。[公共医学][谷歌学者]
  • Wood B,Collard M。人类属。科学。1999;284:65–71.[公共医学][谷歌学者]
  • PAML:一个基于最大似然法的系统发育分析程序包。计算应用生物科学。1997;13:555–556.[公共医学][谷歌学者]
  • Yang Z.检测阳性选择的似然比测试及其在灵长类溶菌酶进化中的应用。分子生物学进化。1998;15:568–573.[公共医学][谷歌学者]
  • 张杰。人类的进化ASPM公司基因是大脑大小的主要决定因素。遗传学。2003;165:2063–2070. [PMC免费文章][公共医学][谷歌学者]

文章来自PLOS生物学由以下人员提供多环芳烃