跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
公共科学图书馆计算生物学。2006年4月;2(4):e38。
2006年4月28日在线发布。2006年3月15日在线预发布。 数字对象标识:10.1371/journal.pcbi.0020038
PMCID公司:项目经理1447656
PMID:16683019

人类和黑猩猩基因组进化中的正向选择、放松和加速

大卫·希利斯,编辑器

关联数据

补充资料

摘要

多年来,进化生物学家一直对寻找人类的遗传基础感兴趣。最近,人们在大规模或全基因组范围内进行了努力,以在人类和黑猩猩中寻找阳性选择的基因。然而,可以采用最近开发的方法,以便在检测阳性选择时采用更灵敏和更可控的方法。在这里,我们使用13198个基因,推导了自与murids分化以来,人类、黑猩猩及其祖先谱系中与速率加速、正选择和选择性约束放松有关的基因集。在469个人类和651个黑猩猩基因中观察到与严格的分子钟有显著差异。更严格的阳性选择分支位点测试检测到108个人类和577个黑猩猩阳性选择的基因。积极选择的基因中有很大一部分没有显示出显著的加速率,同样,许多加速基因也没有显示出积极选择的显著信号。人类和黑猩猩在速率加速、正选择和松弛下的基因功能分化在统计学上不显著,但与G蛋白偶联受体感觉知觉与黑猩猩相比,这两种动物在人类中表现得过于松弛。比较衍生血统和祖先血统之间的差异,趋势上更明显的变化似乎有利于人类血统中的正向选择。由于大多数阳性选择基因在这些物种之间的相同功能类别下是不同的,我们建议,替代阳性选择基因的个体作用可能是这些物种之间生物学差异的重要因素。

简介

自从人类和黑猩猩基因组发表以来,进化生物学中的一个主要挑战开始被破译:即寻找塑造人类的积极选择基因。Arbiza及其同事对人类、黑猩猩及其共同祖先血统中已被阳性选择的基因进行了基因组规模的搜索。他们得出结论,黑猩猩的正选择事件发生频率是人类的六倍,尽管它们不属于两个物种中优先选择的特定功能类别。然而,在比较祖先和后代血统之间的进化趋势时,他们发现,普通阶级中的大多数相对差异表明人类分支上存在大量的正向选择。通过区分正选择和放松选择约束,两者都在基因组中产生类似的足迹,他们证明了许多以前被认为是正选择的基因对应于可能的放松情况。最后,他们量化了使用基于平均速率的方法来集中这些物种的适应性进化案例所产生的偏差。

介绍

多年来,进化生物学家一直有兴趣了解自然选择和遗传漂变在多大程度上影响了种群和物种的遗传变异[15]. 中立性测试为发展有关这个问题的假设提供了强有力的工具。相关研究的第一个目标是对分子进化的原因进行一般推断,并且已经做出了许多努力来寻找与分子钟假说的偏差。然而,在过去的十年里,重点已经转向寻找显示正选择的分子事件(PS)[6].

PS是有利于在人群中保留那些有利于个体繁殖成功的突变的过程。与这个过程相反,分子钟假说[7,8]假设分子序列的进化速率随时间大致不变。这一观察结果被视为中性突变假说的有力证据[]它假设进化中的大多数分子变化都是由中性或接近中性的突变引起的[2]. 随着可用于比较基因组研究的框架不断扩大,在基因组水平上测试阳性(或阴性)选择的中立性成为可能。

最近,通过比较速率差异和PS与其他完全测序物种的差异,在大范围或基因组范围内进行了研究,以阐明人类进化的复杂性。在最近的一项工作中,Dorus等人[9]与家政管理和脑特异性基因亚群相比,发现灵长类神经系统中的基因进化率明显更高。根据这些数据,他们提出自然选择是潜在的机制。其他工作重点是寻找PS.Clark等人的直接分子证据[10]尼尔森等人(Nielsen et al[11]使用13000多个同源序列,发现733个基因偏离了严格的中性,显示出PS的证据。在撰写本文时发表的最新基因组研究中,黑猩猩测序与分析协会(CSAC)在13454个人类-黑猩猩同源基因中发现585个可能被PS作用,表明Ka/Ki>1[12].

事实上,尽管这三份出版物已成为基因组水平上研究PS事件的标志,并对该主题提供了很多见解,但所用方法的组合产生了某些分歧,并留下了一些重要的考虑因素。正如CSAC出版物中所指出的那样,如果允许净化选择不一致地起作用,那么所观察到的585个基因组可能仅在PS病例中得到丰富,例如,在这些基因中,所使用的Ka/Ki统计值可能会偶然大于1[12]. 克拉克等人[10],用于PS的分支测试允许区分人类和黑猩猩分支中的血统特异性选择案例,其他作者对此提出了批评,因为它可能因为缺乏区分PS真实案例和放松选择约束(RSC)案例的测试能力而包含假阳性[12,13]. Nielsen等人的研究[11]除了50个分析基因中的一小部分外,该基因是基于成对比较的,这使得我们不可能知道这些谱系中发生了哪些选择。此外,在所有这些研究中,尚未将PS下的基因集与可能患有RSC的基因集进行区分,也未专门用于研究。

最后,值得注意的是,这里和之前一些研究中使用的似然比测试对模型假设很敏感[13,14]. 虽然本研究中使用的测试在各种条件下都表现良好[14],我们倾向于从保守的角度解决PS下基因组基因集的定义。因此,虽然这些研究中的一些研究仅考虑了比较后针对特定病例观察结果的多重检验修正,但我们采用了将多重检验修正作为所有比较的标准的方法,同时考虑了未修正集以在适当情况下确认特定结果。

因此,关于显示加速、RSC和PS的基因的身份和功能作用的许多重要问题仍然存在:哪些基因可以以相当高的灵敏度和置信度分配给这些集合?这些基因在功能上是否在物种之间存在显著差异?这些基因是否包含一组特殊的功能类别,或者它们是基因组的无偏见代表?阳性选择基因集(PSG)与加速基因集的差异程度如何?有多少PSG可以与RSC区分开来?此外,通过比较衍生物种的适应模式和其祖先血统的适应模式,我们能获得更多的见解吗?

所有这些问题只能通过对人类、黑猩猩及其共同祖先的中性理论进行独立测试来回答,使用PS敏感测试,同时纠正多次测试。在这项研究中,为了回答所有这些问题,我们利用黑猩猩、小鼠、大鼠和狗的现有同源基因,搜索了最完整的人类基因集。

与以前的分支测试相比,本文中使用的PS的两个分支最大似然(ML)测试具有较高的灵敏度,并且可以一起使用,如最近所示[14]在一种允许检测谱系特异性事件的方法中,同时区分PS的真实病例和RSC的可能病例。这两种测试都基于两种替代模型拟合序列数据的可能性的比较。测试I将近似中性零模型(M1a)与替代PS模型(A)进行比较。M1a假设在系统发育的所有谱系中,在纯化选择和中性进化下进化的两个密码子位点类别。模型A考虑了在所有分支(背景谱系)上保持或中性进化的另外两个站点类,但在测试PS的指定分支(前景谱系)除外。测试II将空模型(A1)与替代模型A进行了比较。模型A1中的参数与模型A的参数相等,但前台的两个额外站点类仅允许中性演变。正如Zhang等人所证明的那样[14],测试一不能适当区分RSC的情况和PS的真实事件,而测试二能够作出这种区分。因此,可以比较两种测试的结果,以区分PS病例和可能的RSC病例。

这是第一次比较基因组研究,其中推导出了在物种形成事件之前和之后人类基因组中发生的与PS和RSC过程有关的谱系特异性事件,这些事件将我们与最接近的活物种区分开来。

结果

验证分子时钟假说

相对速率测试。

分析从30.35c版集成人类数据库中的30709个完整基因开始。对这些基因进行筛选,以删除所有尚未通过Swiss-Prot、RefSeq或SPTreEMBL定位确认的基因,并保留20469个基因,这些基因以这种方式获得了集合已知基因状态。在Ensembl-Compara数据库(版本30)中对这组基因的直系图注释进行检查,得到14185个人类基因,在黑猩猩、小鼠、大鼠和狗中具有直系图预测,相当于已知Ensembl人类基因组的69%。在按长度和极高进化速率筛选序列后,通过相对速率测试(RRT)分析了13197个基因(参见表S1). 使用Ka和Ks速率(Ka-RRT,Ks-RRT)评估人类和黑猩猩之间速率的进化差异。959(7.3%)个基因出现速率饱和。在RRT分析后,发现844个(6.4%)人类基因和1260个(9.5%)黑猩猩基因与分子钟存在显著偏差。多次测试修正后(第页<0.05),人类和黑猩猩保留的基因数分别为469和651。

一项更详细的分析显示,65个(0.5%)基因的Ka和Ks测试均存在显著偏差,其中18个基因在人类中的进化速度相对快于黑猩猩(HF),47个基因在黑猩猩中的进化相对快于人类(ChF)。值得注意的是,HF和ChF术语代表相对而非绝对的费率定义。黑猩猩(477和99)的基因数量(仅Ka或仅Ks)显著高于人类(352和83)。RRT显示,更多的基因在非同义(938)而非同义变化(247)中显著加速。在两个物种中,显示非同义与同义比率加速的基因数量比例相似,超过三倍(约3.8)。这种偏倚间接证明了哺乳动物已经具有的生物钟过度分散的特征,这表明蛋白质进化不能用简单的中性进化模型理论来解释[1,15].

基因和物种的比率差异。

表1显示了从RRT中获得的基因组的平均值,与分子钟假设存在显著偏差。它们是根据突变(Ka和Ks)排列的第页-为多次试验调整的数值,以及两个可选的加速度方向(HF或ChF)。

所有基因中的大部分都属于非同义突变导致进化变化率最高的一类(第页< 0.001,第页 第页=高英寸表1)这表明PS在人类和黑猩猩中的存在是一种有利的情况。Kolmogorov–Smirnov(K–S)检验对平均归一化率差异(rKi in表1)检测到中等rKa类别有利于人类,而低rKs类别有利于黑猩猩的显著差异(第页< 0.05). 当比较两个物种中没有时钟行为的全套基因时,这些微小差异不足以产生净显著差异。

表2显示了使用拓扑加权外群估计的人类和黑猩猩的平均进化速率,在两个备选数据集中以小鼠、大鼠和狗为参考。一方面,仅使用显示出显著RRT差异的基因组,人类非同义进化率的平均估计值(Ka=0.079)慢于黑猩猩(Ka=0.088),尽管差异不显著(第页= 0.13). 同样的情况也发生在同义的利率变化上(第页= 0.24). 黑猩猩与人类的相对进化速率(R on表2)Ka为1.11,Ks为1.08。另一方面,当考虑全套过滤的同源基因时,人类每个位点的平均替代率为Ka=0.086和Ks=0.430,黑猩猩为Ka=0.077和Ks=0.432。物种间Ka和Ks的速率差异同样不显著。物种之间的平均Ka/Ks比率相似,代表完整基因组的一组基因的平均Ka/Ks比率略高于那些表现出明显时钟行为偏差的基因(0.20比0.18)。这是因为在与时钟有显著偏差的基因上观察到的平均Ks比率相对增加(表2).

表2

人类和黑猩猩的进化速率

保存图片、插图等的外部文件。对象名称为pcbi.0020038.t002.jpg

使用PAML计算人类分支和黑猩猩分支进化速率的ML估计[16]并与CSAC最近获得的数据进行比较[12]. 虽然我们对人类(Ka=0.0014,Ks=0.0063 vs.CSAC:Ka=0.0013,Ks=0.0062)和黑猩猩(Ka=0.015,Ks=0.0066 vs.CSAC:Ka=0.0012,Ks+0.0060[12]. Ka/Ks>1的基因总数在人类为445个,在黑猩猩为539个,分别占基因总数的5%和6%,采用可测量的ML估计比率。

人类和黑猩猩加速基因的功能分析。

使用人类基因本体(GO)术语[17],我们关注的是人类基因组内以及两个谱系之间加速的基因组中是否存在任何功能差异。黑猩猩的GO术语是根据相应的人类直系亲属推导出来的。

表3显示了与人类和黑猩猩基因在同义和非同义变化中加速的GO水平6生物过程相对应的主要GO术语。显示了Ka和Ks分析中最重要的项。该表是根据人类非同义加速基因集合中5%以上的术语排列的(第1列)。表中未显示的5%以上的其他术语确实在其他类别中观察到(见数据集S1获取完整的术语列表)。例如,阳离子运输在编码序列的基因列表中,通过非同义性变化,黑猩猩的进化速度快于人类(6.78%)。其他条款,如RNA代谢、DNA代谢、蛋白质代谢调节、程序性细胞死亡调节、蛋白质分解代谢,细胞碳水化合物代谢对应于一些人类序列,而黑猩猩序列因同义词变化超过5%而加速。

表3

偏离分子钟的基因的功能分析

保存图片、插图等的外部文件。对象名称为pcbi.0020038.t003.jpg

为了找出人类和黑猩猩之间是否存在过度或低估的GO术语,Fisher精确测试第页-使用FatiGO运行多次测试修正值[18,19]. 对编码序列通过非同义变化进化的HF和ChF基因进行的测试,以及对同义基因的测试,均未报告在任何水平(GO水平3-6)上GO术语表示存在任何显著差异。我们的结论是,在两个物种之间,在没有时钟行为的基因集合中,功能GO类别没有统计上的显著差异。最后,我们测试了加速人类基因在功能方面代表人类基因组无偏见样本的假设。同样,与基因组的其他部分相比,在加速的人类基因中,没有发现GO术语被显著高估或低估。

总之,我们没有检测到人类和黑猩猩显著加速基因之间的GO项差异分布。此外,人类体内加速的功能集合并不代表人类基因组中具有功能特殊性的基因的特殊子集。

测试人类和黑猩猩血统的适应性。

用于时钟测试的一组基因也用于分析PS的信号。丢弃那些具有少于三个独特碱基对差异的基因后,9674个人类-黑猩猩-老鼠-老鼠-狗的同源序列仍然存在。然后利用测试I和测试II分析该组PS的信号,当相互结合使用时,可用于区分RSC和PS的真实事件[14]. 这两项测试都是在人类和黑猩猩血统上进行的,当考虑到更严格的测试II时,获得了146个(1.51%)人类和672个(6.95%)黑猩猩基因。多次测试修正后(第页<0.05)、108(1.12%)和577(5.96%)基因在人类和黑猩猩中仍然存在,并被视为在各自基因组中发生PS的真实案例。

PSG的功能分析。

表4显示了与使用测试II在人类和黑猩猩中检测到的PSG集相关的主要GO项,以及与祖先血统相比,这两个物种在PS下的基因集GO项表示的差异(参见数据集S1获取完整的术语列表)。如前所述,所示术语为人类PSG(H-PSG)中5%以上的术语。

表4

PSG的功能分析

保存图片、插图等的外部文件。对象名称为pcbi.0020038.t004.jpg

最初,当直接比较人类和黑猩猩的术语表示时,很明显,通过对频率的微小修改,H-PSG显示出了与黑猩猩(Ch-PSG)几乎相同的一组生物功能。值得注意的是,在这一比较中,两个谱系之间的基因代表性差异最大的术语如下G蛋白偶联受体(GPCR),感觉、电子传递、整合素介导的信号通路、炎症反应,细胞蛋白质代谢,在其他中。除了细胞蛋白质代谢,黑猩猩的死亡率更高。尽管最大的差异在4%到15%之间,但在任何水平上都不显著(GO水平3–6)。同样,在H-PSG与人类基因组其余部分的比较中,没有显著的术语过度或不足。然而,值得注意的是,至少有一个明显的区别:两个物种之间只有少量的同源PSG是共同的(N中的列表4). 这表明,在物种形成之后,同一功能类别下不同基因的PS驱动进化是最常见的模式。

当从PS下人类和黑猩猩的功能GO类别的直接比较角度转换到基于祖先世系和每个相应衍生物种之间观察到的相对差异的角度时,更显著的差异变得明显。中的H-AH和Ch-AH柱表4分别显示了人类和黑猩猩的衍生血统和祖先血统在GO类别表示上的差异。PSG的表示G蛋白偶联受体,感觉,细胞碳水化合物代谢与祖先血统相比,人类血统增加(+值),而黑猩猩减少(−值)。以类似但相反的方式细胞蛋白质代谢、转录及其调节,调节碱基、核苷和核苷酸代谢,细胞碳水化合物代谢黑猩猩相对增加,而人类相对减少。从这个角度来看,我们可以观察到仅从衍生血统之间的直接比较中无法辨别的差异:一些术语相对于两个物种的祖先增加或减少,其他术语在人类和黑猩猩中发生了相反的变化。PS下功能类别分布中观察到的最大相对差异(H-AH和Ch-AH之间>10%)仅对应于三个类别:细胞蛋白质代谢黑猩猩的自然选择相对偏爱G-偶联蛋白受体信号通路感官感知,在人类中比较受欢迎。最后,在其他GO类别中观察到的相对差异表4低于5%。

PS和非同义速率加速

人们认为,在非同义词比率上表现出加速的基因很可能集中于PS病例表3和44揭示了两个流程下大多数代表GO类别之间的显著差异。而四个GO类别中,每个类别都包含50多个基因,且具有显著的非同义加速(表3),在这两个物种中PS代表性最高的物种中(表4),条款G偶联蛋白受体信号通路感觉知觉在非同义词比率显著增加的人群中没有。为了理解在基于Ka比率的方法和测试II中观察到的阳性数量的这些和其他主要差异,非同义比率差异(dKa=Ka小时−卡中国)研究了物种间非同义词比率的平均归一化差异(rKa=dKa/sd)和归一化非同义率(Ka/Ks)。

图1显示了那些在Ka-RRT(“分子钟”)中存在显著和非显著差异的基因的rKa与dKa值的分布图1). 在这种分布下,已经标记了四个备选组:显示1)PS和Ka/Ks>1(红色圆圈)的组,2)PS和Ka/Ks<1(蓝色圆圈),3)Ka/Ks>1,没有PS的证据(黑色星号),以及4)Ka/K s<1,没有PS的证据(灰色圆圈)。

保存图片、插图等的外部文件。对象名称为pcbi.0020038.g001.jpg
PS和进化速率

Ka/Ks>1的基因中有一小部分与人类和黑猩猩的PS事件相匹配(红圈)。许多Ka/Ks<1的基因显示PS(蓝圈)。Ka/Ks>1但没有PS(黑色星号)证据的基因大多处于非同义变化的分子钟条件下(红色虚线下方的圆圈)。大多数没有PS和Ka/Ks<1(灰圈)证据的基因分散在边界限制分子钟样行为下方,当不满足分子钟条件时,在dKa<0.0006时观察到。时钟条件外的基因和dKa>0.0006大多与两个物种的PS事件一致(虚线上方的红色和蓝色圆圈)。dKa和rKa定义见表1.

分析中考虑的Ka/Ks>1的基因总数图1人类为336人(黑猩猩为437人),其中22(86)人有PS的证据图1)只有五(18)个在Ka速率(折线上方的圆圈)上显示出与分子钟的显著偏差。或者,阳性选择了Ka/Ks<1的58个人类(407只黑猩猩)基因(蓝色圆圈)。这表明,72%的阳性人类基因没有显示Ka/Ks>1(黑猩猩为82%)。同样,314(93%)人和351(80%)黑猩猩的基因显示Ka/Ks>1,但没有显示PS(黑色星号)的证据。请注意,大多数这些基因的进化都没有与时钟行为产生非同义偏差的迹象,这表明Ka/Ks>1的这些值对应于中性进化模型下的变异。事实上,许多基因在钟状行为下显示出PS的证据(折线下方的红色和蓝色圆圈),这表明了所采用的分支测试的高度敏感性,其中一些氨基酸位点可能与PS事件有关,而谱系间的进化速率(dKa)没有重大变化。

以类似的方式,当考虑Ka比率而不是Ka/Ks比率的差异时,386个人类基因(黑猩猩为552个)经历了非同义性比率的显著加速,其中只有大约32个基因(黑麦为120个)显示了PS的可靠信号。然而,当考虑到Ka比率显著加速且dKa>0.0006的基因时,大多数基因都显示出PS的证据(人类为81%,黑猩猩为94%)。尽管重要的是要记住,在所有Ka-RRT有显著偏差的基因中,他们仍然是少数。

总之,我们观察到,只有那些Ka-RRT显著且dKa>0.0006的基因才可能被视为已被阳性选择的丰富概率的候选基因。这些结果有助于突出使用高标准化Ka率作为以先验方式集中PS可能病例的手段的缺点之一。

RSC和PS的历史和衍生趋势

众所周知,大多数PS测试无法区分正达尔文选择的真实事件和RSC案例[13]. 这是我在本研究中使用的测试的情况。正如Zang等人之前所证明的那样[14],仅在测试I中观察到而在测试II中未观察到的基因对应于RSC的可能病例。

图2A显示了在所分析的三个谱系的两个测试中观察到的总基因和普通基因的分布。正如预期的那样,测试II中显示的绝大多数H-PSG和Ch-PSG也在测试I中观察到。经过多次测试校正后,测试I中分别检测到人类、黑猩猩和祖先血统的216、793和941个基因。只有122个人类基因(1.26%)、245个黑猩猩基因(2.53%)和287个祖先基因(2.97%)仅在测试I中发现。这组唯一的基因用于研究与RSC可能病例相关的功能类别。

保存图片、插图等的外部文件。对象名称为pcbi.0020038.g002.jpg
PSG在测试I和测试II下的系统发育分布

(A) 基因沿树枝的差异分布表明,PS(测试II)和RSC(测试I)在衍生谱系和祖先谱系中的发生模式不同。红色数字表示在多次测试校正后,在每次测试中检测到的基因总数。黑色的数字是在谱系之间观察到的常见直向同源基因。蓝色的数字是两种测试中观察到的基因。

(B) 四个典型GO类别在人类、黑猩猩和祖先谱系中的系统发育分布如上述树所示。数字对应于每个术语在PS和RSC下的基因表示在带有GO注释的基因总数中所占的百分比。实心圆圈表示比较中存在显著(红色)和非显著(灰色)差异(详细说明见正文)。

图2B显示了在PS和RSC下观察到的人类、黑猩猩和四种功能GO类别的祖先世系之间的基因表示(分支上的数字)之间进行的统计比较(填充圆圈)的结果。这些类别是这两项测试中最具代表性的类别之一,同时也是人类和黑猩猩常见类别之间观察到的不同分化模式的示例。

在RSC下的基因集合中,观察到的所有功能类别的一个常见模式是人类和黑猩猩之间没有功能分化(灰色圆圈)。然而,该术语的表示出现了显著增加(红色圆圈)G蛋白偶联受体蛋白信号通路在衍生血统与祖先血统的比较中(图2B) ●●●●。RSC下基因的显著过度表达在人类中更高(+32.68%,第页<1e-05)比黑猩猩(+18.36%,第页= 0.006). 考虑到每个分支所经过的时间(祖先谱系中约75 Ma,原始人类进化中约5 Ma),这表明在该类别和感觉知觉(图2B) ●●●●。假设PSG的相对表示属于G蛋白偶联受体感觉知觉物种形成后,人类增加而黑猩猩减少(表4,图2B) 不足为奇的是,仅在黑猩猩(红色圆圈)中检测到具有统计学意义的差异。此外,G蛋白偶联受体感觉知觉在统计学上表现过度(第页<1e-05),将RSC下的一组基因与我们数据集中作为人类基因组代表的其他可用基因进行比较。总之,尽管物种形成后,这两个类别在人类中的代表性都有所增加,但在这两个物种中,RSC的过程更加频繁。

观察到相反的模式细胞蛋白质代谢类别(图2B) ●●●●。在这种情况下,两个物种物种形成后,RSC下的基因表示减少。然而,在这一类别下,PSG在黑猩猩中的表现更高,这是相对于祖先条件的边际增加的结果。在RSC下发现的基因数量更显著地减少了免疫反应类别。在这种情况下,没有观察到人类的基因低于RSC,考虑到每个谱系中的相对代表性,似乎表明人类的变异很小,黑猩猩与PSG祖先的比例相比有所下降,而这两个物种在RSC下都有所下降。

图3显示了在两种测试下推导出的所有常见GO类的物种形成过程前后表示的进化变化。根据黑猩猩和祖先血统(CH-AH)之间观察到的差异,绘制了每个功能项(H-AH)在人类和祖先血系之间的代表性差异。每个点代表一个功能类别,根据其在两个图的每个象限(Q)中的位置,可以推断出其他进化场景。对角线表示在两个物种进化过程中,相对于祖先谱系观察到的值,同质增加(正值)或减少(负值)。

保存图片、插图等的外部文件。对象名称为pcbi.0020038.g003.jpg
适应和RSC的祖先和衍生趋势

使用仅在测试I(RSC)和测试II(PS)中观察到的基因,绘制了衍生谱系和祖先谱系(H-AH,人类与祖先谱系;CH-AH,黑猩猩与祖先谱系)集合之间GO术语表示的差异。每个象限代表一个特定的进化场景,在物种形成后,每个谱系的GO表示增加或减少。显示H-AH和CH-AH之间表示差异>10%的术语用红色标记:G偶联蛋白受体在试验一(14.32%)和试验二(12.89%)中均发现,并且感觉知觉(11.03%)和细胞蛋白质代谢(−12.34%)。只显示所有谱系的通用术语。

在两个轴上表现出正差异的GO项对应于物种形成过程(Q1)后两个物种中的增加。考虑到自适应进化过程,共有26个功能类别符合此模式(PS图)。其中大多数(21)在人类中的代表性差异高于黑猩猩(H-AH%,Ch-AH%),即:。,突触传递(1.57, 0.68),检测非生物刺激(2.87, 0.21),细胞内蛋白运输(5.73, 1.64),有机组分氧化产生的能量(3.13、0.16),以及小GTPase介导的信号转导(2.87、1.14)等。另外20个GO术语显示,在物种形成后(Q4),它们在人类中的相对代表性相对增加,而在黑猩猩中的相对表现性相对减少,即。,G蛋白偶联受体感觉知觉(不同于表4图2B) ,电子输运(1.3, −2.65),雄配子世代(0.26, −1.57),血管形态发生(1.04,−0.77)和伤口愈合(1.56,−0.23)等。七个GO项(Q3)检测到相反的过程,即黑猩猩的PSG相对增加,而人类的PSG则相对减少:细胞凋亡(−2.61, 0.07),转录(−4.42, 0.08),转录调控(−2.68,0.45),以及细胞蛋白质代谢(在表4图2B) 等等。最后,在两个物种的六个GO类别中,观察到PSG的祖先代表性相对下降(Q3):炎症反应(−0.78, −2.61),对害虫、病原体和寄生虫的反应(−1.82,−4.05),以及免疫反应(不同于表4图2B) 等等。

总之,尽管测试II在黑猩猩中检测到的PSG数量高于人类,而且它们之间的GO项表征并不显著,但祖先和衍生适应性趋势之间的比较表明,在所有谱系共59个常见GO项中,41个显示了人类谱系中发生PS事件的比例更高。只有11个术语显示黑猩猩中PSG的比例较高。此外,根据图3,具有说服力。虽然GO项百分比的差异在物种之间广泛分布,但RSC下基因GO表示的差异在变量之间高度相关(第页=3.6e-15),主要沿对角线下落。该模式描述了物种形成过程后,两个物种中每个GO类别下经历RSC的基因以比例和相似的速率有规律地增加和减少。只有两个GO术语偏离了这一一般模式;G蛋白偶联受体感觉知觉均位于对角线下方的Q1,并突出了这些类别下的高比例基因,这些基因可能是两个物种的RSC病例。

值得注意的是,许多仅在测试I中发现的基因具有重要的功能性产物,例如同源异型盒和聚合酶相关蛋白等,这似乎表明所有这些基因都不太可能经历RSC过程。可能其中许多基因具有微弱但真实的PS信号,不足以被测试II检测到(R.尼尔森,个人通信)。显然,需要进一步的统计方法来准确区分PS的弱信号和RSC的实际情况。

PSG在人类和黑猩猩中的功能作用

表5显示了一些PSG的基因名称,这些PSG属于分析中观察到的几个更具代表性的GO类别。与基于加速率方法的估算一致[12]在人类和黑猩猩中,许多与感官感知相关的选择事件是在与听觉感知相关的不同基因中检测到的。例如,EDN3公司在人类中被阳性选择,与感音神经性耳聋和色素沉着不足有关[20].1美元在黑猩猩中被选为阳性,其功能丧失导致了最严重的亚瑟综合征[21]. 然而,在祖先谱系中也发现了与声音感知相关的基因PS。例如KPTN公司小鼠同源基因是奈梅根华尔兹小鼠突变的候选基因,该突变具有前庭缺陷和可变感音神经性听力损失[22]. 在PS中还发现了其他与感官感知相关的基因:味觉主要在人类和祖先血统中观察到,视觉感知嗅觉受体基因在所有谱系中均有发现。尽管如此,正如之前所建议的那样[12,13]RSC的大多数事件都是在感觉知觉类别涉及嗅觉受体。嗅觉受体中的RSC在所有三个谱系中都很丰富。一个引人注目的观察结果是,原始人类祖先谱系中与RSC下视觉感知相关的基因数量很多。尽管需要对这组基因进行进一步研究,但考虑到高等灵长类动物夜间生活方式的丧失所产生的功能变化,这一观察可能是有意义的[23].

表5

根据测试I和测试II推断出的人类和黑猩猩基因的小样本

保存图片、插图等的外部文件。对象名称为pcbi.0020038.t005.jpg

人类(H)、黑猩猩(Ch)、人类和黑猩猩(H-Ch)以及人类祖先谱系(AH)中具有PS强信号的许多其他基因与以下方面有关:a)神经系统,H:ARNT2号机组[24],高度:GFRalpha公司-3 [25],频道:DRP2号机组[26],NES公司[27]; b) 免疫反应,H:PTGER4型[28],CCL4级[29],密码:法新社[30],人类白细胞抗原-G[31],H-Ch:IGHG3型[32],AH:HLA-DOB公司[33]; c) 细胞周期,H:VEGFC公司[34],频道:CCNE2公司[35],AH:外景2[36],9月8日[37]; d) 外源物质的代谢,H:ARNT2号机组[38]; 中国:AKR1C1[39],AH:澳大利亚商业银行4[40]; e) 表皮发育,H:58韩元[41],频道:10韩元[42],第7a1列[43],AH:TGM5型[44],KTR2A公司[45]; f) 炎症反应,H:ITGAL公司[46],CCL4级[29],频道:IL1F10型[47],IL1R1型[48],AH:CCL3、CCL1、CCR2[49]; g) 骨形态发生,H-CH-AH:BMP2K[50],频道:COL1A1公司[51],DCN公司[52],AH:BGLAP公司[53],空气处理蒸汽发生器[54]; h) 学习和记忆,Ch:FYN公司[55],研磨剂2a[56],AH:APOE公司[57]i)甲状腺调节,Ch:SLC5A5系列[58],JMJD1C公司[59]; AH公司:CGA公司[60],PTHR1型[61]; 和j)复制,Ch:CGA公司[62].

这些功能只是本研究中观察到的功能的一个小样本,并指出了原始人类进化过程中自然选择所修改的各种功能。

讨论

我们对分子钟、RSC和PS进行了完整的基因组进化分析,并将其与原始人类祖先谱系进行了比较,以区分人类和黑猩猩在物种形成过程中的进化适应趋势。基于基因对基因方法中中性偏差的测试,我们发现共有1182个(9.0%)人类基因和1948个(14.8%)黑猩猩基因在上述过程中至少有一个出现了统计上显著的偏差。然而,在修正了多重测试后,我们只考虑了665个(5.0%)人类基因和1341个(10.2%)黑猩猩基因,作为对这些物种非中性进化下最小集合的更好估计。我们的结论是,这些进化过程没有显示出形成人类和黑猩猩基因组差异模式的频繁事件的迹象。

尽管没有显著的净差异,但物种之间的进化速度存在差异。非同义词比率显著加速的基因数量超过了同义词变化进化的基因数量,黑猩猩的数量大于人类。这种过度的非同义词变化有利于黑猩猩,这与该物种中观察到的PS事件数量较多有关,部分原因可能是形成人类进化的相对较小的种群规模[63].

多年来,进化生物学家已经知道,要推断物种进化过程中发生的适应性过程,偏离分子钟或一般的速率加速是不必要的,也不充分的。我们观察到,考虑Ka/Ks>1的基因,得出一组只有7%-20%的基因显示出PS的证据。同样,使用非同义突变的RRT方法,那些显示出显著偏差的基因对于PS事件的富集程度为10%-30%。随着非平凡分歧值(dKa>0.0006)的增加,基因数量显著减少,但PS事件的浓度达到80%-95%。然而,在所有这些情况下,与使用本研究中使用的测试II的ML分支模型发现的PS事件数相比,高比例的PSG被丢弃。

之前一项专注于人类和黑猩猩PS选择的基因组研究发现,在这两个物种中,许多功能类别的代表性都过高或过低[10]. 这与一项后验研究的结果不一致[12]其中只有一种GO类别(发育调节因子)显示出人类与黑猩猩之间可能存在过度代表性。在本出版物中,克拉克等人的结果[10]可能包含RSC相关的假阳性或RSC和PS相关。我们的结果倾向于与最后一项研究更为一致,为人类和黑猩猩PSG功能类别缺乏分化提供了证据。我们的结果也支持这样的观点,即克拉克的结果可能包括RSC的案例,因为该研究中使用的模型2测试与这里使用的测试I非常相似,并且这里观察到许多推导的类在RSC下有显著的存在(G蛋白偶联受体感官感知)然而,PS和RSC之间可能存在的相关性不能忽略,因为其中一个进程下的高代表性函数类在另一个进程中也有高代表性。

在分子钟和PS分析中,未经多次测试校正而推导出的基因集在校正后观察到的大多数GO代表性比较中产生了类似的结果。唯一的例外是这个词G蛋白偶联受体蛋白信号通路在PS(测试II,第页= 0.005). 如前所述,经过多次测试修正后,我们没有发现GO术语在两个物种之间过度或不足。然而,如果人类和黑猩猩之间的差异被认为是从祖先条件演变而来的独立趋势,那么某种模式似乎是明显的,尽管祖先和后代的差异在统计上并不显著。也就是说,我们观察到,在所有谱系共有的59个GO类别中,有41个类别的人的PSG相对增加,而黑猩猩的PSG只有11个相对增加,尽管人类的PSG比黑猩猩的少6倍。虽然还需要进一步的研究,但这可能表明,至少在常见的功能性GO类中,人类通过适应性进化与祖先血统的距离比黑猩猩大得多。最后,由于大多数PSG在这些物种之间是不同的,在相同功能类别下发现的替代PSG的个体作用可能是人类和黑猩猩之间生物学差异的一个重要因素。

进化特性的全基因组分析是在没有任何关于结果基因的先验假设的情况下进行的。因此,这些类型的分析是详尽的,同时对于个别结果也是保守的。将I类错误率保持在可接受水平的必要性导致了对真实积极结果的拒绝不可避免地增加[64]. 因此,我们发现的整套加速和PSG只能被视为它们各自最重要的部分。属于这些类别的其余基因必须通过使用假设驱动的方法或更敏感的方法找到。在本研究中,之前讨论过的PS示例,例如FOXP2公司BRCA1、,没有显示PS的证据。这表明需要对这些基因进行进一步的详细研究。

多年来,人们一直认为,黑猩猩基因组序列的可用性及其与人类基因组序列的比较将揭示一些可观察到的差异背后的分子基础,并可能为我们人类的形成提供线索。现在很明显,无论是现有的方法,还是现有基因注释的细节和质量,都无法得出结论性的答案。未来,将需要新的方法和更详细的功能注释来正确阐明这一相关的生物学问题。

材料和方法

在集成版本30.35h的全套(30709个基因)中20469个“已知”集成人类蛋白编码基因子集的正交log注释智人数据库[65]从Ensembl-Compara数据库版本30中检索到[66]. 从Ensembl数据库(人类:版本30.35c,黑猩猩:版本30.2,小鼠:版本30.33f,大鼠:版本30.34,狗:版本30.1b)检索每个直系基因的最大转录物所代表的蛋白质的编码序列(CDS)。

使用ClustalW对DNA CDS进行比对[67]和参数默认以翻译的蛋白质序列为模板。包含间隙的密码子被删除。分析中排除了小于50 bp的比对。Ka和Ks比率的上限为人类干扰素γ(Ka=3.06)和松弛素蛋白质(Ks=每10个位点6.39个替换9年),显示出人类最高的发病率[5]. 假设人类-小鼠和人类-黑猩猩的分化时间分别约为8000万年和500万年[68]对于RRT估计值,与显示Ks≥1和Ka≥0.5替换/位点的直方图进行的所有比较,以及对于ML谱系估计值显示Ks大于0.032和Ka大于0.0152替换/位点,均被排除在分析之外。采用Li的方法进行RRT[69]在RRTree计划中实施[70]. 以小鼠、大鼠和狗为外群,测试人类和黑猩猩的序列是否偏离分子钟。根据RRTree中实现的拓扑方案(小鼠:1/4,大鼠:1/4,狗:1/2)确定外组中每个物种的权重。对显示GC含量差异小于10%的基因最大转录本的CDS比对进行Ka和Ks估计。只有三个基因显示GC含量差异大于10%,因此被排除在分析之外。使用Kolmogorov–Smirnov双样本测试评估了人类和黑猩猩发病率的差异[71]. Ka和Ks的ML估计是使用CodeML在每个正交的分支模型下联合计算的。

使用两种不同的分支模型测试(I和II)评估PS[14],在PAML(3.15)包的CodeML程序中实现[16]. 系统发育中的分支被预先定义为前景谱系和背景谱系。在这些模型下,只有前景谱系可能包含PS事件。人类、黑猩猩及其祖先谱系(来源于小鼠和大鼠的共同祖先)作为前景谱系进行了独立测试。为了进行PS分析,删除了人类和黑猩猩之间密码子的唯一碱基对差异少于三个的序列。

与之前分支测试的统计行为相反[13]测试I和II,由Zhang等人开发和测试[14]在本研究中,在基因组规模上使用了使用ML方法的分支测试模型的改进方法,该方法已被证明在区分PS和RSC方面更为成功[14]. 测试I将M1a与模型A进行比较。M1a假设两个场地类别,0<ω<1和ω1=1,固定在系统发育树的所有谱系中。模型A考虑了四类场地。站点类0包括整个树中保守的密码子,0<ω< 1. 站点类别1包括在树中以ω中性方式进化的密码子1= 1. 站点类别2a和2b包括在背景分支上保守或中性进化的密码子,但在前景分支上变为PS以下,ω2> 1. 比例p场地类别(p0,第页1,第页2,第页)以及ω的平均值2通过ML方法从数据中估计。测试II将空模型A1与模型A进行比较。A1中的参数与A中的参数相同,不同之处在于站点类别2a和2b固定在前景中,ω2= 1. 模拟结果表明[14]测试一不能适当区分RSC的情况和PS的真实事件。另一方面,测试二通过允许背景中的选择性约束站点在ω2=1设置在A1的前景中,能够进行此区分,具有可接受的错误发现率。因此,可以比较两种测试的结果,以区分PS病例和RSC事件。由于比较的模型是嵌套的,因此进行了似然比测试,并将2Δ值后验转换为精确值第页-使用R统计包的pchisq函数的值[72]. d.f.=2和d.f.1=1的双平方分布,在PS条件下已被证明是保守的[14]分别用于执行测试I和测试II。

在所有情况下,除非另有说明,否则从时钟和PS分析中得出的p统计数据都是错误发现率-使用Benjamini和Hochberg方法进行多次测试调整[73]. 通过使用GO进行功能注释的FatiGO程序对加速和PSG进行功能表征[18,19]. FatiGO实现了包容性分析,其中级别对应于定义GO项之间关系的有向非循环图层次结构中的级别[74]选择哪个进行分析[18,19]. 该程序计算Fisher的双尾精确检验,以便在统计上定义两个基因列表之间的过度或不足重表达项第页-针对多次测试修正的值(错误发现率-独立调整)[75].

支持信息

数据集S1

RRT和PS测试的GO功能分析结果:

(173 KB邮政编码)

表S1

所有同源基因的变量:

(1.8 MB邮政编码)

致谢

我们感谢拉斯穆斯·尼尔森(Rasmus Nielsen)就测试一和测试二的统计行为提供了未发表的结果,以及对本文的宝贵评论。

缩写

AH-PSG系统原始人祖先谱系中的PSG
客户尽职调查编码序列
瑞士法郎黑猩猩比人类快
Ch-PSG公司黑猩猩PSG
中国科学院黑猩猩测序和分析协会
GO(开始)基因本体
高频人类比黑猩猩快
H-PSG公司人类PSG
灵魂每个位点取代的非同义进化率
Ka-RRT公司非同义网站上的相对费率测试
K–S公司科尔莫戈罗夫-斯米尔诺夫
Ks(千克)每个位点替换的同义进化率
毫升最大似然
PS(聚苯乙烯)积极的选择
巴黎圣日尔曼酒店阳性选择基因
象限
RRT公司相对速率测试
RSC公司选择约束的松弛

脚注

作者贡献。LA、JD和HD构思并设计了实验。洛杉矶进行了实验。LA和HD分析了数据。洛杉矶、JD和HD撰写了这篇论文。

基金。洛杉矶由Caixa基金会支持。

相互竞争的利益。提交人声明,不存在相互竞争的利益。

本文的前一版本于2006年3月15日作为早期在线发布(DOI:10.1371/日记.pcbi.0020038.eor).

工具书类

  • Gillespie JH公司。分子进化的原因。牛津:牛津大学出版社;1991. 336. 第页。[谷歌学者]
  • 木村M.分子水平上的进化速率。自然。1968;217:624–626.[公共医学][谷歌学者]
  • 木村M。分子进化的中性理论。剑桥/伦敦:剑桥大学出版社;1983. 367. 第页。[谷歌学者]
  • King JL,Jukes TH.非达尔文进化。科学。1969;164:788–798.[公共医学][谷歌学者]
  • 李伟。分子进化。桑德兰(马萨诸塞州):西瑙尔协会;1997[谷歌学者]
  • 尼尔森R.基因组学时代选择性中性的统计检验。遗传。2001;86:641–647.[公共医学][谷歌学者]
  • Bromham L,Penny D.现代分子钟。自然资源部Genet。2003;4:216–224.[公共医学][谷歌学者]
  • Zuckerkandl E,Pauling L.分子作为进化史的文献。《理论生物学杂志》。1965;8:357–366.[公共医学][谷歌学者]
  • Dorus S、Vallender EJ、Evans PD、Anderson JR、Gilbert SL等。智人起源中神经系统基因的加速进化。单元格。2004;119:1027–1040.[公共医学][谷歌学者]
  • Clark AG、Glanowski S、Nielsen R、Thomas PD、Kejariwal A等。从人类-黑猩猩-小鼠同源基因三组推断非中性进化。科学。2003;302:1960–1963.[公共医学][谷歌学者]
  • Nielsen R、Bustamante C、Clark AG、Glanowski S、Sackton TB等。人类和黑猩猩基因组中阳性选择基因的扫描。《公共科学图书馆·生物》。2005;(6):e170。内政部:10.1371/期刊.pbio.0030170.[PMC免费文章][公共医学][谷歌学者]
  • 中国民航总局。黑猩猩基因组的初始序列以及与人类基因组的比较。自然。2005;437:69–87.[公共医学][谷歌学者]
  • 张杰。用分支模型的似然法对阳性选择进行频繁错误检测。分子生物学进化。2004;21:1332–1339.[公共医学][谷歌学者]
  • 张杰,尼尔森R,杨忠。改进的分支似然法在分子水平上检测阳性选择的评价。分子生物学进化。2005;22:2472–2479.[公共医学][谷歌学者]
  • Ohta T,Ina Y.哺乳动物基因间同义替代率的变化以及同义和非同义差异之间的相关性。分子进化杂志。1995;41:717–720.[公共医学][谷歌学者]
  • PAML:一个基于最大似然法的系统发育分析程序包。计算应用生物科学。1997;13:555–556.[公共医学][谷歌学者]
  • Ashburner M、Ball CA、Blake JA、Botstein D、Butler H等。基因本体论:生物学统一的工具。基因本体联盟。自然遗传学。2000;25:25–29. [PMC免费文章][公共医学][谷歌学者]
  • Al-Shahrour F、Diaz-Uriarte R、Dopazo J.FatiGO:一个用于发现基因本体术语与基因组之间重要关联的网络工具。生物信息学。2004;20:578–580.[公共医学][谷歌学者]
  • Al Shahrour F、Minguez P、Vaquerizas JM、Conde L、Dopazo J.BABELOMICS:一套用于高通量实验中基因组功能注释和分析的网络工具。核酸研究。2005;33:W460–W464。 [PMC免费文章][公共医学][谷歌学者]
  • Aoki H、Motohashi T、Yoshimura N、Yamazaki H、Yamane T等。内皮素3和KIT信号在黑素细胞发育中的协同和不可或缺的作用。开发动态。2005;233:407–417.[公共医学][谷歌学者]
  • Adato A、Lefevre G、Delprat B、Michel V、Michalski N等。Usherin是ⅡA型Usher综合征的缺陷蛋白,可能是内耳感觉细胞中纤毛间踝关节连接的一个组成部分。人类分子遗传学。2005;14:3921–3932.[公共医学][谷歌学者]
  • Bearer EL,Chen AF,Chen AH,Li Z,Mark HF,et al.2E4/Kaptin(KPTN)-听力损失位点DFNA4的候选基因。Ann Hum基因。2000;64:189–196. [PMC免费文章][公共医学][谷歌学者]
  • 王德,奥克利T,莫尔J,希明LC,尹S,等。蝙蝠色觉基因的分子进化。分子生物学进化。2004;21:295–302.[公共医学][谷歌学者]
  • Stolze I,Berchner-Pfannschmidt U,Freitag P,Wotzlaw C,Rossler J,et al.人神经母细胞瘤细胞中低氧诱导的促红细胞生成素基因表达。鲜血。2002;100:2623–2628.[公共医学][谷歌学者]
  • Onochie CI、Korngut LM、Vanhorne JB、Myers SM、Michaud D等。人类GFRalpha-3基因座的特征和先天性巨结肠基因的研究。医学遗传学杂志。2000;37:674–679. [PMC免费文章][公共医学][谷歌学者]
  • Wrabetz L,Feltri ML。施万细胞停止、DR(o)P2和滚动吗?神经元。2001;30:642–644.[公共医学][谷歌学者]
  • Ernst C,Christie BR。推测的神经干细胞标记物nestin在成年大鼠大脑皮层的异质细胞类型中表达。神经科学。2005;138:183–188.[公共医学][谷歌学者]
  • Kabashima K、Sakata D、Nagamachi M、Miyachi Y、Inaba K等。前列腺素E2-EP4信号通过促进郎格罕细胞的迁移和成熟,启动皮肤免疫反应。自然医学。2003;9:744–749.[公共医学][谷歌学者]
  • Del Corno M、Gauzzi MC、Penna G、Belardelli F、Adorini L等。人类免疫缺陷病毒1型gp120和其他激活刺激物在循环浆细胞样细胞中高度有效地触发α干扰素和CC趋化因子的产生,但在髓系树突状细胞中不触发。《维罗尔杂志》。2005;79:12597–12601. [PMC免费文章][公共医学][谷歌学者]
  • Ritter M,Ali MY,Grimm CF,Weth R,Mohr L等。肝细胞癌患者中甲胎蛋白对树突状细胞和T细胞的免疫调节。肝素杂志。2004;41:999–1007.[公共医学][谷歌学者]
  • Sargent IL.“可溶性”HLA-G真的存在吗?故事的另一个转折。Mol Hum再现。2005;11:695–698.[公共医学][谷歌学者]
  • Dard P,Lefranc MP,Osipova L,Sanchez-Mazas A.与人类主要G3m单倍型相关的IGHG3等位基因的DNA序列变异。《欧洲人类遗传学杂志》。2001;9:765–772.[公共医学][谷歌学者]
  • Naruse TK、Kawata H、Inoko H、Isshiki G、Yamano K等。HLA-DOB基因表现出有限的多态性,只有一个氨基酸替换。组织抗原。2002;59:512–519.[公共医学][谷歌学者]
  • Karkkainen MJ、Haiko P、Sainio K、Partanen J、Taipale J等。血管内皮生长因子C是胚胎静脉第一淋巴管萌芽所必需的。自然免疫学。2004;5:74–80.[公共医学][谷歌学者]
  • Moroy T,Geisen C.Cyclin E。国际生物化学与细胞生物学杂志。2004;36:1424–1439.[公共医学][谷歌学者]
  • Pedrini E、De Luca A、Valente EM、Maini V、Capponcelli S等。DHPLC在意大利多发性骨软骨瘤患者中鉴定的新型EXT1和EXT2突变。哼,变种。2005;26:280.[公共医学][谷歌学者]
  • Nagata K、Asano T、Nozawa Y、Inagaki M.哺乳动物败血病复合物的生化和细胞生物学分析,2011年9月7日至9日。生物化学杂志。2004;279:55895–55904.[公共医学][谷歌学者]
  • Xu C,Li CY,Kong AN。外源性药物对I、II和III期药物代谢/转运的诱导。Arch Pharm Res公司。2005;28:249–268.[公共医学][谷歌学者]
  • Ciaccio PJ、Jaiswal AK、Tew KD。迈克尔受体异源化合物对人二氢二醇脱氢酶的调节。生物化学杂志。1994;269:15558–15562.[公共医学][谷歌学者]
  • Van der Bliek AM、Baas F、Ten Houte de Lange T、Kooiman PM、Van der Velde-Koerts T等。人类mdr3基因编码一种新的P-糖蛋白同源物,并在肝脏中产生选择性剪接mRNA。EMBO J。1987;6:3325–3331. [PMC免费文章][公共医学][谷歌学者]
  • Perez C、Auriol J、Gerst C、Bernard BA、Egly JM。两种人类UHS角蛋白基因的基因组组织和启动子特征。基因。1999;227:137–148.[公共医学][谷歌学者]
  • Zimek A,Weber K。陆地脊椎动物有两个角蛋白基因簇;硬骨鱼类的显著差异。欧洲细胞生物学杂志。2005;84:623–635.[公共医学][谷歌学者]
  • Chen M,Kasahara N,Keene DR,Chan L,Hoefler WK,等。营养不良性大疱性表皮松解症VII型胶原表达和功能的恢复。自然遗传学。2002;32:670–675.[公共医学][谷歌学者]
  • Cassidy AJ、van Steensel MA、Steijlen PM、van Geel M、Velden J等。TGM5中的纯合子错义突变消除了表皮转谷氨酰胺酶5的活性,并导致肢端剥离皮肤综合征。美国人类遗传学杂志。2005;77:909–917. [PMC免费文章][公共医学][谷歌学者]
  • Mahler B、Gocken T、Brojan M、Childress S、Spandau DF等。角蛋白2e:小鼠乳头表皮的标志物。细胞组织器官。2004;176:169–177.[公共医学][谷歌学者]
  • Lu Q,Kaplan M,Ray D,Ray D.,Zacharek S,等。系统性红斑狼疮中ITGAL(CD11a)调节序列的去甲基化。大黄性关节炎。2002;46:1282–1291.[公共医学][谷歌学者]
  • Nicklin MJ、Barton JL、Nguyen M、FitzGerald MG、Duff GW等。人类白细胞介素-1簇9个基因的序列图。基因组学。2002;79:718–725.[公共医学][谷歌学者]
  • Tseng J、Do J、Widdicombe JH、Machen TE。人气管上皮对铜绿假单胞菌鞭毛蛋白、TNF-α和IL1-β的天然免疫应答美国生理学杂志《细胞生理学》。2005;290:C678–C690。[公共医学][谷歌学者]
  • Sebastiani S、Allavena P、Albanesi C、Nasorri F、Bianchi G等。具有调节活性的CD4+T淋巴细胞中趋化因子受体的表达和功能。免疫学杂志。2001;166:996–1002.[公共医学][谷歌学者]
  • 卡恩斯AE、多诺霍MM、三亚B、德迈MB。一种新型体外损伤成骨细胞分化的蛋白激酶的克隆和表征。生物化学杂志。2001;276:42213–42218.[公共医学][谷歌学者]
  • Pochampally RR、Horwitz EM、DiGirolamo CM、Stokes DS、Prockop DJ。通过在成骨不全患者骨髓基质细胞(MSCs)中过度表达COL1A1野生型cDNA来纠正矿化缺陷:一种拯救产生显性负性蛋白缺陷的突变的策略。基因疗法。2005;12:1119–1125.[公共医学][谷歌学者]
  • Goldberg M、Septier D、Rapoport O、Iozzo RV、Young MF等。两种富含亮氨酸的小蛋白聚糖(二聚糖和聚糖)的靶向破坏,摘录对釉质和牙本质形成的不同影响。钙化组织内。2005;77:297–310.[公共医学][谷歌学者]
  • Raymond MH、Schutte BC、Torner JC、Burns TL、Willing MC。骨钙素:人类基因BGLAP的遗传和物理定位及其在绝经后骨质疏松症中的潜在作用。基因组学。1999;60:210–217.[公共医学][谷歌学者]
  • Rittenberg B、Partridge E、Baker G、Clokie C、Zohar R等。Ahsg对BMP诱导的异位骨形成的调节。矫形研究杂志。2005;23:653–662.[公共医学][谷歌学者]
  • Yamada K,Nabeshima T.学习和记忆中BDNF/TrkB信号与NMDA受体的相互作用。药物新闻透视。2004;17:435–438.[公共医学][谷歌学者]
  • Adams J、Crosbie J、Wigg K、Ickowicz A、Pathare T等。谷氨酸受体,离子性,N-甲基D-天冬氨酸2A(GRIN2A)基因作为16p13区域注意力缺陷/多动障碍的位置候选基因。分子精神病学。2004;9:494–499.[公共医学][谷歌学者]
  • Pfankuch T,Rizk A,Olsen R,Poage C,Raber J.循环雄激素水平在载脂蛋白E4对认知功能影响中的作用。大脑研究。2005;1053:88–96.[公共医学][谷歌学者]
  • Smanik PA、Ryu KY、Theil KS、Mazzaferri EL、Jhiang SM。人类钠碘同向转运体的表达、外显子-内含子组织和染色体定位。内分泌学。1997;138:3555–3558.[公共医学][谷歌学者]
  • Lee JW、Choi HS、Gyuris J、Brent R、Moore DD。两类蛋白质与甲状腺激素受体的相互作用依赖于甲状腺激素的存在或不存在。摩尔内分泌学。1995;9:243–254.[公共医学][谷歌学者]
  • Vamvakopoulos NC,Monahan JJ,Kourides IA。促甲状腺素α和β亚单位mRNA互补DNA序列的合成、克隆和鉴定。美国国家科学院院刊。1980;77:3149–3153. [PMC免费文章][公共医学][谷歌学者]
  • Schipani E、Karga H、Karaplis AC、Potts JT、Jr、Kronenberg HM等。相同的互补脱氧核糖核酸编码人类肾和骨甲状旁腺激素(PTH)/PTH相关肽受体。内分泌学。1993;132:2157–2165.[公共医学][谷歌学者]
  • Amato F,Warnes GM,Kirby CA,Norman RJ。HCG自身抗体引起的不孕。临床内分泌代谢杂志。2002;87:993–997.[公共医学][谷歌学者]
  • 陈FC,李WH。人类和其他人种之间的基因组差异以及人类和黑猩猩共同祖先的有效种群规模。Am J Hum基因。2001;68:444–456. [PMC免费文章][公共医学][谷歌学者]
  • Ge H,Walhout AJ,Vidal M.整合“组学”信息:基因组学和系统生物学之间的桥梁。趋势Genet。2003;19:551–560.[公共医学][谷歌学者]
  • Lander ES、Linton LM、Birren B、Nusbaum C、Zody MC等。人类基因组的初步测序和分析。自然。2001;409:860–921.[公共医学][谷歌学者]
  • Hubbard T、Andrews D、Caccamo M、Cameron G、Chen Y等,2005年合奏。核酸研究。2005;33:D447–D453。 [PMC免费文章][公共医学][谷歌学者]
  • Thompson JD、Higgins DG、Gibson TJ。集群W:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性。核酸研究。1994;22:4673–4680. [PMC免费文章][公共医学][谷歌学者]
  • Blair Hedges S,Kumar S。基因组时钟和进化时间表。趋势Genet。2003;19:200–206.[公共医学][谷歌学者]
  • 李伟。同义和非同义替换率的无偏估计。分子进化杂志。1993;36:96–99.[公共医学][谷歌学者]
  • Robinson-Rechavi M,Huchon D.RRTree:系统发育树上序列组之间的相对速率测试。生物信息学。2000;16:296–297.[公共医学][谷歌学者]
  • 索卡尔R。生物测定。生物学研究中统计学的原理和实践。纽约:W.H.Freeman and Company;1981年,第859页。第页。[谷歌学者]
  • Ihaka R,绅士R.R:数据分析和图形语言。J计算图形统计。1996;5:299–314. [谷歌学者]
  • Benjamini Y,Hochberg Y。控制错误发现率:一种实用且强大的多重测试方法。J Roy Stat Soc B.公司。1995;57:289–300. [谷歌学者]
  • Eilbeck K、Lewis SE、Mungall CJ、Yandell M、Stein L等。序列本体:统一基因组注释的工具。基因组生物学。2005;6:R44。 [PMC免费文章][公共医学][谷歌学者]
  • Benjamini Y,Yekutieli D.依赖性下多重测试中错误发现率的控制。Ann统计。2001;29:1165–1188. [谷歌学者]

文章来自PLOS计算生物学由以下人员提供普洛斯