跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
Am J Hum基因。2000年10月;67(4): 881–900.
2000年9月13日在线发布。 数字对象标识:10.1086/303070
预防性维修识别码:项目经理1287893
PMID:10986041

载脂蛋白E在序列单倍型水平上的变异:人类主要多态性的起源和维持的意义

摘要

载脂蛋白E(apoE)的三种常见蛋白亚型,由APOE的复数基因与心血管疾病和阿尔茨海默病风险的关系不同。为了更好地了解这一重要多态性背后的遗传变异,我们鉴定了5.5 kb基因组DNA中的序列单倍型变异,其中包含了APOE的复数来自四个人群的96名个体的基因座和相邻侧翼区域:来自密西西比州杰克逊的黑人(n个=48条染色体),来自墨西哥坎佩切的玛雅人(n个=48),来自芬兰北卡雷利亚的芬兰人(n个=48),来自明尼苏达州罗切斯特的非西班牙裔白人(n个=48). 在测序的区域中,23个位点发生了变化(21个单核苷酸多态性或SNP、1个双列indel和1个多等位indel)。22个双列位点在样本中定义了31个不同的单倍型。该位点的核苷酸多样性(位点特异性杂合度)估计值为0.0005±0.0003。黑猩猩的序列分析APOE的复数该基因与人类ε4型单倍型关系最为密切,与人类共有序列在67个同义(54个替换和13个indels)和9个非同义固定位置上存在差异。人类等位基因分化的进化史是从单倍型关系模式中推断出来的。该分析表明,定义ε3和ε2等位基因的单倍型来自祖先的ε4s,在过去20万年中,ε3单倍型组的频率相对于ε4s有所增加。所有三类序列单倍型都存在显著的异质性,蛋白质亚型下的序列变异存在重要的种群间差异,这可能与解释表型关联与常见蛋白质亚型变异的冲突报告有关。

介绍

载脂蛋白E(apoE)(MIM107741)是一种血浆蛋白,在人体组织中的脂质代谢和胆固醇运输中起着重要作用(Davignon等人。1988; 马利和黄1999). 在人类中,apoE具有多态性(Utermann等人。1977). 在大多数人群中发现了三种常见的蛋白质亚型:apoE2、apoE3和apoE4,这是由DNA水平上的ε2、ε3和ε4等位基因决定的APOE的复数19号染色体上的基因(Weisgraber1994). 等位基因因两种非同义核苷酸多态性而彼此不同,这两种多态性导致蛋白质的112和158位发生氨基酸替换(E2与E3的区别在于158位的cys→arg,E3与E4的区别在于112位的cy→arg)(Rall等人。1982). 亚型在代谢上不同,与脂蛋白颗粒的亲和力以及与载脂蛋白E和低密度脂蛋白受体的结合程度不同(Hui等人。1984).

这三种常见等位基因的相对频率已经在广泛的人群中进行了调查,到目前为止,没有一个研究的人群在以下方面缺乏多态性:APOE的复数ε3等位基因是迄今为止研究的所有人群中最常见的等位基因(de Knijff et al。1994; Gerdes等人。1996b;科尔博和斯卡奇1999)非洲俾格米人的相对频率为0.536(n个=70)(Zekraoui等人。1997)玛雅语为0.911(n个=135)(坎博1995). 另一方面,ε2等位基因通常是大多数人群中最不常见的等位基因。撒丁岛人ε4等位基因的相对频率为0.052(n个=280)(Corbo等人。1995)俾格米人为0.407(n个=70)(Zekraoui等人。1997)与非洲、亚洲和欧洲人群中ε3等位基因频率显著负相关(Corbo和Scacchi1999). 早就认识到,即使在欧洲和美国密切相关的白人群体中,等位基因频率也存在显著的统计差异(Davignon等人。1988). 最近,一些研究人员注意到,欧洲ε4等位基因的相对频率南北下降(以及ε3频率的相关增加)(Corbo等人。1995; Lucotte等人。1997).

大量的调查APOE的复数多态性反映了人们对等位基因变异与血清总胆固醇和低密度脂蛋白胆固醇水平的个体间差异之间的关系的长期兴趣(Sing和Davignon1985),使该基因成为冠心病(CAD)关键候选易感性位点的效应(Kaprio等人。1991; Xhignesse等人。1991). 大量研究证实,在特定人群中,携带至少一个ε2等位基因的个体循环载脂蛋白E水平较高,血浆总胆固醇水平较低,甘油三酯水平较高,而携带ε4等位基因个体的载脂蛋白e水平较低、总胆固醇水平较高,因此,发展CAD的风险更高(Davignon等人。1988; de Knijff等人。1994; Stengárd等人。1995). 最近,在APOE的复数该基因座还与阿尔茨海默病(AD)家族性和散发性病例相关104300). 现在已经认识到,ε4等位基因的遗传以剂量依赖的方式增加了AD的风险,并使携带者的发病年龄比匹配的对照组更早(Corder等人。1993; Strittmatter等人。1993). 相对而言,拥有ε2等位基因似乎可以保护携带者免受疾病的影响(Chartier-Harlin等人。1994; Corder等人。1994; Talbot等人。1994). 然而,描述这种关系的容易程度掩盖了推断关联的相当大的上下文依赖性。例如APOE的复数这种变化预测胆固醇水平随遗传背景、年龄、性别和其他环境因素(饮食、吸烟等)而变化(Reilly等人。1992; 达维尼翁1993). AD风险也存在种族差异(参见Tang等人。1996,1998; Sahota等人。1997).

令人惊讶的是,流行病学的焦点几乎完全集中在经典亚型上;等位基因异质性APOE的复数该基因的特征尚未完全确定。观察到APOE的复数AD患者大脑和血浆中的mRNA(Yamada等人。1995; Lambert等人。1997; Taddei等人。1997)最近导致了对APOE的复数启动子区域,从而鉴定出该基因上游的五个新多态位点(Artiga等人。1998b;Lambert等人。1998). 单侧关联研究侧重于这些变异以及在+113位置发现的一个位点(Mui等人。1996)然而,他们得出了相互矛盾的结论,因此,到目前为止,对于这些位点在多大程度上可能与疾病风险相关,还没有明确的共识。尽管APOE的复数相互矛盾的报告所暗示的生物变异令人清醒,重要的是要认识到,即使是这些许多变异也不包括APOE的复数在DNA序列水平上存在变异。在第一次对整个APOE的复数基因座和相关的5′和3′侧翼DNA,我们最近鉴定了22个可变位点,其中14个以前没有报道过(Nickerson等人。,出版中). 这一新发现的序列变异与三种常见亚型的关系是本报告的重点,这三种亚型是迄今为止大多数流行病学调查的基础。

最终,困扰流行病学和人群遗传学文献的基本问题是,为什么存在不同的apoE亚型,在世界各地的频率大致相同,特别是当非人类灵长类亲属没有这种变异时(Zannis等人。1985). 一些研究人员认为ε4是基因的祖先形式(Hixson等人。1988; Hanlon和Rubinsztein1995; Seixas等人。1999). 如果是这样,那么所有人群中衍生ε3等位基因的高相对频率显然需要解释。ε3等位基因是偶然漂移到当前频率,还是选择性地保持?决定ε3亚型的氨基酸差异是否只出现过一次,或者有证据表明它们反复出现过多次?这些问题可以通过考虑APOE、,记录在作为DNA序列单倍型连接的多态位点的排列中。当以这种方式考虑变异时,我们可以评估这三个常见的等位基因是如何以及何时出现的,并可以确定是什么力量促成了它们目前的全球分布。我们在这里进行了这样的分析。我们表明,每类常见等位基因(ε2、ε3和ε4)中的单倍型之间存在相当大的序列异质性,并且观察到的单倍体变异所暗示的等位基因分化历史与ε3等位基因相对于祖先ε4等位基因的全球扩张相一致。对每个常见等位基因潜在异质性的详细考虑也为等位基因亚类的人群特异性分布提供了重要的新见解,这可能有助于解释报告的疾病风险变异与常见apoE亚型标记的基因变异之间的关联差异。

材料和方法

抽样的人口

对来自密西西比州杰克逊的黑人四个人群的个体进行序列变异取样(n个=48条染色体),作为正在进行的美国黑人高血压研究的一部分(参见家庭血压计划网站);来自芬兰北卡累利阿的白人(n个=48),作为Finrisk止血研究的一部分收集(Salomaa等人。1994); 来自明尼苏达州罗切斯特的白人(n个=48)。1989); 和玛雅人,几乎没有外加剂(n个=48),由我们其中一人(K.M.W.)在墨西哥尤卡坦半岛的坎佩切州采样(Kidd等人。1991). 所有受试者都是在不考虑其疾病状况或任何危险因素特征水平的情况下选择进行本次调查的。

DNA测序

按照Nickerson等人(1999年)所述的程序,在由二倍体基因组DNA样本PCR制备的模板上进行DNA测序(出版中). 还对样本子集进行了广泛的验证性重测序,以帮助单倍型测定,如下所述。

人类和黑猩猩在该基因座的DNA序列上非常相似,因此我们可以使用相同的PCR和测序引物阵列进行黑猩猩序列分析(所用引物的确切细节可按要求提供)。一只黑猩猩的DNA(黑猩猩)如上所述进行测序,并使用SIM序列比对算法与人类基因组一致序列进行比对(Huang等人。1990). 这个Genbank公司黑猩猩登记号APOE的复数参考序列为AF261280。

单倍型测定

单倍型是通过一个序列程序来确定的,该程序涉及应用一种算法,该算法首先确定纯合子和单位点杂合子中的明确单倍型,然后遵循一系列推理步骤来得出可能的单倍型(Clark1990). 为了简化推断,我们首先忽略了六个单体多态性(即组合样本中仅存在一个不常见核苷酸变体拷贝的位点,即308、545、2907、3106、3673和3701)和5229B位点的多等位基因indel多态性。然后确定等位基因特异PCR的关键位点对,以确定多杂合子个体子集的阶段。然后将此相位信息纳入推断程序,直到所有基因型都得到解决(参见Clark等人。1998). 还进行了等位基因特异性PCR,为样本中明确存在的可能由一对以上单倍型组成的每个基因型指定阶段。随后,通过上下文(例如,545和3701位点的单倍体发生在纯合背景中,因此被明确指定)或参考在同一位点的更大变异调查中推断的单倍型,推断出单倍体变异体的阶段(Nickerson et al。,出版中和未发布的数据)。

群体遗传分析

计算了四个群体样本和组合(混合)样本的两个多样性度量:θ,预期的每个位点核苷酸杂合性的估计,理论上等于中性突变参数4N个e(电子)μ(瓦特森1975)π,由平均两两序列差(Nei1987). 测试统计D类(田岛1989)用于比较这些汇总统计数据。在中立的情况下,这两个估计值应该相等D类=0.两个与田岛相关的测试统计数据D、, F、,D类佛罗里达州(傅、李1993)-用于比较每个样本中观察到的单体多态性数量与中性模型下的预期数量(我们使用了明确包含外组信息的测试统计数据的形式)。最后,第四个测试统计,Fs公司(付1997),用于比较我们样本中观察到的序列单倍型数量与在无重组的无限规模突变(IS)模型假设下的预期数量。同样,在中立状态下(如果没有重组),这两个估计值应该相等。通过比较估计值的分布来计算四个检验统计量中每个统计量的显著性值,这些估计值是针对1000个随机样本计算得出的,这些样本的大小和多态性水平与观察数据相同,并且是在合并的Wright-Fisher平衡模型下生成的,没有重组(Hudson1990).

非均质性D、, F、,D类佛罗里达州使用程序的滑动窗口功能检查5.5-kb测序区域长度上的测试统计数据DnaSP公司v.3.0(Rozas和Rozas1999). 对750 bp的重叠窗口进行统计,这些窗口沿序列以25 bp的间隔放置。黑猩猩外群序列和人类多态性样本之间的序列差异测量如下K、,净序列散度(Nei1987). π和π的滑动窗估计K(使用与测试统计分析中相同的窗口和步长)允许在多态性与差异性的比率中考虑跨基因座异质性。用连杆不平衡参数测量两两连杆不平衡D、,计算为D类=P(P)ij公司-第页第页j个,其中P(P)ij公司是一对站点中最常见的配子类型的频率,并且第页第页j个是该单倍型中核苷酸的频率(Hartl和Clark1997). 用统计学方法测量群体样本间的遗传分化F类装货单(赖特1931),它测量了使用该程序估计的种群之间而不是种群内总遗传变异的比例阿尔列金.

推断序列单倍型之间的突变关系,反映了APOE的复数轨迹通过简化中值(RM)网络算法可视化(Bandelt等人。1995). RM算法明确地将不同于单个可变位点的单倍型连接起来,然后使用基于频率的兼容性标准在连接其余单倍型的同等可能的突变路径中进行选择。换句话说,该算法假设突变事件通常从更频繁的单倍型发展到不太频繁的单倍型(合并理论支持的统计假设)。尽管如果选择起作用,这一假设可能会被违背,但对于像本文描述的这样的数据集,其中比较了大量密切相关的单倍型,很少需要这个假设;因此,这种假设不太可能偏离最终结果。在明显的平行性无法解决的情况下,不确定性被描述为网络中的网状结构或环路。单倍型在每个网络中由开放的圆圈表示,每个圆圈的面积与样本中该单倍型的拷贝数成正比。使用该计划的RM选项,为组合的总样本和四个群体样本中的每一个构建RM网络网络2.0作者:A.Röhl。

根据Griffiths和Tavaré的方法,仅针对IS兼容数据导出了中性突变参数θ的最大似然(ML)估计(1997). 在本分析中,不能考虑表现出同源性的位点,这也假设了稳定的种群和选择性中性变异。IS-相容样本的多样性估计值与原始数据的估计值在任何情况下都没有显著差异,这表明数据截断没有引入重大偏差。使用组合样本以及每个个体群体样本进行分析。通过比较有无人口扩张模型的似然估计值,明确验证了人口规模不变的假设。当模型中包括指数型人口增长时,无论是考虑组合样本还是单独的人口样本,均未观察到可能性的显著改善。因此,所有计算均假定种群规模不变。相关年龄估计t吨ime到成本第页最近c(c)普通人ncestor(TMRCA公司)和个体突变,以2为单位生成世代,并使用从θ(4)的ML估计得出的有效人口规模估计值转换为年μ) 估计生成时间为20年。后一种转换假定了突变率,μ,共1.29×10-4/基因座/世代,根据人类-黑猩猩500万年前的发散假设计算(BP)(Horai等人。1992)如Harris和Hey之前所述(1999). 该估计值是根据观察到的人类和黑猩猩之间序列差异的净数(64.7)计算得出的,该估计值忽略了长度变化/差异,没有考虑到功能限制。年龄估算中报告的不确定性也不考虑任何一项估算的不确定性N个e(电子)以及μ。虽然简化排除了精确性,但该方法提供了基因进化历史的一般特征。所有计算都是用程序进行的基因树(格里菲斯和塔瓦雷1997).

结果

核苷酸水平的APOE多样性

核苷酸多态性的性质、数量和人群分布APOE的复数Nickerson等人在报告中描述了这里调查的四个人群中的三个的基因座(出版中). 总之,在调查的5491-bp区域中鉴定出22个可变位点:21个双列单核苷酸多态性(SNP)和一个多等位基因插入/缺失多态性(5229A,图1表1). 5个位点为单核;也就是说,在144条染色体的样本中(即位点308、545、2907、3106和3673;位点3106是一个非同义替换),只观察到一个较罕见的等位基因拷贝,而另外五个“doubleton”位点有两个较少见的核苷酸拷贝(位点73、471、1522、1575和4036;位点4036是一个非同义替代)。在本研究中,APOE的复数此外,还对来自墨西哥坎佩切州的第四个种群的序列变异进行了调查,从而使序列多样性调查的染色体总数达到192条。在Campeche样本中,在参考序列的位置3701处发现了一个新的单核插入变体(涉及CT二核苷酸的插入)(图1表1). Campeche样本中还存在另外八个多态性位点,所有这些位点都已在早期调查中确定(560、832、1163、1998、2440、3937、4075和5229B)。在新样本中没有观察到先前鉴定的单体或双体变体等位基因。所有23个变体相对于Nickerson等人报告的参考序列的位置(出版中),如所示图1.

保存图片、插图等的外部文件。对象名称为AJHGv67p881fg1.jpg

多态性变体在APOE的复数基因。通过对96个个体5.5 kb的测序确定的23个DNA变体的基因组位置显示在APOE的复数基因。星号(*)表示在坎佩切(Campeche)3701位的玛雅样本中发现的新变体,x表示观察到的多态性的种群分布(J=杰克逊(Jackson),C=坎佩切,N=北卡雷利亚(North Karelia),R=罗切斯特(Rochester))。导致氨基酸替换的变体被装箱。

表1

观察到的单倍型APOE的复数

现场b条
人口计数c(c)
单倍型733084715455606248321163152215751998244029073106367337013937*40364075*49515229安5229亿5361J型C类N个R(右)P(P)
黑猩猩d日C类C类A类C类A类T型G公司G公司G公司C类G公司G公司T型T型C类C类C类C类A类G公司T型
ε2:
10................T型.T型.T型.10124
16....T型...........T型.T型.T型.10012
22....T型C类...T型......T型.T型.T型.00011
9.....C类..........T型.T型.T型.00145
24.....C类..........T型.T型C类T型.00011
ε3:
26....T型C类T型C类........T型.....00011
21.....C类T型C类.T型......T型.....00011
4e(电子)....T型.T型C类........T型.....152816
29......T型C类.......计算机断层扫描T型.....01001
1e(电子)......T型C类........T型.....81911745
30......T型C类....G公司...T型.....00101
14......T型C类A类.......T型....C类00202
19.......C类........T型.....10001
6e(电子)................T型.....5008
27.T型..T型.........G公司.T型.....10001
8e(电子)....T型...........T型.....2005
e(电子)....T型......A类....T型.....8115
11e(电子).....C类.....A类....T型.....00022
2e(电子)...........A类....T型.....156111143
28...T型.......A类....T型.....10001
7e(电子)...........A类....T型....C类11428
25..........A类A类....T型....C类00101
ε4:
17T型................T型....20002
12......................10012
13....T型..............C类..00112
20..G公司.T型.T型...............10001
23..G公司...T型...............10001
15.....C类T型...A类...........00022
18......T型...A类........C类.C类00101
5......T型...A类...........059115
31......T型...A类..C类........00011
单倍型是根据它们在混合样本中的相对频率按降序编号的。
b条23个位点的位置,与Nickerson等人(出版)报道的参考序列相关。星号(*)表示定义三种常见蛋白质亚型的非同义cSNP(如左列所示)。与黑猩猩相同的碱基用圆点标记。5229A位点的多等位基因indel的相位尚未确定。
c(c)J=密歇根州杰克逊;C=墨西哥坎佩切;N=芬兰北卡雷利亚;R=罗切斯特,明尼苏达州;P=合并样本。
d日nd=无法确定5229A位点的多等位基因indel的祖先状态。
e(电子)单体型表现为纯合子或单位点杂合子。

描述组合样本和四个总体样本中每一个样本的序列多样性的汇总统计见表2总的来说,根据观察到的多态位点数量估计总样本的平均核苷酸预期杂合度(θ)(Watterson1975)为0.0007±0.0002。基于平均两两序列差π(Nei1987),略低(0.0005±0.0003)。这些估计值低于其他常染色体(Li和Sadler)的多样性估计值,但没有显著差异1991; Harding等人。1997; Clark等人。1998; Rana等人。1999; Rieder等人。1999; 汉布林和迪里恩佐2000)和X-linked(Zietkiewicz等人。1998; 哈里斯和嘿1999; Jaruzelska等人。1999; Kaessmann等人。1999)人类遗传位点。塔吉玛的估计值(1989)D类还有傅和李的(1993)D类佛罗里达州F类统计数据与0没有显著差异。在所有四个群体样本中观察到超过预期的单倍型数量,以及组合样本和这种过量的单倍体变异,如Fs公司统计(Fu1997),在Jackson和组合样本中都非常显著。观察到的过量单倍型多样性可能反映了反复突变和/或等位基因间重组的影响,如下所述。

表2

多样性估计和中性测试APOE的复数

总体样本结果
杰克逊坎佩切北卡累利阿区罗切斯特合并样本
n个48484848192
b条 148131322
c(c) 42216
θ (× 10−4)d日5.75 ± 2.173.28 ± 1.445.33 ± 2.055.33 ± 2.056.87 ± 2.05
π (× 10−4)e(电子)4.36 ± 2.413.92 ± 2.215.62 ± 2.976.37 ± 3.305.31 ± 2.80
D(田岛1989)−.736.531.163.586−.619
D类佛罗里达州(傅、李1993)−.438−.148.5061.05−1.09
F类(傅、李1993)−.650−.090.4641.07−1.09
单倍型数量169131831
预期单倍型数量(f)7.8 ± 2.27.3 ± 2.19.1 ± 2.49.8 ± 2.512.9 ± 3.1
Fs公司(傅1997)−7.080***−.963−2.378−6.203*−15.055***
调查的染色体数。
b条多态位点的数量,不包括位点5229A indel。
c(c)单一站点的数量。
d日每个核苷酸的预期杂合性,假设没有重组,根据方差估计得出的SE(Watterson1975).
e(电子)假设无重组(Nei)1987).
(f)1000个随机样本分布得出的估计值的平均值±SD(参见材料和方法).
*P(P)<.05.
***P(P)<.001.

常见APOE等位基因的单倍型变异

在192条染色体的总样本中观察到的22个变体被发现分离为31个不同的序列单倍型(5229A位点的多等位基因indel的相位尚未确定)。这些单倍型在组合样本中按相对频率递减的顺序编号,根据总体序列相似性排列,并根据它们在3937和4075位的变异定义的经典蛋白质等位基因(即ε2、ε3、ε4)排列,如图所示表1在我们的样本中,我们没有观察到决定cSNP的第四种异构体构型的例子(即位于3937和4075位点的单倍型组合C-T,而不是T-T[ε2]、T-C[ε3]或C-C[ε的4])。在我们的样本中未能观察到C-T单倍型,这与之前关于载脂蛋白E多态性的调查一致,这些调查从未观察到氨基酸替换的组合(de Knijff等人。1994).

在组合样本中,13(0.068)个观察到的序列单倍型包含ε2等位基因,152(0.792)个为ε3等位基因和27(0.140)个为λ4等位基因(表1). 然而,三个等位基因的相对比例在人群样本中不同,与ε2型序列单倍型相关的相对频率差异最大(表1). 例如,在坎佩切样本中根本没有观察到后一类序列单倍型(ε2、ε3和ε4的相对频率分别为0、0.896和0.104),而在罗切斯特样本中更常见(相对频率0.188、0.687和0.125)与其他两个群体样本中的任何一个相比(杰克逊样本中的相对频率为0.042、0.854和0.104,而北卡雷利亚样本中的相关频率为0.042,0.729和0.229)。ε2等位基因相对频率的显著人群间差异(χ2=8.29,P(P)=0.004)与之前的观察结果一致(Corbo和Scacchi1999).

全序列分析和单倍型测定揭示了三个蛋白质等位基因类中每个类的实质性异质性(表1). 最罕见的等位基因类ε2在总样本中由五种不同的序列单倍型组成,在四个核苷酸位点存在变异(表1). 同样,最常见的等位基因类ε3包括17个不同的序列单倍型,在14个位点上有所不同。最后,观察到9种不同的ε4型单倍型,它们在10个位置上有所不同。在ε2或ε3单倍型组中发现的多态位点有一半在这些组中以单倍体形式出现,在组合样本中发现的六个单倍体中有五个与ε3型序列单倍型相关。相比之下,ε4群中分离的10个位点中只有2个是单核的。在相对不太常见的ε4类单倍型中发现的大量可变位点导致对这组等位基因θ的估计与对ε3s的观察结果相同(两种情况下均为0.0005±0.0002)。通过相同的测量,ε2型单倍型的内部多态性较小(θ=0.0002±0.0001)。

黑猩猩同源基因组区域的比较(黑猩猩)确定了人类共识之间的76个固定序列差异(Genbank公司AF261279)和黑猩猩(GB AF261280)序列,包括63个核苷酸替换和13个长度差异,从1到36 bp不等。考虑到人类多态性变异(Nei1987),为64.7(此估计值的计算忽略了长度变化/散度)。对于在人类中观察到的每一个双列核苷酸多态性,两个等位基因中的一个出现在黑猩猩的同源位置(表1). 除一例外(3937位点),更常见的人类变异与假定的祖先等位基因相对应。虽然这里测序的黑猩猩单倍型不能被认为是所有单倍型的代表APOE的复数该物种的变异,在黑猩猩(C)的这个位置观察到的核苷酸也存在于其他非人类灵长类物种(Hanlon和Rubinsztein1995)这表明它实际上是这个位置上真正的祖先状态。单倍型12是ε4单倍型之一,在22个可变位置上的核苷酸配置与在黑猩猩同源序列位置上观察到的核苷酸配置相同,但该单倍型在75个额外位置上仍与黑猩猩的不同。这一观察与之前的分析一致,这些分析表明ε4等位基因是祖先APOE的复数根据与非人灵长类动物的序列比较得出的等位基因(Hixson等人。1988; Hanlon和Rubinsztein1995)或两者之间的联系不平衡模式APOE的复数和下游轨迹APOCI公司(Seixas等人。1999).

APOE等位基因变异的进化史

观察到的变异可能的系谱历史是从RM网络中推断出来的(Bandelt et al。1995)在组合样本中构建单倍型(图2)和每个单独的人群样本(图3). 在RM网络中,圆圈对应单个不同的单倍型(如表1),缩放圆圈的大小以反映样本中每个单倍型的相对频率。单倍型通过分支相互连接,沿着分支显示突变差异。例如,在图2单倍型5和18在4951和5361位点发生突变而彼此不同,而单倍型15和5仅在624位点发生突变。当追踪单倍型之间的联系时,可以推断该位点突变的历史,特别是如果外群信息允许识别网络中的“根”单倍型(单倍型12,如上所述)。

保存图片、插图等的外部文件。对象名为AJHGv67p881fg2.jpg

的RM网络APOE的复数汇总总样本中的序列单倍型。突变关系由连接31个独特单倍型的线表示,在网络中以圆圈表示(较浅的线表示推断的突变关系,如果假定是由涉及位点560的重组或反复突变引起的同源性,则推测的突变关系可能性较小)。每个圆圈的大小与总样本中单倍型的相对频率成正比。单倍型之间的突变差异显示在网络的分支上(变体和单倍型的编号如表1; 导致氨基酸替换的突变被装箱)。单倍型12(阴影)是网络中的根单倍型。三个大框表示定义ε2、ε3和ε4的单倍型组APOE的复数等位基因。

保存图片、插图等的外部文件。对象名为AJHGv67p881fg3.jpg

RM网络APOE的复数四个群体样本中的单倍型。描述单倍型关系的网络,如在每个样本中发现的那样,以黑色显示。在整个网络中存在但在特定样本中缺失的其他分支以浅灰色表示。数字仅标记单倍型(未显示突变)。方框表示定义ε2、ε3和ε4等位基因的单倍型组,如图2.

如总样本的RM网络所示(图2),31APOE的复数单倍型可分为四个主要谱系或分支,它们与3937和4075位点变异定义的蛋白质等位基因类一致,与表1ε2和ε4单倍型组各自包含系统发育上不同的谱系。然而,ε3单倍型组由两个离散的、频率相同的分支组成,由三个突变步骤(涉及位点832、1163和2440的变化)和两个过渡单倍型(6和19)分开,这表明谱系中存在一个重大分歧,而之前的蛋白质水平或DNA水平变异调查未发现这一分歧。导致单倍型8和27的第三个次要亚叶也从该组的核心单倍型(6)延伸而来。

网络中的根单倍型是单倍型12,编码apoE4亚型。总样本中只有两个这种单倍型的拷贝,一个拷贝在Jackson,一个在Rochester(表1). Jackson样本中的根与其他人类遗传变异研究一致,这些研究在非洲黑人群体中发现了根单倍型(例如,Harding等人。1997; 哈里斯和嘿1999). RM网络清楚地表明,优势ε3等位基因类是通过根单倍型的单步改变从ε4组衍生而来的,涉及3937位点,cSNP导致apoE蛋白残基112处cys→arg取代。ε2型单倍型是由ε3组的核心单倍型通过两个变化衍生而来的,一个位于5229B位点,另一个位于先前识别的cSNP位于4075位点。除了核心ε3单倍型(单倍型6)外,组合样本中的所有其他单倍型都是根单倍型的两个突变步骤。

上游调控区域变异的同构性

RM网络中所示数据的一个显著特征是同源性(推测在可变位点发生多个独立的进化事件,导致相同的等位基因状态),它影响了APOE的复数轨迹。总之,在阶段性单倍型中的22个变体中,有7个显示出一些同源性证据,特别是两个位点,560和624(分别对应于Artiga等人之前报告的位于−491和−427的调控区变体)。1998b条)在RM网络中重复发生。两个未解析的环和一个被560位点重复突变假设打破的双环都表明这些位点发生了多次突变和/或短时间重组事件。位点560(−491)特别同质性,在组合样本的网络中发生八次(单倍型1和4、1和26、12和13、6和8、2和3、20和23、10和16、9和22之间)图2). 事实上,560位点的同源性非常明显,因此对100多个个体进行了验证性等位基因特异性扩增,以确保该位点已被正确定相。站点624(−427)在网络中出现了六次。其他同质性站点包括4951和5361,位于3′侧翼区域(各出现三次),以及站点832(−219)、1575和1998(各出现两次)(表3). 推断的同源性并不局限于任何特定类别的等位基因:在网络中不同位置出现相同突变状态与ε2-、ε3-和ε4-型单倍型相关。该观察结果与之前的报告一致,这些报告表明,这些位点的变异与AD风险的关联通常与ε4等位基因状态无关(Artiga等人。1998; Bullido等人。1998).

表3

APOE的复数位点杂合性和观察到的同源性与潜在突变

现场杂合性同性恋b条重复主题变异性类型c(c)周围序列d日
73.021MIR公司AGGATTCACGcCCTGGCAATT公司
308.0110CCACCCTCCcATCCCACTTC公司
471.021平方米0CCAAGTAGCTAGTAGGATTAGG公司
545.011平方米0ACCATGTTGGcCAGGCTGGTC公司
560.358平方米0CTGGTCTCAAaCTCCTGACCT公司
624.136平方米0AGGCGTGAGCtACCGCCCA公司
832.5020骨料
1163.4610ACCCTGGAAgCCCTGGCCTC公司
1522.021TGAGGTTGGAgCTTAGAATGT公司
1575.0221GAGATGGAACcGGCGGTGGG
1998.1920CCCCATTCAGGCAGACCTGG公司
2440.4610CTGGCTGAGTTGAGGTTTT公司
2907.011CTGCCCAACatGGCTCCAAAAG公司
3106.0110CGCTGGGAACtGGCACTGGGT公司
3673.0110GCCTCTGCCCcGTTCCTTCTC
3701.0110TGGTCTCTCTC^GGCTCATCCC
3937.2411GGAGGACGTGcGCGGCGCCT公司
4036.0211GCGCAAGCTGcGTAAGCGGCT公司
4075.1311CCTGCAGAAGcGCCTGGCAGT公司
4951.04Sg公司0AGTAGAGACGaGCTTTCACCA公司
5229安e(电子).632TGGGGGG-GGGG ^GTGGTGTG
5229亿.1312TGGGGGGGGGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGT
5361.122CCCAGCTTTtATTATTT公司
多态位点相对于参考序列的位置,如Nickerson等人(出版中).
b条同源性=同源性计数,即必须用来解释组合样本中观察到的单倍型多样性的独立突变数。
c(c)0型=无已知突变基序;类型1=CpG;2型=单核苷酸运行;3型=α-聚合酶终止点(Templeton等人。2000).
d日^=多态indel的位置。
e(电子)多等位基因indel(单倍型阶段待定),所有其他位点均为双列SNP或indel。

观察到的同源性,与Fs公司测试统计可以解释为由反复突变或单倍型间重组(互惠交换或基因转换)引起。预期交互重组至少在某些时候会导致多个相邻位点的交换,就像最近一次对低密度脂蛋白轨迹(Templeton等人。2000),但未观察到这些。此外,与低密度脂蛋白(Clark等人。1998),只有一小部分位点对显示了所有四种配子类型(组合样本中231个比较中的38个,或16.5%)(表4)这表明数据更多地由少数位点的极端同源性控制,而不是整个测序区域的广泛重组。同源性影响位于测序区域5′端和3′端的位点,这与推测的缺乏互惠交换事件一致,但如前所述,没有观察到涉及位点3937和4075的T-C cSNP单倍型实例。

表4

显著的成对连锁不平衡(D类)和四个Gamete站点对计数

杰克逊坎佩切北卡累利阿区罗切斯特合并样本
D类用于样品
站点1/站点2:
73/4036.040***.010***
624/4075.078**.032***
624/5229B年.078**.032***
832/1163.140***.195***−.153***.199***.187***
832/1998−.039−.084**.047*.051***
832/2440.119***.130***.214***−.146***−.167***
832/3937.018−.039−.084**.029.045***
832/4075−.010.023−.082**−.031***
832/5229B号−.010.023−.082**−.031***
1163/1998.054*−.076**−.030−.037***
1163/2440.109***.109***−.132***−.118***−.129***
1163/3937−.022.054*−.076**−.044−.050***
1998/3937.093***.156***.073***.084***
2440/3937.054*−.022−.091**−.042−.051***
4075/5229B型.040***

.040***
.152***
.063***
样本数据汇总
成对LD比较总数45155566120
重要时间编号P(P)< .001545515
比例11.1%26.7%9.1%7.6%12.5%
两两四配子比较总数91287878231
没有,有四个配子9172538
比例9.9%10.7%21.8%32.0%16.5%
不平衡统计报告为D类=P(P)ij公司-第页第页j个,其中P(P)ij公司是一对站点中最常见的配子类型的频率,第页第页j个是该单倍型中核苷酸的频率。Fisher精确检验报告了尾部概率。
*.01<P(P)<.05.
**.001<P(P)<.01.
***P(P)<.001.

虽然在APOE的复数在已知突变热点基序处出现,七个同源位点中只有两个(位点1575和5361)出现在这些区域(表3). 这将反对重复突变产生推断的同源性。两个最同源的位点560和624位于重复序列,中度同源位点4951也一样(表3). 在调查的5.5 kb中,与此类重复序列相关的序列多态性水平并不高于在非重复区域观察到的水平(Nickerson等人。,出版中)因此,这些关联的意义(如果有的话)尚不清楚。在缺乏直接经验证据的情况下,无法确定基因转换或复发突变是否是对观察到的模式的更合理的解释。有趣的是,虽然定义ε2-ε3-ε4多态性的两个位点(3937和4075)都属于CpG二核苷酸(已知在APOE的复数【Larsen等人。1993]因此,原则上,很可能是突变的热点[库珀和克劳扎克1989])RM网络并不表明这些位点存在同源性。

高水平的位点同源性,加上大量的低频变异,解释了在APOE的复数每个抽样种群内的基因座。每个群体样本中发现五个或更少的位点对具有显著的LD水平(Fisher精确检验P(P)<.001),只有15对(所有两两比较的12.5%)在该水平上在合并样本中显著(表4). 站点832位于显著LD中,在合并样本中站点数量最多(1163、1998、2440、3937、4075和5229B)。然而,在单独的人群样本中,只有832位点与1163位点和2440位点之间的相关性得到一致观察。值得注意的是,尽管组合样本中的15个重要位点对中有7个涉及位点3937和4075的普通型cSNP,但只有两个涉及这些位点的位点对(1998-3937和40.75-5229B)在单独的人群样本中显示出一致的关联性(表4). 在这个小样本中观察到的LD模式通常与从相同位点的大样本非相位基因型数据中估计的LD相似(Nickerson等人。,出版中和未发布的数据)。更准确地理解中的LD模式APOE的复数等待对更大样本进行基于单倍型的详细分析。

APOE多样性的群体差异

序列单倍型多样性,正如在单独的样本中发现的那样,表明四个被调查群体的遗传组成存在微小但显著的差异。F类装货单(堰1996)合并样本的计算值为0.060(P(P)<.001,通过单倍型排列)。成对估计F类装货单(表5)杰克逊和坎佩切的样本之间的最高值为0.127(P(P)<.001)至罗切斯特和北卡雷利亚之间0.034的低点(P(P)<.05). 这些估算值与根据特定场地估算值平均值计算得出的估算值具有可比性,其中F类装货单观察到的值为0.045(Nickerson等人。,出版中). 在单倍型水平上,种群的分化程度较高,这与单倍型的种群特异性分布一致:在31个单倍型中,有18个(0.581)发生在单个种群样本中(表1)而23个可变位点中的11个(0.478)仅限于一个样本(Nickerson等人。,出版中) (表1). 罗切斯特样本中发现了最大比例的独特单倍型(18个中的7个,即0.389)。仅两个样本共享六个单倍型,三个样本共享两个单倍体,所有四个群体样本共享五个单倍形(1、2、3、4和7)(表1). 单倍型5(属于序列单倍型ε4组)在Jackson样本中缺失,尽管在组合样本中发现其总体相对频率高于单倍型7。

表5

人口细分的成对估计(F类装货单)

杰克逊坎佩切北卡累利阿区罗切斯特
杰克逊
坎佩切.127***
北卡累利阿区.068**.035*
罗切斯特.052***.054***.034*
*P(P)<0.05(通过基于单倍型的排列)。
**P(P)<.01(通过基于单倍型的排列)。
***P(P)<.001(通过基于单倍型的排列)。

所观察到的单倍型的群体分布差异通过以下样本特异性RM网络清楚地说明了:图3最明显的是来自坎佩切的玛雅样本中缺少序列单倍型的ε2分支,这一观察结果与该样本中的低总体序列多样性水平一致(表2)以及之前关于载脂蛋白E多态性的报告,其中指出在其他新世界人群样本中没有ε2等位基因(Crews等人。1993; 坎波1995; Scacchi等人。1997). 在其他三个样本中发现的ε2单倍型变异程度也不同:在Jackson和North Karelia样本中,ε2s由成对的单倍型代表,而在Rochester样本中则有ε2变异的全部表现。ε3单倍型分布的群体差异不太显著。在所有四个样本中观察到两种最常见的ε3s类型(单倍型1和2),以及密切相关的衍生单倍型3、4和7。然而,核心ε3单倍型(单倍型6)在欧洲样本(北卡雷利亚和罗切斯特)中不存在,而连接单倍型6~1的罕见单倍型19仅在Jackson的黑色样本中观察到。ε3单倍型分布中剩余的种群间差异主要涉及罕见变异,这些变异与常见的ε3单体型有一个或最多两个位点的差异。站点560和624处的同质性,导致整个RM网络ε2和ε3分支中的未解决回路(图2),仅在罗切斯特样本中观察到(图3).

种群样本网络之间最重要的差异涉及四个样本中ε4分支的组成。在杰克逊的样本中观察到的ε4群的两个子支(导致单倍型17和20)在其他三个种群样本中完全不存在,而在玛雅和欧洲衍生的种群样本中观察到的ε4分支的一部分(如上所述,以单倍型5为主)在杰克逊的样本中缺失。这些分支在所有人群中存在的程度,但频率较低,因此在每个人群的48条染色体样本中没有捕获到,这是从其他和/或更大的样本中可以看到的。无论如何,观察到的样本差异表明ε4亚型的相对频率存在种族和/或地理差异,这显然值得在文献中风险关联冲突的背景下进行进一步调查。区分单倍型5和Jackson特异性ε4s的核苷酸多态性是1998位点,这是一个以前未被识别的位于内含子2 5′末端的变体(图1).

APOE变化的时间深度

RM网络总结了序列单倍型之间的突变关系,但没有提供序列差异出现的时间段的指示。ε2-ε3-ε4时间深度的测定APOE的复数多态性与理解蛋白质水平多态性的当前地理分布以及评估人口统计学和选择性过程对观察到的变异的相对影响有关。估计多态性时间深度的最直接方法是将观察到的人类种内多样性水平与观察到的人与黑猩猩之间的固定种间差异数量进行比较。如上所述,人类和黑猩猩之间的净序列差异APOE的复数基因估计为64.7;同一基因组区域的人类单倍型之间的平均成对序列差异为2.93。如果假设分子钟恒定,人类和黑猩猩的发散时间取500万年BP(Horai等人。1992),产生观测到的变化所需的时间为~226000年。

为了更全面地了解APOE的复数等位基因发散,我们还使用基于中性序列进化合并模型的ML方法(Griffiths和Tavaré1997)它使用单倍型网络中的所有信息来推断TMRCA公司观察到的变异以及个体突变的年龄(有关使用相同方法进行的指示性先前分析,请参见Harding等人[1997]哈里斯和嘿[1999]). 总时间深度的估计APOE的复数计算组合样本和每个单独群体样本的变异和特定突变年龄(表6). 一个基因树描述了组合样本中单倍型之间的进化关系,并总结了该树中突变的年龄估计,如所示图4该树的主要特征出现在为单独的种群样本生成的每棵树中,尽管变化的总时间深度(由T总结MRCA公司估计值表6)由于各自样本的单倍型组成的差异而有所不同。

保存图片、插图等的外部文件。对象名为AJHGv67p881fg4.jpg

IS-compatible的缩放合并基因树APOE的复数总(合并)样本的变化。树显示了与IS模型兼容的16个单倍型的推断系谱历史(由树底部标记每个末端分支的编号标签表示;单倍型编号如表1). 树中变异体的平均估计年龄,在谱系中表示为编号点,由程序推导得出基因树。对于具有多个突变的分支,时间上的突变顺序是任意的。在定义ε2、ε3和ε4的单倍型组下面画水平线APOE的复数等位基因。导致氨基酸替换的突变被装箱。

表6

遗传树中群体遗传参数的估计

样品n个b条θW公司c(c)θ毫升d日N个e(电子)e(电子)T型MRCA公司(f)(×105年)年龄(f)场地3937(×105年)平均年龄(f)其他场地(×105年)
杰克逊48122.73.236,2602.92 (1.59–5.40)2.09 (1.08–4.13).54
坎佩切4861.351.322,5581.99 (.95–4.03)1.44 (.68–3.10).46
北卡累利阿区46102.282.444, 7292.73 (1.49–5.03)2.0 (1.04–3.92).63
罗切斯特46102.282.54,8452.7 (1.45–5.04)2.06 (1.04–4.03).56
联营183183.113.667,0933.11 (1.76–5.79)2.2 (1.22–4.40).45
删除不兼容IS-数据后的样本量(排除的位点和单倍型细节可根据要求提供)。
b条IS兼容多态位点的数量。
c(c)沃特森(1975)估计量θ每个基因座,基于.
d日每个位点θ的ML估计基因树程序(请参见材料和方法).
e(电子)有效人口规模,由θ导出毫升假设μ=1.29×10-4/地点/世代。
(f)假设给定的N个e(电子)代时为20年。括号中给出了2.5%和97.5%的年龄分布点。

兴趣有三个主要特征。首先,T的估计MRCA公司(即树的总延时)为311000年BP(95%可信区间为176000至579000年BP)。当考虑到不同人群样本的变化时,估计值约为200000-300000年BP(表6). 该时间深度低于T的770000±420000年等效推算值,但没有显著差异MRCA公司人类β-珠蛋白多样性的时间深度大致与中性常染色体位点的预期时间深度相同(Harding等人。1997). 其次,3937位点是区分ε2和ε3等位基因和ε4等位基因的cSNP,是树中最古老的突变,大约是is-compatible数据集中其他突变的两倍(图4). ML分析表明3937位点的年龄在150000年至220000年之间(表6). 最后,据估计,该树中的所有其他突变都发生在过去90000年内,还有一些突变发生在过去10000年内。除站点3937外,所有站点的平均年龄在所检查的每个人口样本中为~50000年(表6). 即使我们可以在这个分析中纳入所有同源位点(如材料和方法第节,为了符合IS兼容数据集的要求,这些被排除在外),3937位点相对年龄的显著差异,反映了我们样本中该位点衍生等位基因的相对频率较高。

这些分析的一个关键假设是,变化是选择性中性的。如果满足这一假设,那么这些分析表明ε4与ε2和ε3分支之间的分歧(由3937位点的突变确定日期)开始于约200000年前,而随后的等位基因内分歧大多只是在人类历史上最近发生的,即过去60000年内。相反,如果选择增加了3937位点突变的相对频率(如下所述),那么推断的年龄可能会高估ε2-ε3-ε4多态性的古老性,因为仅考虑随机遗传漂变的影响,样本中的位点的相对频率会高于预期。无论是哪种情况APOE的复数这些年龄估计表明的蛋白质多态性与ε2、ε3和ε4等位基因在人群中长期保持平衡多态性不一致。

偏离选择性中立的证据

根据整个5.5kb测序区域的变异模式估计的四个测试统计数据中,有三个是(D、, D类佛罗里达州、和F类)表明在统计上没有明显偏离选择性中立(表2). 虽然是第四个,Fs、,确实表明Jackson、Rochester和组合样本偏离了中性预期,如前所述,这些样本中广泛的位点同源性表明,这种偏离更可能是由单倍型间重组的影响而非遗传搭便车造成的。此外,HKA测试(Hudson等人。1987)水平比较APOE的复数多态性和与其他两个相同取样的人类常染色体基因的差异,低密度脂蛋白(克拉克等人。1998; Nickerson等人。1998)和β-珠蛋白(Harding等人。1997),表明没有显著差异(P(P)>.05,数据未显示)。通过所有这些标准的一般措施,那么,APOE的复数序列变异表明,它非常适合中性预期。

然而,数据的几个特征似乎与位点3937定义的ε3型序列单倍型的选择性扩展大致一致。如前所述,组合样本中的六个单体变异中有五个与ε3型序列单倍型相关。低频变异预计会伴随着有利突变频率的增加,因为群体中预先存在的变异在包含有利位点(Fu和Li)的单倍型的“扫描”固定中被取代1993). 受影响的基因组区域的大小取决于选择的强度和重组率;如果重组率很高,受扫描影响的序列区域将很小,并且只有所选位点紧邻基因组的位点才会显示预期的频率扰动(Kaplan等人。1989). 在这种情况下,我们样本中的单体变异体都位于第四外显子的上游,而第3937位点的突变就位于该外显子上游(图1). 滑动窗口估计F类测试统计(测量多态性在多大程度上以过量的单体变异为特征)表明,在测序区域的中心,包含3000–4500个碱基的低频变异持续过量(图5). 此外,尽管位于外显子4上游的1kb序列的特征是低水平的多态性(以平均成对序列差π测量)、种间序列差异(以净序列差异测量)、,K)在这个中央部分高于相邻区域,反映出在测序区域的这一部分中多态性和差异性模式之间的显著不一致(图6). 这种差异与一个中性突变率从正常到高的区域最近的变异丢失是一致的。

保存图片、插图等的外部文件。对象名为AJHGv67p881fg5.jpg

滑动窗口分析F类测试统计(Fu和Li1993). 估计F类计算了沿着5.5-kb测序区域以25-bp步长放置的重叠750-bp宽窗口。每个窗口的值都绘制在窗口的中点,这些点用一条连续的线连接起来,以便于检查。显示了合并样本和每个单独总体样本的滑动窗口图(J=Jackson,C=Campeche,N=North Karelia,R=Rochester)。的位置APOE的复数测序区域内的外显子直接显示在合并样本图的下方。

保存图片、插图等的外部文件。对象名为AJHGv67p881fg6.jpg

滑动窗口分析APOE的复数多态性(π)与种间差异(K). 估计人类单倍型之间的平均成对序列差异π和净序列差异,K、,在单倍型和黑猩猩之间APOE的复数序列,是针对沿着5.5-kb测序区域以25-bp步长放置的重叠750-bp宽窗口计算的。π绘制为一条光线(相对于左侧的刻度)K以粗体绘制(相对于右侧的比例)。的位置APOE的复数测序区域内的外显子显示在图的下方。

讨论

三种常见的载脂蛋白e亚型在全球普遍存在,尤其是ε3等位基因在所有人群中的相对频率居高不下,这让研究人员感到困惑,并引发了许多关于导致观察到的多态性的进化力的推测(例如,Hanlon和Rubinsztein1995; 科尔博和斯卡奇1999; 芬奇和萨波尔斯基1999). 然而,正如多年来人口遗传学文献中所承认的那样,当仅考虑氨基酸水平的变异时,几乎不可能区分相互竞争的解释(Lewontin1985). 只有当考虑到蛋白质多态性背后的核苷酸水平多样性时,才能做出相关推断(参见,例如Kreitman1983).

当我们深入研究载脂蛋白E蛋白多态性的表面时,我们发现了一些意想不到的东西。尽管这三种常见亚型的基础上存在着大量以前未被识别的变异,但如果这三个等位基因作为平衡多态性在人群中长期存在,则观察到的异质性远远低于预期。尽管在氨基酸水平上存在广泛的主要多态性APOE的复数轨迹仍然是较少的通过深度重测序检测的可变基因。平均核苷酸多样性(π)为0.0005,APOE的复数变量小于低密度脂蛋白(π=0.002)(Clark等人。1998; Nickerson等人。1998),王牌(π=0.0009)(Rieder等人。1999)β-珠蛋白(π=0.002)(Harding等人。1997)或MC1R公司(π=0.002)(Rana等人。1999; Harding等人。2000). 低水平的变异不是低中性突变率的函数:此处估计的突变率为1.29×10-4/基因座/世代与许多其他人类核基因座的估计值具有相同的数量级(Harding等人。1997; Clark等人。1998; Zietkiewicz等人。1998; 哈里斯和嘿1999; Jaruzelska等人。1999). 序列多样性的低水平也不符合平衡选择的预期效果,平衡选择的影响将有助于在选择目标两侧的区域积累更多的变异,这是遗传搭便车的结果。相反,观察到的多态性与有利突变(即3937处氨基酸改变的T等位基因)频率增加相关的变异减少更为一致,在频率增加到固定的过程中,该等位基因“扫除”了相关变异。

然而,应用于观察到的变化的测试统计数据都表明,除了与选择性中立的期望值很好地吻合之外,没有任何其他迹象。这些测试未能拒绝中立性可能反映出受建议扰动影响的序列窗口狭窄,我们样本中多态性水平相对较低,统计数据的零分布是在没有重组作用的保守模型的假设下生成的(Wall1999). 即使考虑到这里分析的数据集的特性,这些测试统计数据也因其缺乏威力而臭名昭著(参见Simonsen等人。1995)至少有一位作者认为,这种权力的缺乏可能直接源于通常假设的均衡中性模型的不恰当(吉莱斯皮2000). 显而易见的是,这些(和相关的)测试统计数据未能表明至少另外两个人类基因座的中性偏离,而这两个基因座有令人信服的、独立的选择性效应证据,即β-珠蛋白(Harding等人。1997)和Duffy血型位点(Hamblin和Di Rienzo2000). 因此,尽管我们没有发现自然选择对APOE的复数变异,推断选择起了作用并非不合理。与蛋白质亚型相关的表型的多样性提高了密切检查这种可能性的价值。

3937位点的新变体及其相关单倍型何时开始相对于祖先等位基因在频率上扩展尚不确定,也不太可能使用假设选择性中性的分析方法(如本文所用的方法)来解决。在所调查的四个种群中,每一个种群中都存在ε3亚系,而在所涉及的位点上没有复发突变的证据,这与3937位点的出现是一致的,3937位点出现在10万年前解剖现代人类传播的主要种群扩张之前。或者,强大的选择压力可能在最近促进了变种的全球分布。支持后一假设的间接证据是,来自罗切斯特和北卡雷利亚的欧洲样本中没有ε3分支的基本单倍型(单倍型6)(因此,如果存在,在这些人群中可能出现的频率较低),这表明欧洲ε3s的频率上升可能是在分支分化为两个初级谱系之后发生的。总体水平较低的人口异质性(F类装货单=0.06)也符合最近ε3的快速膨胀。无论是哪种情况,ε2单倍型的较低相对频率和斑块状的地理分布,以及它们从ε3分支的明确衍生,都表明后来定义这些等位基因的变体(4075位点)出现了。

一个相关的问题是,与观察到的变异相关的已知表型效应是否有助于现在的生殖健康的差异。有强有力的证据表明,ε4等位基因的遗传使携带者至少在欧洲和亚洲人群中有更高的罹患CAD或AD的风险(Davignon等人。1988; 玫瑰1996). 相对于ε3,ε4的有害性与长期遗传变化的历史相一致APOE的复数基因座,但CAD和AD都是成年晚期或老年的疾病,对这些疾病的易感性增加预计不会导致生殖成功的重要差异(关于相反的论点,请参见芬奇和萨波尔斯基[1999]). 广泛表达的蛋白质在体内确实发挥了许多不同的作用,包括促进脂质吸收、神经生长和再生以及免疫功能(Mahley和Huang1999)其中一个或多个可能会对生育率产生直接影响,或有助于差异生存和生殖成功。一项研究表明,携带至少一个ε3等位基因的男性平均比其他基因的男性有更多的孩子APOE的复数基因型(Gerdes等人。1996). 或者,APOE的复数变化可能反映了对改变饮食的适应(Hanlon和Rubinsztein1995),例如那些伴随着从自给经济向农业经济转型的经济(Corbo和Scacchi1999)可能在脑损伤的神经反应中起关键作用(Friedman等人。1999)或可能介导对脂原性病原体的敏感性(马丁1999).

人口水平分布差异APOE的复数变异与风险的综合预测和疾病病因的理解有关。尽管在APOE的复数基因,相当大的异质性在序列水平上表征了三个常见等位基因中的每一个,异质性有助于解释以前令人困惑的关联结果。例如,在一项关于不同种族AD发病率的5年前瞻性流行病学研究中,Tang等人(1998)发现,与ε3/ε3纯合子相比,与一个或多个ε4等位基因拷贝相关的AD相对风险(RR)在白人(RR 2.5)中显著增加,但在黑人(RR 1.0)或西班牙裔(RR 1.1)中没有增加。这些结果证实了之前的报告,即ε4与AD的相关性在纽约市黑人中较弱或不存在(Tang等人。1996)和印第安纳州(Sahota等人。1997)以及尼日利亚黑人(Osuntokun等人。1995)和东非(Sayi等人。1997). 在脂质方面也发现了类似的变化(Xu等人。1999). 鉴于我们发现单倍型的分布存在地理和/或种族差异,这些观察具有新的意义在内部ε4类(图3). 如我们的结果所示,如果在不同的地理区域以不同的相对频率发现不同类型的ε4等位基因,则必须解释这种异质性(可能与作用于位点的非中性力有关)。

同样,我们的数据提供了一个无价的进化背景,在这个背景下可以解释更为局限的分析。例如,最近人们对刻画APOE的复数启动子区多态性,并检查这些变体与AD和CAD风险的相关性。这些分析只取得了有限的成功。观察到的变异体并不能解释比普通等位基因变异体所解释的更大比例的观察到的表型变异,或者一个群体中的阳性关联在随后的研究中没有得到复制。这方面最有问题的差异集中在−491变体的作用上(Artiga等人。1998b条). 一些工人建议,该现场的变化是AD风险的一个强有力的决定因素(Artiga等人1998; Bullido等人1998)而其他研究人员则质疑多态性相对于其他调控区变体的重要性(Lambert等人。1998b;Town等人。1998)或未能完全复制这种关联(Roks等人。1998; Song等人。1998). 我们的分析提出了一个可能的解释:−491(此处为560位点)似乎特别容易发生反复突变和/或基因转换,这使其与不同的等位基因背景相关,在不同的人群中具有不同的功能效应。在这种情况下,结果发生冲突就不足为奇了。另一方面,在我们推断的单倍型网络中,位点832(−219)的显著位置,作为在多个群体中定义ε3和ε4单倍型主要亚型的位点,似乎与该位点与AD风险差异的关联一致(Lambert等人。1998a、, 1998b条)和心肌梗死(Lambert等人。2000). 其他变体在APOE的复数基因树(尤其是ε3s中的1163和2440位点以及ε4s中的1998位点)显然值得详细研究。当在这些可变位点对大样本进行分型并对相关表型进行评分时,将有可能直接测试可变位点对脂质表型影响的独立性。

我们对人类载脂蛋白E基因座的DNA序列变异进行了全面和初步的调查。我们还没有描述在全球范围内发生在基因上的序列变异的全部程度,也没有尝试识别可能在基因表达和疾病病因中起重要作用的连锁区域的多态性。尽管如此,我们的研究已经完成了之前的研究所接近的工作:对序列单倍型变异的系统研究,因为它发生在整个APOE的复数基因及其附近的侧翼区域,来自非临床人群的样本。该分析揭示了一种年轻的多态性及其在近代人类历史中的起源,尽管如此,它仍包含着复杂且基本上无法预见的异质性,这对我们理解变异编码的生物学具有重要意义。因为它已经被广泛研究,APOE的复数是一个很好的模型基因,说明了彻底考虑遗传变异的重要性(例如,Martin等人。2000),最好是没有对因果关系做出预先假设。从这项研究以及我们自己的工作中可以清楚地看到,一个基因中的位点之间没有一致或特定的可预测关系。特别是,可以测试方便甚至简单的假设,即只有编码变异才重要,或者基因中每个可变位点的作用独立于其他位点。最近发现的对血脂和AD危险因素有明显影响的调控位点清楚地证明了这一点,并且该基因在贮藏中有更多相同类型的惊喜(C.F.Sing,未发表的数据)。

致谢

我们感谢B.P.Lazzaro和E.T.Dermitzakis对手稿的评论。我们还感谢两位匿名评论员的建议。我们感谢国家心脏、肺和血液研究所对HL39107、HL58238、HL58399和HL58240的资助。

电子数据库信息

本文中数据的访问号码和URL如下:

阿勒金,http://lgb.unige.ch/arlequin(针对Arlequin项目)
DnaSP、,网址:http://www.bio.ub.es/~ julio/DnaSP.html(用于DnaSP软件)
家庭血压计划网站,http://www.hypertensiongenetics.org
Fluxus Engineering公司,http://www.fluxus-engineering.com/sharenet.htm(适用于Network 2.0软件)
Genbank、,http://www.ncbi.nlm.nih.gov/entrez/(对于黑猩猩APOE的复数参考序列(AF261280)
基因树,网址:http://www.maths.monash.edu.au/~mbahlo/mpg/gtree.html(适用于Genetree软件)
人类孟德尔在线遗传(OMIM),http://www.ncbi.nlm.nih.gov/Omim网站(用于apoE[MIM107741]和AD[MIM104300])

工具书类

Artiga MJ、Bullido MJ、Frank A、Sastre I、Recuero M、Garcia MA、Lendon CL、Han SW、Morris JC、Vazquez J、Goate A、Valdivieso F(1998年)阿尔茨海默病风险与APOE的复数基因。Hum Mol Genet 7:1887–1892[公共医学][谷歌学者]
Artiga MJ、Bullido MJ、Sastre I、Recuero M、Garcia MA、Aldudo J、Vazquez J、Valdivieso F(1998年b条)载脂蛋白E基因转录调控区的等位基因多态性。Fed Europ Bioch Soc信件421:105–108[公共医学][谷歌学者]
Bandelt HJ、Forster P、Sykes BC、Richards MB(1995),使用中值网络的人类线粒体肖像。遗传学141:743–753[PMC免费文章][公共医学][谷歌学者]
Bullido MJ、Artiga MJ、Recuero M、Sastre I、Garcia MA、Aldudo J、Lendon C、Han SW、Morris JC、Frank A、Vazquez J、Goate A、Valdivieso F(1998)APOE调节区的多态性与阿尔茨海默病痴呆风险相关。《自然遗传学》18:69–71[公共医学][谷歌学者]
Chartier-Harlin MC、Parfitt M、Legrain S、Perez-Tur J、Brousseau T、Evans A、Berr C、Vidal O、Roques P、Gourlet V、Fruchart JC、Delacoute A、Rossor M、Amouyel P(1994)载脂蛋白E、epsilon 4等位基因是散发性早发性和晚发性阿尔茨海默病的主要危险因素:19q13.2染色体区域分析。人类分子遗传学3:569–574[公共医学][谷歌学者]
Clark AG(1990)从二倍体群体的PCR-扩增样本推断单倍体。分子生物学进化7:111–122[公共医学][谷歌学者]
Clark AG、Weiss KM、Nickerson DA、Taylor SL、Buchanan A、Stengárd J、Salomaa V、Vartiainen E、Perola M、Boerwinkle E、Sing CF(1998)《人类脂蛋白脂肪酶核苷酸序列变异的单体型结构和群体遗传推断》。美国人类遗传学杂志63:595–612[PMC免费文章][公共医学][谷歌学者]
Cooper DN,Krawczak M(1989),胞嘧啶甲基化和脊椎动物基因组中CpG二核苷酸的命运。人类遗传学83:181–188[公共医学][谷歌学者]
Corbo RM,Scacchi R(1999)载脂蛋白E(APOE)等位基因在世界上的分布:APOE*4是“节俭”等位基因吗?Ann Hum基因63:301-310[公共医学][谷歌学者]
Corbo RM、Scacchi R、Mureddu L、Mulas G、Alfano G(1995)采用简单的聚丙烯酰胺凝胶等电聚焦技术研究了意大利本土血浆中载脂蛋白E的多态性。与其他欧洲人口的频率数据进行比较。《人类遗传学年鉴》59:197–209[公共医学][谷歌学者]
Corder EH、Saunders AM、Risch NJ、Strittmatter WJ、Schmechel DE、Gaskell PC Jr、Rimmler JB、Locke PA、Coneally PM、Schmader KE、Small GW、Roses AD、Haines JL、Pericak-Vance MA(1994)载脂蛋白E 2型等位基因对晚发性阿尔茨海默病的保护作用。《Nat Genet》7:180–184[公共医学][谷歌学者]
Corder EH、Saunders AM、Strittmatter WJ、Schmechel DE、Gaskell PC、Small GW、Roses AD、Haines JL、Pericak-Vance MA(1993)载脂蛋白E 4型等位基因的基因剂量和晚发家庭中阿尔茨海默病的风险。科学261:921–923[公共医学][谷歌学者]
Crews DE、Kambow MI、Mancilha-Carvalho JJ、Kottke B(1993)巴西西北部Yanomami印第安人载脂蛋白A-4、E和H多态性的群体遗传学:与脂质、脂蛋白和碳水化合物代谢的关系。人类生物学65:211–24[公共医学][谷歌学者]
Davignon J(1993)载脂蛋白多态性与动脉粥样硬化。摘自:Born GVR,Schwartz CJ(编辑)《冠心病的新视野》。《当代科学》,伦敦,第5.1–5.21页[谷歌学者]
Davignon J、Gregg RE、Sing CF(1988)载脂蛋白E多态性与动脉粥样硬化。动脉硬化8:1–21[公共医学][谷歌学者]
de Knijff P、van den Maagdenberg AM、Frants RR、Havekes LM(1994)载脂蛋白E的遗传异质性及其对血脂和脂蛋白水平的影响。哼变种4:178-194[公共医学][谷歌学者]
Finch CE、Sapolsky RM(1999)阿尔茨海默病的演变、生殖时间表和载脂蛋白E亚型。神经生物学老化20:407–428[公共医学][谷歌学者]
Friedman G、Froom P、Sazbon L、Grinblatt I、Shochina M、Tsenter J、Babaey S、Yehuda B、Groswasser Z(1999)载脂蛋白E-ε4基因型预测创伤性脑损伤幸存者预后不良。神经病学52:244–248[公共医学][谷歌学者]
Fu Y-X(1997)针对人口增长、搭便车和背景选择的突变中性统计检验。遗传学147:915–925[PMC免费文章][公共医学][谷歌学者]
Fu Y-X,Li W-H(1993)群体DNA样本中性的新统计检验。遗传学133:693–709[PMC免费文章][公共医学][谷歌学者]
Gerdes LU、Gerdes C、Hansen PS、Klausen IC、Faergeman O(1996))携带载脂蛋白ε4或ε2等位基因的男性的生育能力低于ε3/ε3基因型吗?人类基因98:239–242[公共医学][谷歌学者]
Gerdes LU、Gerdes C、Hansen PS、Klausen IC、Faergeman O、Dyerberg J(1996)b条)全球视野下格陵兰因纽特人载脂蛋白E多态性。人类基因98:546–550[公共医学][谷歌学者]
Gillespie JH(2000)无限群体中的遗传漂变:伪搭便车模型。遗传学155:909–919[PMC免费文章][公共医学][谷歌学者]
Griffiths RC,TavaréS(1997),凝聚的计算方法。在:人口遗传学和人类进化方面的进展。Donnelly P,TavaréS(编辑)Springer-Verlag,纽约,第165-182页[谷歌学者]
Hamblin MT,Di Rienzo A(2000)人类自然选择特征的检测:来自Duffy血型位点的证据。美国人类遗传学杂志66:1669–1679[PMC免费文章][公共医学][谷歌学者]
Hanlon CS,Rubinstein DC(1995)载脂蛋白E基因密码子112和158处的精氨酸残基对应于人类的祖先状态。动脉粥样硬化112:85–90[公共医学][谷歌学者]
Harding RM、Fullerton SM、Griffiths RC、Bond J、Cox MJ、Schneider JA、Moulin DS、Clegg JB(1997)《现代人类遗传祖先中的古代非洲和亚洲血统》。美国人类遗传学杂志60:772–789[PMC免费文章][公共医学][谷歌学者]
Harding RM、Healy E、Ray AJ、Ellis NS、Flanagan N、Todd C、Dixon C、Sajantila A、Jackson IJ、Birch-Machin MA、Rees JL(2000)MC1R可变选择压力的证据。美国人类遗传学杂志66:1351–1361[PMC免费文章][公共医学][谷歌学者]
Harris EE,Hey J(1999)《古代人类历史的X染色体证据》。美国国家科学院院刊96:3320–3324[PMC免费文章][公共医学][谷歌学者]
Hartl DL,Clark AG(1997)《群体遗传学原理》。第三版,西瑙尔协会,马萨诸塞州桑德兰[谷歌学者]
Hixson JE,Cox LA,Borenstein S(1988)狒狒载脂蛋白E基因:结构、表达以及与载脂蛋白C-1基因的关联。基因组学2:315–323[公共医学][谷歌学者]
Horai S,Satta Y,Hayasaka K,Kondo R,Inoue T,Ishida T,Hayashi S,Takahata N(1992)线粒体DNA谱系揭示了人类在人类中的地位。分子进化杂志35:32–43[公共医学][谷歌学者]
Huang XQ,Hardison RC,Miller W(1990)局部相似性的空间效率算法。计算应用生物科学6:373–381[公共医学][谷歌学者]
Hui DY,Innerarity TL,Mahley RW(1984)III型高脂蛋白血症患者B型极低密度脂蛋白的缺陷性肝脂蛋白受体结合。生物化学杂志259:860-869[公共医学][谷歌学者]
Hudson RR(1990)《基因谱系学与整合过程》。牛津大学Surv Evol-Biol 7:1–44[谷歌学者]
Hudson RR,Kreitman M,AguadéM(1987)基于核苷酸数据的中性分子进化测试。遗传学116:153–159[PMC免费文章][公共医学][谷歌学者]
Jaruzelska J、Zietkiewicz E、Batzer M、Cole DE、Moisan JP、Scozzari R、TavaréS、Labuda D(1999)最后一个ZFX内含子中性多态性的时空分布:单倍型结构和系谱分析。遗传学152:1091–1101[PMC免费文章][公共医学][谷歌学者]
Kaessmann H,Heissig F,von Haeseler A,Pääbo S(1999)人类X染色体上低重组非编码区的DNA序列变异。《自然遗传学》22:78–81[公共医学][谷歌学者]
Kambow MI(1995)载脂蛋白E多态性与阿尔茨海默病易感性。人类生物学67:195–215[公共医学][谷歌学者]
Kaplan NL、Hudson RR、Langley CH(1989)“搭便车效应”再次出现。遗传学123:887–899[PMC免费文章][公共医学][谷歌学者]
Kaprio J、Ferrell RE、Kottke BA、Kambow MI、Sing CF(1991)载脂蛋白E、A-IV和H多态性对与心血管疾病风险相关的数量性状的影响。动脉硬化血栓11:1330–1348[公共医学][谷歌学者]
Kidd JR、Black FL、Weiss KM、Balazs I、Kidd KK(1991)使用核DNA多态性对三个美洲印第安人群体的研究。人类生物学63:775–794[公共医学][谷歌学者]
Kreitman M(1983)果蝇乙醇脱氢酶基因座的核苷酸多态性。自然304:412–417[公共医学][谷歌学者]
Lambert J-C、Perez-Tur J、Dupire M-J、Galasko D、Mann D、Amouyel P、Hardy J、Delacote A、Chartier-Harlin MC(1997)阿尔茨海默病载脂蛋白E等位基因表达的畸变。《人类分子遗传学》6:2151–2154[公共医学][谷歌学者]
Lambert J-C、Berr C、Pasquier F、Delacoutte A、Frigard B、Cottel D、Perez Tur J、Mouroux V、Mohr M、Cecyre D、Galasko D、Lendon C、Poirier J、Hardy J、Mann D、Amouyel P、Chartier Harlin MC(1998年b条)Th1/E47cs突变与-491AT突变对神经的显著影响APOE的复数基因表达与阿尔茨海默病发病风险。《人类分子遗传学》7:1511-1516[公共医学][谷歌学者]
Lambert J-C、Brousseau T、Defosse V、Evans A、Arveier D、Ruidavets J-B、Haas B、Cambou JP、Luc G、Ducimetiere P、Cambien F、Chartier-Harlin MC、Amouyel P(2000)APOE基因启动子多态性与心肌梗死风险增加和APOE血浆浓度降低的独立关联——ECTIM研究。人类分子遗传学9:57–61[公共医学][谷歌学者]
Lambert J-C、Pasquier F、Cottel D、Frigard B、Amouyel P、Chartier-Harlin M-C(1998))APOE启动子中一个新的多态性与阿尔茨海默病发病风险相关。人类分子遗传学7:533–540[公共医学][谷歌学者]
Larsen F,Solheim J,Prydz H(1993)载脂蛋白E基因中甲基化的CpG岛3′不抑制其转录。Hum Mol基因2:775–780[公共医学][谷歌学者]
李华华,萨德勒·LA(1991)人类低核苷酸多样性。遗传学129:513–523[PMC免费文章][公共医学][谷歌学者]
Lewontin RC(1985)群体遗传学。《基因年鉴》19:81–102[公共医学][谷歌学者]
Lucotte G,Loirat F,Hazout S(1997)载脂蛋白E等位基因的梯度模式*4在西欧的频率。人类生物学69:253–262[公共医学][谷歌学者]
Mahley RW,Huang Y(1999)载脂蛋白E:从动脉粥样硬化到阿尔茨海默病及其后。当前Opin Lipidol 10:207–217[公共医学][谷歌学者]
Martin ER、Lai EH、Gilbert JR、Rogala AR、Afshari AJ、Riley J、Finch KL、Stevens JF、Livak KJ、Slotterbeck BD、Slifer SH、Warren LL、Conneally PM、Schmechel DE、Purvis I、Pericak Vance MA、Roses AD、Vance JM(2000)SNP消除复杂疾病:阿尔茨海默病中APOE周围单核苷酸多态性的分析。美国人类遗传学杂志67:383–394[PMC免费文章][公共医学][谷歌学者]
Martin GM(1999)APOE等位基因和脂源性病原体。神经生物老化20:441–443[公共医学][谷歌学者]
Mui S、Briggs M、Chung H、Wallace RB、Gomez-Isla T、Rebeck GW、Hyman BT(1996)载脂蛋白E增强子基因区域中新发现的多态性与阿尔茨海默病相关,并与ε4等位基因密切相关。神经病学47:196–201[公共医学][谷歌学者]
Nei M(1987)分子进化遗传学。纽约哥伦比亚大学出版社[谷歌学者]
Nickerson DA、Taylor SL、Weiss KM、Clark AG、Hutchinson TG、Stengárd J、Salomaa V、Vartiainen E、Boerwinkle E、Sing CF(1998)人脂蛋白脂肪酶基因9.7-kb区域的DNA序列多样性。。《自然遗传学》19:233–240[公共医学][谷歌学者]
Nickerson DA、Taylor SL、Fullerton SM、Weiss KM、Clark AG、Stengárd J、Boerwinkle E、Sing CF。人类载脂蛋白E基因中SNP的序列多样性和大规模分型。基因组研究(出版中)[PMC免费文章][公共医学][谷歌学者]
Osuntokun BO、Sahota A、Ogunniyi AO、Gureje O、Baiewu O、Adeinka A、Oluwole SO等(1995)尼日利亚老年人载脂蛋白Eε4与阿尔茨海默病之间缺乏相关性。神经年鉴38:463–465[公共医学][谷歌学者]
Rall SC Jr、Weisgraber KH、Mahley RW(1982)《人类载脂蛋白E:完整氨基酸序列》。生物化学杂志257:4171–4178[公共医学][谷歌学者]
Rana BK、Hewett-Emetet D、Jin L、Chang BH、Sambuughin N、Lin M、Watkins S、Bamshad M、Jorde LB、Ramsay M、Jenkins T、Li WH(1999)人类黑素皮质素1受体基因座的高多态性。遗传学151:1547–1557[PMC免费文章][公共医学][谷歌学者]
Reilly SL,Ferrell RE,Kottke BA,Sing CF(1992)。性别特异性载脂蛋白E基因型对明尼苏达州罗切斯特人群血脂和载脂蛋白分布的影响。二、。与伴随物的回归关系。美国人类遗传学杂志51:1311–1324[PMC免费文章][公共医学][谷歌学者]
Rieder MJ、Taylor SL、Clark AG、Nickerson DA(1999)人类血管紧张素转换酶的序列变异。《自然遗传学》22:59–62[公共医学][谷歌学者]
Roks G,Cruts M,Bullido MJ,Backhovens H,Artiga MJ,Hofman A,Valdivieso F,Van Broeckhoven C,Van Duijn CM(1998)载脂蛋白E基因调控区的−491 A/T多态性与早发性阿尔茨海默病。神经科学快报258:65–68[公共医学][谷歌学者]
Roses AD(1996)载脂蛋白E等位基因是阿尔茨海默病的危险因素。《医学年鉴》47:387–400[公共医学][谷歌学者]
Rozas J,Rozas R(1999)DnaSP第3版:分子群体遗传学和分子进化分析的综合程序。生物信息学15:174–175[公共医学][谷歌学者]
Sahota A,Yang M,Gao S,Hui SL,Baiewu O,Gureje O,Oluwole S,Ogunniyi A,Hall KS,Hendrie HC(1997),载脂蛋白E在非洲裔美国人中与阿尔茨海默病相关的风险依赖于基因型。《神经年鉴》42:659–661[公共医学][谷歌学者]
Salomaa VV、Rasi VP、Vahtera EM、Pekkanen J、Pursiainen M、Jauhiainen M、Vartiainen E、Ehnholm CP、Myllyla G(1994)《芬兰三个地理区域的止血因子和脂蛋白(a):Finrisk止血研究》。《心血管风险杂志》1:241-248[公共医学][谷歌学者]
Sayi JG、Patel NB、Premkumar DR、Adem A、Winblad B、Matuja WB、Mtui EP等(1997)《老年东非人载脂蛋白E多态性》。东非医学杂志74:668–70[公共医学][谷歌学者]
Scacchi R、Corbo RM、Rickards O、Mantuano E、Guevara A、De Stefano GF(1997)厄瓜多尔Cayapa印第安人载脂蛋白B和E遗传多态性。人类生物学69:375–382[公共医学][谷歌学者]
Seixas S,Trovoada MJ,Rocha J(1999)葡萄牙和圣多美普林西比(几内亚湾)载脂蛋白E和载脂蛋白C1基因座的单倍型分析:连锁不平衡证据表明APOE*4是祖先的APOE等位基因。人类生物学71:1001–1008[公共医学][谷歌学者]
Simonsen KL、Churchill GA、Aquadro CF(1995)DNA多态性数据中性统计测试的特性。遗传学141:413–429[PMC免费文章][公共医学][谷歌学者]
Sing CF,Davignon J(1985)载脂蛋白E多态性在确定正常血脂和脂蛋白变异中的作用。《美国人类遗传学杂志》37:268–285[PMC免费文章][公共医学][谷歌学者]
Song Y-Q、Rogaeva E、Premkumar S、Brindle N、Kawarai T、Orlacchio A、Yu G、Levesque G、Nishimura M、Ikeda M、Pei Y、O’Toole C、Duara R、Barker W、Sorbi S、Freedman M、Farrer L、St George-Hyslop P(1998)阿尔茨海默病与APOE的−491调节区多态性之间没有关联。神经科学快报250:189–192[公共医学][谷歌学者]
Stengárd JH、Zerba KE、Pekkanen J、Ehnholm C、Nissinen A、Sing CF(1995)在芬兰老年男性的纵向研究中,载脂蛋白E多态性预测冠心病死亡。循环91:265–269[公共医学][谷歌学者]
Strittmatter WJ,Saunders AM,Schmechel D,Pericak-Vance M,Enghild J,Salvesen GS,Roses AD(1993)载脂蛋白E:与β-淀粉样蛋白的高亲和力结合和晚发性家族性阿尔茨海默病中4型等位基因频率增加。美国国家科学院院刊90:1977–1981[PMC免费文章][公共医学][谷歌学者]
Taddei K,Clarnette R,Gandy SE,Martins RN(1997)阿尔茨海默病患者血浆载脂蛋白E(apoE)水平升高。神经科学快报223:29–32[公共医学][谷歌学者]
Tajima F(1989)通过DNA多态性测试中性突变假设的统计方法。遗传学123:585–595[PMC免费文章][公共医学][谷歌学者]
Talbot C、Lendon C、Craddock N、Shears S、Morris JC、Goate A(1994年),利用载脂蛋白Eε2预防阿尔茨海默病。柳叶刀343:1432–1433[公共医学][谷歌学者]
Tang MX、Maestre G、Tsai WY、Liu XH、Feng L、Chung WY、Chunk M、Schofield P、Stern Y、Tycko B、Mayeux R(1996)基于纽约市老年非裔美国人、白种人和西班牙裔人APOE基因型的阿尔茨海默病相对风险和年龄开始分布。《美国人类遗传学杂志》58:574–584[PMC免费文章][公共医学][谷歌学者]
Tang MX、Stern Y、Marder K、Bell K、Gurland B、Lantigua R、Andrews H、Feng L、Tycko B、Mayeux R(1998)APOE的复数-ε4等位基因与非裔美国人、白人和西班牙裔患阿尔茨海默病的风险。JAMA杂志279:751–755[公共医学][谷歌学者]
Templeton AR、Clark AG、Weiss KM、Nickerson DA、Boerwinkle E、Sing CF(2000)《人类脂蛋白脂肪酶基因内的重组和突变热点》。美国人类遗传学杂志66:69–83[PMC免费文章][公共医学][谷歌学者]
Town T、Paris D、Fallin D、Duara R、Barker W、Gold M、Crawford F、Mullan M(1998)《−491 A/T载脂蛋白E启动子多态性与阿尔茨海默病的相关性:与已知APOE多态性的独立风险和连锁不平衡》。神经科学快报252:95–98[公共医学][谷歌学者]
Turner ST、Weidman WH、Michels VV、Reed TJ、Ormson CL、Fuller T、Sing CF(1989)五到八十九岁高加索人钠-锂逆向转运和血压的分布。高血压13:378–391[公共医学][谷歌学者]
Utermann G,Hees M,Steinmetz A(1977)载脂蛋白E的多态性与人类β-蛋白异常血症的发生。自然269:604-607[公共医学][谷歌学者]
Wall JD(1999)《重组与中立性统计检验的力量》。基因研究74:65–79[谷歌学者]
Watterson GA(1975)关于无重组遗传模型中分离位点的数量。Theor流行生物学7:256–276[公共医学][谷歌学者]
Weir BS(1996)遗传数据分析II。马萨诸塞州桑德兰市西诺协会[谷歌学者]
Weisgraber KH(1994)载脂蛋白E:结构-功能关系。高级蛋白质化学45:249–302[公共医学][谷歌学者]
Wright S(1931)孟德尔种群的进化。遗传学16:97–159[PMC免费文章][公共医学][谷歌学者]
Xhignesse M,Lussier-Cacan S,Sing CF,Kessling AM,Davignon J(1991)载脂蛋白E常见变体对健康样本中脂质代谢测量的影响。动脉硬化血栓11:1100–1110[公共医学][谷歌学者]
Xu Y、Berglund L、Ramakrishnan R、Mayeux R、Ngai C、Holleran S、Tycko B、Leff T、Schacter N(1999)《A common》血红蛋白载脂蛋白C-I的I RFLP增加基因转录,并显示出与载脂蛋白E等位基因连锁不平衡的种族差异模式。《脂质研究杂志》40:50–58[公共医学][谷歌学者]
Yamada T、Kondo A、Takamatsu J、Tateishi J、Goto I(1995)阿尔茨海默病患者大脑中的载脂蛋白E mRNA。神经科学杂志129:56–61[公共医学][谷歌学者]
Zannis VI、Nicolosi RJ、Jensen E、Breslow JL、Hayes KC(1985)非人类灵长类动物的血浆和肝脏apoE等蛋白:人类、猿类和新、旧世界猴子之间apoE的差异。《脂质研究杂志》26:1421–30[公共医学][谷歌学者]
Zekraoui L、Lagarde JP、Raisonnier A、Gerard N、Aouizerate A、Lucotte G(1997)载脂蛋白E*4等位基因在非洲侏儒和撒哈拉以南非洲大多数非洲人口中的高频率。人类生物学69:575–581[公共医学][谷歌学者]
Zietkiewicz E、Yotova V、Jarnik M、Korab-Laskowska M、Kidd KK、Modiano D、Scozzari R、Stoneking M、Tishkoff S、Batzer M、Labuda D(1998)现代人类祖先种群的遗传结构。分子进化杂志47:146–155[公共医学][谷歌学者]

来自的文章美国人类遗传学杂志由以下人员提供美国人类遗传学学会