美国国家科学院院刊。2010年1月26日;107(补遗1):1757-1764。
学术讨论会论文
随机表观遗传变异作为发育、进化适应和疾病的驱动力
约翰霍普金斯大学表观遗传学中心,马里兰州巴尔的摩,邮编21205
由马萨诸塞州剑桥哈佛大学的Peter T.Ellison编辑,于2009年11月17日批准(2009年9月2日收到供审查)
作者贡献:A.P.F.设计研究;A.P.F.和R.A.I.进行了研究;R.A.I.提供了新试剂/分析工具;A.P.F.和R.A.I.分析数据;A.P.F.和R.A.I.写了这篇论文。
摘要
新达尔文主义进化理论基于微小遗传变异引起的表型精细选择,这是数量性状对表型和疾病贡献的基础。表观遗传学是研究细胞分裂过程中可遗传的非序列变化,如DNA甲基化。以往将表观遗传学纳入进化思维的尝试都集中于拉马克遗传,即环境导向的表观遗传学变化。在这里,我们提出了一种新的非拉马克理论来解释表观遗传学在进化中的作用。我们认为,不改变平均表型的遗传变异可以改变表型的变异性;这可以通过表观遗传学进行调节。这种遗传随机变异模型将提供一种机制来解释发育生物学在可选表型变异中的表观遗传作用,以及常见复杂疾病背后的基本上无法解释的遗传变异。我们提供了两个实验结果作为原理证明。第一个结果是随机表观遗传变异的直接证据,确定了小鼠、人类肝脏和小鼠大脑中与发育和形态发生相关的高度可变的DNA-甲基化区域。第二个是可变甲基化的遗传机制,即CpG二核苷酸在进化过程中的丢失或获得。最后,我们对进化过程中的遗传随机变异进行了建模,表明它为进化适应环境变化提供了一种强大的机制,这种机制可以通过表观遗传进行调节。这些数据表明,即使平均表型没有改变,遗传性表型变异倾向也会显著增加适应度,同时增加环境变化人群的疾病易感性。
关键词:DNA甲基化,表观遗传学,进化,随机变异
A key tenet of物种起源引用达尔文的话,他认为表型是许多离散性状的结果,这些性状都是单独精心挑选出来的,“在适应度平衡中发现最小的颗粒”,这被描述为牛顿型,因为它依赖于以一致方式作用的静力(1). 这个概念是R.A.Fisher提出的数量性状位点的基础(2). 这个概念导致了种群遗传学的现代基础,即种群内存在持续变异,而选择是在个体上进行的,这导致了平衡或净化表型极端选择的模型(1). 经典模型在解释常见人类疾病方面也有很大的局限性;常见的变异只能解释特定疾病表型的一小部分,即使是最为人们所熟知的疾病,如成人糖尿病和身高(三).
表观遗传学是研究DNA和相关蛋白的非序列变化的学科,最初由贾布隆卡提出,通过拉马克遗传在进化中发挥作用,即环境对基因组的直接修改,然后通过转代传递(4). 通常引用两个例子:由饮食改变DNA甲基化引起的皮毛颜色变化阿古提小鼠的基因(5,6)和甲基化axin融合扭尾小鼠的等位基因(6,7). 这两个例子都涉及反转录转座子LTR序列的甲基化,因此符合经典达尔文思想的各种遗传例外,包括由于三核苷酸重复扩增和流感毒株进化中的横向基因转移引起的预期(8). 但它们并没有被证明是物种间物种形成或发育差异的一般机制,即所谓的“进化-进化”,也没有被证明为渠化的一般机制。渠化是沃丁顿发明的一个术语,指的是通过遗传程序纠正发育过程中的环境扰动的机制,制定一致的发展计划(9). 事实上,正如West-Eberhard所指出的那样,运河化仍然是一个“黑匣子”(8). 其他人讨论了拉马克遗传在疾病中的潜在作用;例如,斯莱特金提出了一个跨代表观遗传拉马克遗传模型,并指出这种修饰必须持续许多代才能大大增加平均风险(10)对公共卫生管理有影响(11). 虽然我们没有质疑拉马克人继承遗产的重要贡献,但在这里我们提出了另一种观点遗传的修饰可以在不断变化的环境中提供随机表型变异,这有利于选择,也为表观遗传学在进化中提供了另一种非拉马克式的作用。
达尔文主义的新进展:随机变异,而非拉马克遗传
我们突然想到,特定基因型的变异性增加本身可能会增加适应性。这可能是由不改变平均表型但确实改变表型变异性的遗传变异引起的。考虑这种模型的自然机制是发育过程中的表观遗传可塑性,例如,不同的DNA甲基化模式。这种观点与拉马克遗传不同,在我们的模型中,遗传变化是遗传的,这种变化导致表观遗传变异增加。它也不同于表观遗传学在改变突变率方面可能发挥的作用,既通过甲基胞嘧啶脱氨基引起的C到T转变,也通过改变染色体重排率(12,13). 作为原则证明,我们重新访问了以前生成的数据集(14)人类和小鼠组织中DNA甲基化的基因组规模分析,并以两种新的方式进行探索。首先,我们调查了是否存在可变甲基化区域跨个人对于给定的组织类型。然后,我们探讨了组织特异性差异甲基化区域(T-DMR)是否在物种间存在差异,以及潜在的DNA序列是否可以解释这些差异。
个体间可变甲基化区域
为了评估给定组织的DNA甲基化的内在变异程度,我们开始从四个个体中确定小鼠肝脏中DNA甲基化变化最大的区域的位置。我们选择这种特殊组织是因为它相对均匀。我们检查了多倍体最少的新生儿,尽管拷贝数不会影响DNA甲基化,因为我们的方法控制拷贝数(15). 通过检查近交系小鼠(实际上是同一笼子里的同窝鼠),将环境影响降至最低。令人惊讶的是,基因组中的许多基因座在DNA甲基化方面表现出显著的变异,我们称之为可变甲基化区域(VMR)。令人惊讶的是,这些VMR在具有发育和形态发生基因Ontogeny(GO)功能类别的基因附近显著富集()当使用所有基因进行比较或使用CHARM阵列上存在的所有区域时,表明富集并不仅仅是因为CpG含量高,因为阵列本身被设计用于分析CpG高区域。VMR发育基因示例-Bmp7型参与早期胚胎发育规划和骨诱导,磅3f2参与神经发生和干细胞重编程,以及Ntrk3号机组,参与身体位置感知,如图所示.
表1。
GOBPID公司 | P(P)价值 | 比值比 | 预期计数 | 计数 | 大小 | 期限 |
GO:0048699号 | 2.8E-05 | 2 | 26.9 | 49 | 384 | 神经元的生成 |
去:0009880 | 2005年5月8日 | 4.9 | 2.8 | 11 | 41 | 胚胎模式规范 |
通过:0030030 | 0.00033 | 2 | 19.1 | 35 | 272 | 细胞投影组织 |
GO:0021517编号 | 0.00034 | 8.8 | 1 | 6 | 15 | 腹侧脊髓发育 |
去:0035107 | 0.00041 | 2.9 | 6.2 | 16 | 89 | 附属物形态发生 |
电话:0048666 | 0.00046 | 2 | 17.2 | 32 | 245 | 神经元发育 |
去:0032990 | 0.00050 | 2.2 | 12.3 | 25 | 175 | 细胞部分形态发生 |
去:0009887 | 0.00052 | 1.6 | 35.9 | 56 | 512 | 器官形态发生 |
GO:0021515号 | 0.00055 | 6.2 | 1.5 | 7 | 22 | 脊髓中的细胞分化 |
GO:0048812号 | 0.00065 | 2.2 | 11.8 | 24 | 168 | 神经元形态发生 |
GO:0060173编号 | 0.00068 | 2.7 | 6.5 | 16 | 93 | 肢体发育 |
转到:0007411 | 0.00075 | 2.8 | 5.9 | 15 | 85 | Axon制导 |
去:0006270 | 0.00088 | 9.5 | 0.8 | 5 | 12 | DNA复制启动 |
GO:0001708号 | 0.0010 | 4.6 | 2.1 | 8 | 31 | 细胞命运规范 |
GO:0000904号 | 0.0014 | 2 | 13.2 | 25 | 188 | 参与分化的细胞形态发生 |
GO:0048869号 | 0.0017 | 1.3 | 86.5 | 112 | 1,231 | 细胞发育过程 |
去:0007420 | 0.0020 | 1.9 | 15 | 27 | 214 | 大脑发育 |
GO:0048663号 | 0.0021 | 3.6 | 2.9 | 9 | 42 | 神经元命运承诺 |
GO:0042415号 | 0.0031 | 19.9 | 0.3 | 三 | 5 | 去甲肾上腺素代谢过程 |
去:0009954 | 0.0033 | 4.9 | 1.5 | 6 | 22 | 近端/远端模式形成 |
GO:0042472号 | 0.0033 | 3.1 | 3.7 | 10 | 53 | 内耳形态发生 |
GO:0048598号 | 0.0035 | 1.7 | 19.4 | 32 | 277 | 胚胎形态发生 |
去:0007417 | 0.0050 | 2.9 | 3.9 | 10 | 57 | 中枢神经系统发育 |
GO:0021846号 | 0.0053 | 7.6 | 0.7 | 4 | 11 | 前脑细胞增殖 |
GO:0021520号 | 0.0058 | 13.2 | 0.4 | 三 | 6 | 脊髓运动神经元细胞命运规范 |
GO:0021521号 | 0.0058 | 13.2 | 0.4 | 三 | 6 | 腹侧脊髓中间神经元规范 |
转到:0045773 | 0.0058 | 13.2 | 0.4 | 三 | 6 | 轴突延伸的正向调节 |
GO:0021536号 | 0.0065 | 4.2 | 1.7 | 6 | 25 | 间脑发育 |
去:0035116 | 0.0067 | 5.1 | 1.2 | 5 | 18 | 胚胎后肢形态发生 |
去:0007275 | 0.0076 | 1.2 | 124.8 | 149 | 1,776 | 多细胞生物发育 |
去:0007423 | 0.0076 | 1.8 | 13.4 | 23 | 191 | 感觉器官发育 |
去:0030326 | 0.0090 | 2.6 | 4.2 | 10 | 61 | 胚胎肢体形态发生 |
去:0035270 | 0.0095 | 2.7 | 3.6 | 9 | 52 | 内分泌系统发育 |
转到:0006268 | 0.0097 | 9.9 | 0.49 | 三 | 7 | 复制过程中的DNA解舒 |
GO:0021546号 | 0.0097 | 9.9 | 0.49 | 三 | 7 | 菱铁矿开发 |
GO:0048856号 | 0.0099 | 1.2 | 106.1 | 128 | 1,538 | 解剖结构发育 |
在相同环境中饲养的同基因小鼠肝脏中具有VMR的发育基因示例。所示为Bmp7型(A类),磅3f2(B类)、和Ntrk3号机组(C类)分别参与早期胚胎发育规划和骨诱导、神经发生和干细胞重编程以及身体位置感知。在每个配对图中,顶部面板显示了来自三种不同组织(大脑、肝脏和脾脏)的不同生物复制品的估计甲基化水平(虚线)。较粗的实线表示每个组织的平均曲线。橙色条表示我们的统计方法检测到VMR的区域。底部面板突出显示肝脏。仅显示了四条肝脏曲线。不同的线条类型和颜色代表四只老鼠。
此外,VMR与一个功能属性相关联:表达式。如所示转录起始位点(TSS)500 bp范围内的VMR在基因表达变异性和甲基化变异性之间表现出更强的相关性。
VMR与邻近基因的基因表达变异有关。用我们的统计算法检测到的人类肝脏VMR分为三种类型:低变异(最低70%)、高变异(最高5%)和中等变异(其余)。距离基因转录起始位点500个碱基以内的VMR与该基因相关。对相同的人类肝脏进行了表达测量,并使用受试者之间的SD来量化变异性。这些箱线图显示了由VMR可变性分层的这种可变性的分布。第一个箱线图表示与VMR无关的基因。
然后我们检查了人类肝脏是否存在VMR。与我们的小鼠实验结果类似,我们发现了显著的变异性。在VMR是近基因的地方,如在小鼠中,当为小鼠CHARM阵列控制时,具有GO功能类别的基因在发育和形态发生的附近有强烈的富集().
表2。
GOBPID公司 | P(P)价值 | 比值比 | ExpCount(ExpCount) | 计数 | 大小 | 期限 |
去:0009790 | 2018年5月 | 1.8 | 43.1 | 70 | 320 | 胚胎发育 |
GO:0019222号 | 2.3E-05号 | 1.3 | 319.5 | 379 | 2,372 | 代谢过程的调节 |
去:0006355 | 4.0E-05年 | 1.3 | 239.6 | 292 | 1,779 | 转录调控,依赖于DNA |
去:0032774 | 2005年5月5日 | 1.3 | 246.8 | 299 | 1,832 | RNA生物合成过程 |
去:0009887 | 5.3E-05号机组 | 1.6 | 54.1 | 82 | 402 | 器官形态发生 |
GO:0048704号 | 8.4E-05 | 4 | 5.2 | 15 | 39 | 胚胎骨骼系统形态发生 |
GO:0001501号 | 2005年5月8日 | 1.9 | 27.8 | 48 | 207 | 骨骼系统开发 |
GO:0051093号 | 2005年5月8日 | 1.7 | 43.5 | 68 | 323 | 发育过程的负调控 |
GO:0016339号 | 0.00012 | 7.2 | 2.2 | 9 | 17 | 钙依赖性细胞间粘附 |
去:0009952 | 0.00013 | 2.5 | 12.3 | 26 | 92 | 前/后模式形成 |
GO:0048518号 | 0.00017 | 1.3 | 133.2 | 171 | 989 | 生物过程的正向调节 |
GO:0019219号 | 0.00025 | 1.2 | 269 | 317 | 1,997 | 碱基、核苷、核苷酸和核酸代谢过程的调节 |
去:0007389 | 0.00028 | 2 | 22.3 | 39 | 166 | 图案规格说明过程 |
GO:0010468号 | 0.00029 | 1.2 | 272.3 | 320 | 2,029 | 基因表达调控 |
GO:0043009号 | 0.00032 | 2.1 | 18.7 | 34 | 140 | 脊索动物胚胎发育 |
GO:0031326号 | 0.00037 | 1.2 | 279.8 | 327 | 2,077 | 细胞生物合成过程的调控 |
去:0006350 | 0.00038 | 1.2 | 267.6 | 314 | 1,987 | 转录 |
GO:0001824号 | 0.00040 | 4.9 | 3 | 10 | 23 | 芽囊发育 |
GO:0010556号 | 0.00048 | 1.2 | 271.3 | 317 | 2,014 | 大分子生物合成过程的调控 |
去:0050678 | 0.00051 | 3.6 | 4.8 | 13 | 36 | 上皮细胞增殖的调节 |
GO:0048863号 | 0.00064 | 7.5 | 1.7 | 7 | 13 | 干细胞分化 |
GO:0019827号 | 0.00076 | 9.6 | 1.3 | 6 | 10 | 干细胞维护 |
去:0007399 | 0.00080 | 1.4 | 84.5 | 112 | 631 | 神经系统发育 |
去:0000165 | 0.00089 | 2 | 16 | 29 | 119 | MAPKKK级联 |
GO:0043284号 | 0.0011 | 1.2 | 327 | 372 | 2,428 | 生物聚合物生物合成过程 |
GO:0043583号 | 0.0014 | 2.7 | 7.2 | 16 | 54 | 耳朵发育 |
GO:0042472号 | 0.0016 | 3.5 | 4.1 | 11 | 31 | 内耳形态发生 |
GO:0048468号 | 0.0016 | 1.4 | 62.6 | 85 | 465 | 细胞发育 |
去:0007420 | 0.0017 | 1.8 | 21.2 | 35 | 158 | 大脑发育 |
去:0034645 | 0.0017 | 1.2 | 346.4 | 390 | 2,572 | 细胞大分子生物合成过程 |
转到:0001656 | 0.0018 | 3.8 | 3.6 | 10 | 27 | 后肾发育 |
去:0035239 | 0.0018 | 2.6 | 7.4 | 16 | 55 | 管子形态发生 |
GO:0043066号 | 0.0019 | 1.7 | 26.9 | 42 | 200 | 细胞凋亡的负调控 |
GO:0045747号 | 0.002 | Inf公司 | 0.4 | 三 | 三 | Notch信号通路的正调控 |
电话:0045597 | 0.0027 | 1.9 | 15.6 | 27 | 116 | 细胞分化的正调控 |
GO:0043067号 | 0.0030 | 1.4 | 58.7 | 79 | 436 | 程序性细胞死亡的调控 |
| | | | | | |
去:0032501 | 0.0037 | 1.2 | 297.8 | 336 | 2,211 | 多细胞生物过程 |
去:0007156 | 0.0039 | 1.9 | 13.7 | 24 | 102 | 嗜同性细胞粘附 |
GO:0021546号 | 0.0039 | 12.8 | 0.8 | 4 | 6 | 朗博米尔发育 |
去:0065007 | 0.0040 | 1.1 | 633.7 | 677 | 4,704 | 生物调节 |
GO:0045884号 | 0.0043 | 5.5 | 1.7 | 6 | 13 | 存活基因产物表达的调控 |
GO:0048523号 | 0.0043 | 1.2 | 129.7 | 157 | 963 | 细胞过程的负调控 |
GO:0021915号 | 0.0044 | 3.2 | 4 | 10 | 30 | 神经管发育 |
GO:0001525号 | 0.0046 | 1.9 | 14.6 | 25 | 109 | 血管生成 |
GO:0048856号 | 0.0048 | 1.2 | 202.8 | 235 | 1,525 | 解剖结构发育 |
GO:0048646号 | 0.0049 | 2.2 | 8.8 | 17 | 66 | 解剖结构形成 |
GO:0000122号 | 0.0055 | 1.7 | 21.1 | 33 | 157 | RNA聚合酶II启动子转录的负调控 |
GO:0045595号 | 0.0055 | 1.8 | 16.4 | 27 | 123 | 细胞分化的调节 |
去:0007507 | 0.0063 | 1.8 | 16.5 | 27 | 123 | 心脏发育 |
通过:0000070 | 0.0065 | 4.1 | 2.4 | 7 | 18 | 有丝分裂姐妹染色单体分离 |
GO:0021545号 | 0.0067 | 4.8 | 1.8 | 6 | 14 | 颅神经发育 |
去:0006366 | 0.0070 | 1.3 | 59.7 | 78 | 448 | RNA聚合酶II启动子转录 |
GO:0048869号 | 0.0073 | 1.2 | 149.1 | 176 | 1,107 | 细胞发育过程 |
GO:0008284号 | 0.0076 | 1.5 | 28.1 | 41 | 209 | 细胞增殖的正向调节 |
GO:0001708号 | 0.0079 | 3.4 | 3 | 8 | 23 | 细胞命运规范 |
去:0007020 | 0.0081 | 8.5 | 0.9 | 4 | 7 | 微管成核 |
GO:0001655号 | 0.0083 | 2.2 | 7.8 | 15 | 58 | 泌尿生殖系统发育 |
GO:0001666号 | 0.0083 | 2.2 | 7.8 | 15 | 58 | 缺氧反应 |
去:0000281 | 0.0087 | 19.3 | 0.5 | 三 | 4 | 有丝分裂后的细胞分裂 |
去:0009058 | 0.0088 | 1.1 | 405 | 442 | 3,007 | 生物合成过程 |
去:0035270 | 0.0093 | 2.5 | 5.7 | 12 | 43 | 内分泌系统发育 |
GO:0001649号 | 0.0094 | 2.6 | 5.1 | 11 | 38 | 骨母细胞诱导分化结果 |
GO:0048699号 | 0.0096 | 1.4 | 40.4 | 55 | 300 | 神经元的生成 |
去:0007215 | 0.0099 | 4.2 | 2 | 6 | 15 | 谷氨酸信号通路 |
然后我们对小鼠大脑进行了类似的分析。结果更令人震惊。例如,显示了VMR的两个示例:Bmpr2型形态发生BMP蛋白的受体,以及红外线1是胰岛素驱动分化的关键介质。我们的研究结果表明,VMR存在于组织和物种中,富含发育相关基因,并与表型相关,至少在最接近基因的表达水平上是如此。
在相同环境中饲养的同基因小鼠大脑中具有VMR的发育基因示例。所示为Bmpr2型,形态发生BMP蛋白的受体(A类)、和爱尔兰1胰岛素驱动分化的关键介质(B类). 标签如中所示.
还要注意的是,VMR通常位于组织变化型DMR(T-DMR)附近,这表明它们可能会随着时间的推移相互进化。如图所示用于鼠标第4a1部分,一种蛋白酪氨酸磷酸酶,参与维持分化的上皮组织FOXD2系列,一种与胚胎发生有关的叉头转录因子。
VMR通常位于T-DMR附近。显示的是鼠标第4a1部分,一种蛋白酪氨酸磷酸酶,参与维持分化的上皮组织(A类)、和人类FOXD2系列,一种参与胚胎发生的叉头转录因子(B类). 标签如中所示.英寸(A类),VMR和T-DMR一致,而在(B类),它们相邻。
物种间组织特异性差异甲基化区域
接下来,我们感兴趣的是,不同物种(小鼠和人类)差异甲基化的变化是否可以追溯到潜在的遗传基础。为了解决这个问题,我们将重点放在T-DMR上,考虑到在以前的研究中收集的大量数据及其与人类疾病(如癌症)的相关性。此前我们报道,区分结直肠癌和正常结肠粘膜(C-DMR)的DMR富含T-DMR,这一发现在一组独立的大样本中得到了验证。在许多情况下,一个物种的差异甲基化缺失与相应CpG岛或附近CpG岛岸的潜在CpG缺失有关(14). 差异甲基化进化变化的典型例子LHX1型,是脊椎动物头部组织和中胚层组织所必需的转录调节器,(如所示). 请注意,TSS左侧的人类T-DMR不在小鼠中。人类在一个CpG岛海岸获得了CpG(该岛在底部显示为橙色勾号)。相比之下,这两个物种在TSS右侧都有适度的CpG计数,并且在该区域都有DMR。这是一个遗传变异(即CpG的获得)如何在高度保守的基因中允许与发育相关的组织特异性差异的例子。因此,不同物种间差异甲基化本身可能是由于这些DMR位点的潜在序列变异所致。有关这方面的其他示例,请访问rafalab.jhsph.edu/evometh.pdf。
DMR中物种差异的潜在遗传基础。一个7500-bp的人类区域被绘制到小鼠基因组上。这个x-轴显示一个索引,以便映射的底面相互重叠。(顶部)每个人体样本的甲基化特征。如中所示,虚线代表个体,实线代表组织平均值。(中部)鼠标的绘图相同。(底部)代表人类和鼠标的CpG位置的勾选。橙色的蜱虫代表保守的CpG。曲线表示200个基数的移动窗口中的CpG计数。注意,小鼠在区域开始时缺乏CpG与物种间甲基化模式的差异有关。显示为LHX1型是脊椎动物头部组织和中胚层组织所必需的转录调控因子。注意TSS左侧的人类DMR不在老鼠中。人类在CpG岛海岸获得了CpG(橙色勾号)。相比之下,这两个物种在TSS右侧都有适度的CpG计数,并且在该区域都有DMR。
增加随机变量将增加在变化环境中的适应性
为了模拟表观遗传变异在自然选择中的作用,我们基于有助于适应度的单一数量表型(任意称为Y(Y)。我们假设八个基因组位置的突变影响了Y(Y),增加了四个突变Y(Y)和四个减少Y(Y)。对于其中两个模拟(模拟1和模拟2),我们包括一个由八个突变控制的新随机元素,其中四个突变增加了方差属于Y(Y)在整个人群中,给出了相同的基因型,其中四个基因型降低了这种差异。数学细节见材料和方法.
在模拟1中,我们在一个有利于积极因素的固定环境中模拟了自然选择Y(Y)但包括一种新的随机表观遗传元素,因此八种突变会影响Y(Y)8个突变影响Y(Y)正如预期的那样,这一模拟有利于具有最大期望值和最小方差的基因型(). 模拟2与模拟1相同,但在这种情况下,我们允许改变世代相传的大环境Y(Y)有时很小Y(Y)在这个模拟中,为第1000代选择了变异最大的基因型并以其为主(). 在模拟3中,我们不允许方差发生变化。在这种情况下,72%的迭代导致了第1000代之前的灭绝。这是因为在一个环境中选择的基因型不适合环境急剧变化后的环境变化。相反,当方差被允许改变时(模拟2),灭绝从未发生过。
模拟结果表明,表观基因组中增加的随机变异将增加在不同环境中的适应度。(A类)模拟自然选择。对于每个模拟,我们计算了作为世代函数的表型的种群平均值和SD。显示了两个模拟:模拟1,固定环境中的自然选择倾向于积极Y(Y)但包括一种新的随机表观遗传元素,因此八种突变影响平均值Y(Y)8个突变影响Y(Y)和模拟2,与模拟1类似,但在这种情况下,允许跨代改变环境,有时有利Y(Y)有时是负面的Y(Y)。顶部面板显示的平均(所有迭代)总体平均值为Y(Y)作为模拟1(绿色)和模拟2(橙色)的生成功能。垂直虚线表示在模拟2中环境发生变化的世代。底部面板显示了Y(Y)注意,随着环境的变化Y(Y)围绕一个共同点波动,但Y(Y)持续增长。(B类)基于仿真2的GWAS分析仿真(变化方差Y(Y)). 观察到的优势比是改变平均表型的SNP。
此外,我们还模拟了全基因组关联研究(GWAS)年。没有存活下来的个体被视为患病,幸存者被视为对照组。一个有趣的发现是,已知影响疾病适应性的基因之间的关联优势比徘徊在1.10左右(). 其原因是,许多患病个体之所以不适合,仅仅是因为SNP对变异的影响,而不是因为通常由SNP定义的直接影响功能的遗传改变。这仅仅是由于较大方差导致的低遗传力的结果。因此,表观遗传变异模型的结果与当前GWAS研究的结果一致,这些研究很少解释疾病的可归因风险。
讨论
在这里,我们提出了一个模型,在该模型中,特定基因型的变异性增加可能不是通过改变平均表型,而是通过改变特定基因型表型的变异性来增加适应度。我们还提供了一种可能的机制,通过这种机制,这种增强的变异性可以遗传,并导致发育过程中随机表观遗传变异的增加。注意,这种变异的基因组位点在我们的模型中会得到很好的定义;我们提供了这些位点的例子。虽然这些基因座并不代表发展的主要引擎,但它们确实提供了塑性在发育程序中,由于它们通过邻近基因传递的随机变异。
我们的模型不同于表型变异和疾病风险的跨代表观遗传效应(16)在我们的模型中,遗传变异是遗传的,并有助于增强表型变异,这可以在每一代中通过表观遗传学进行调节。它也不同于超变异基因转换模型,在这种模型中,基因型本身会世代变化,增加表型可塑性(17).
我们的模型为发展可塑性和进化适应波动环境提供了机制。虽然该模型是通用的,不需要表观遗传变异,但我们已经证明在相同环境中饲养的等基因小鼠中存在影响表型(即基因表达)的VMR,并表明人类中也存在类似的VMR。我们还报道了物种间组织特异性甲基化差异的潜在遗传机制,即CpG岛或相关海岸的获得或丢失。特定基因附近的定位将提供变异效应的特异性,但变异机制可能与组织特异性启动子、转录因子结合位点、这些区域CpG密度的群体变异或这些因素的组合有关。区分这些可能性需要进一步的实验。
尽管如此,我们的模型做出了一个具体的预测:遗传遗传变异影响随机表型变异。因此,我们应该能够识别出有助于变异而非平均表型的SNP。此类SNP不会使成为必要其影响的表观遗传机制,但至少可以预测其中一些与VMR的连锁不平衡,如上文所述。VMR为特定遗传背景下的表型变异提供了一种可能的机制,我们至少在近亲基因的表达水平上有直接证据证明这一点。沃丁顿(9)还提出,在给定的环境中,表型最终会被遗传同化,CpG岛和海岸的序列差异可能为DNA甲基化介导的发育变异进化中的获得和损失提供机制。
我们的模型和数据与拉马克主义不同,拉马克主义认为环境会改变基因组。虽然我们没有质疑这种继承的存在,但这里我们提出了一个遗传的这种表观遗传学变化能力的基础机制。我们也偏离了新达尔文和经典的群体遗传学原理,即可遗传的数量表型变异完全是由于个体性状位点的加性效应。在这里,遗传成分部分是变异倾向本身,给表型结果增加了随机性因素。因此,选择将部分取决于围绕设定点变化的能力,而不是取决于设定点本身。这一概念与斯图亚特·考夫曼的“自由秩序”思想是一致的(18). 虽然考夫曼没有预料到表观遗传学在进化中的作用,但固有的表观遗传变异本身将为有序功能创造新的可能性,鉴于我们确定了这种变异可能的可测量底物,即DNA甲基化,这个问题现在可以从数学上解决。当然,我们不知道可以容忍多少变化;在变异增加的某一点上,个别物种的“身份”可能会恶化。
我们的模型也可能有助于解释进化和表观遗传学文献中看似矛盾的观察结果。在表观遗传学中,表观遗传标记保真度的明显高度不稳定性令人困惑。例如,克隆繁殖的细胞系显示出高频率的随机单等位基因表达(19). 这种表观遗传不稳定性可能是在观察单个癌细胞时首次描述的(20)数据显示同卵双胞胎之间存在明显的表观遗传差异(21). 在进化生物学中,群居昆虫在社会等级中表现出环境介导的表型差异,这些差异的分布可以被选择用于(22),导致这些作者推测可能与表观遗传机制有关(23); 蜜蜂将是测试这些想法的杰出典范。最后,报道了同一基因型的小龙虾在表型上的重大变异(24). 作者还观察到可变的全局DNA甲基化,但作为一种表型,而不是一种机制,并且发现甲基化与表型之间没有关系;他们没有检查单个基因(24). 我们认为表型变异的机制是表观遗传的,增加变异将促进适应度。
最后,通过固有的表观遗传变异,不仅可以获得正常组织中的可变表型,还可以获得可变疾病表型。这是因为在表型中提供较高变异的遗传变异也会增加表型两端的尾部;也就是说,相同的变量在一个环境中增加适应性将增加在不同环境中降低适应性的风险。为了支持这一观点,我们分析了存在于人类但不存在于小鼠体内的DMR,发现其中许多基因与人类发育障碍以及常见的复杂疾病有关,包括塔尔1(白血病),FOXD3系列(几种疾病),HHEX公司(糖尿病),PLCE1号机组(肾病综合征),NKX2公司(心脏干畸形),TLX1型(白血病),FEZ1型(食管癌),ALX4型(前脑缺失),柄3(大脑/免疫缺陷),NKX2型(心脏畸形),以及IGF2型(结直肠癌和其他癌症)。我们还注意到,癌症的高度表观遗传变异(其机制已被证明是难以捉摸的)将直接遵循我们的进化模型。因此,癌症不是由代际作用的不同环境引起的,而是部分由反复变化的微环境引起的。例如,反复接触致癌物会选择表观遗传异质性,从而选择细胞在正常环境之外生长的能力。
材料和方法
组织样本和CHARM。
人体组织取自斯坦利基金会,小鼠组织取自C57BL/6野生型小鼠,取自杰克逊实验室。样本制备和CHARM DNA甲基化分析(数据集来源于此)在其他地方有更详细的描述(14,15).
供应商管理报告。
首先,来自CHARM阵列的微阵列原始数据(14)转化为探针表示的每个基因组位置的估计甲基化百分比。然后对这些值进行平滑处理(14)以获得每个样本的估计甲基化曲线。然后对每个组织计算每个位置的SD。超过所有方差99.95%的位置区域被指定为VMR。
模拟。
为了创建模拟,我们扩展了Fisher-Wright中性选择模型。在中性模型中,我们从N个为了创造下一代,我们选择N个随机更换个人。这意味着每个人的子女数量遵循多项式分布,人口规模保持不变N个为了引入选择,我们允许每个人都有可能死亡1便士n个,具有生存概率第页n个取决于表型,Y(Y)n个。对于下一代,我们选择了N个从幸存下来的人中挑选出个人进行替换。对于这里显示的模拟,我们用一个简单的逻辑函数量化了这种关系,日志{pn个
/(1-pn个)}=a+bYn个注意,如果b是肯定的,那么正Y个人更健康,如果b是负数,那么负Y个人更健康。然后我们假设M(M)SNPs,X(X)米,m=1,…,M(M)影响表型。我们假设了两种可能的多态性,分别命名为0和1,并用βj个,j=1,…,M。我们指的是(X)1、…、XM(M))作为基因型。注意有2个M(M)不同基因型。
我们对复杂性状采用Fisher加性模型,并假设表型是一个随机变量
在这里e(电子)表示标准遗传模型未解释的变化,假设为平均值为0且标准偏差为标准的高斯随机量第条。注意,每个基因型的平均值不同Y(Y)值,由影响β决定。然后,我们添加了由序列变化引起的表观遗传变异项(例如,添加了一个允许VMR或T-DMR存在的CpG岛)。我们通过合并另一个特性对此进行建模;我们假设M(M)改变个体变异性的SNPs(即改变秒). 这是表观遗传场景,在这种场景中,我们合并了影响表型变异性的序列变异,而不改变表型的平均值。这类似于早期导致差异甲基化区域丢失或获得的CpG丢失或获得示例。我们将这种表观遗传变异诱导的序列变化表示为Z轴以及γ的影响,并假设
模拟1。
我们从一个等基因群体开始模拟,并允许突变以独立和随机的速度发生第页。我们用n个= 10,000,一个=-4,b= 4,M(M)=8,其中(β1,…, β8) = (-1,-1,-1,-1, 1, 1, 1),秒=1,和第页= 10−4注意,这些值一和b意味着一个普通人(Y=0)有大约1%的生存机会。相比之下,具有(0,0,0,1,1)基因型的个体存活率约为99%。对于我们模型的表观遗传部分,我们使用(γ1,…, γ8)=(-1,-1,-1,-1,1,1,1,1)/2. 这意味着一些突变使表型变异增加50%,而另一些突变使其减少50%。我们跑了1000代250次。
模拟2,环境变化。
我们重复了模拟1,只是我们模拟了戏剧性的环境变化,这些变化改变了环境及其与表型和适应度的关系。假设这些事件的发生是随机的,每25代发生一次。这种变化导致b从4变为-4。这意味着,在第一次比赛之后,比平均身高小的人比比平均身高高的人更健康。为了检查结果是否稳定,我们考虑了一个更偏斜的初始条件。具体来说,我们使用12组不同的初始参数重新运行原始模拟。我们首先将迭代次数增加到5000次。然后,我们将环境变化率改变为每5代1个、每10代1个,每25代1个或每50代1个。最后,我们将突变SNPs的数量改变为2个、8个或16个。这些模拟得出的结论与预期一致:变异性提高了适应度,尤其是在不断变化的环境中(参见图S1).
模拟3。
模拟3与模拟1相同,只是我们不允许突变影响Y(Y).
致谢
我们感谢Elisabet Pujadas对手稿提供了有益的讨论和评论,感谢Simon Tavaré指出了包含模拟的进化论论文,感谢Sarah Wheelan对BLAST的帮助。这项工作得到了美国国立卫生研究院(National Institutes of Health Grants)的支持第50页HG003233; 和R01 GM083084号.
工具书类
1韦斯KM。天平上最小的谷物。进化人类学。2004;13:122–126. [谷歌学者] 2Barton NH、Briggs DEG、Eisen JA、Goldstein DB、Patel NH。进化。纽约州冷泉港:冷泉港实验室出版社;2007[谷歌学者] 三。戈尔茨坦数据库。常见的遗传变异和人类特征。N英格兰医学杂志。2009;360:1696–1698.[公共医学][谷歌学者] 4Jablonka E,Lamb MJ。表观遗传与进化:拉马克维度。纽约:牛津大学出版社;1995.[谷歌学者] 5Cooney CA、Dave AA、Wolff GL。小鼠的母体甲基补充剂影响后代的表观遗传变异和DNA甲基化。营养学杂志。2002;132(补充8):2393S–2400S。[公共医学][谷歌学者] 6Waterland RA,Jirtle RL。转座元件:表观遗传基因调控的早期营养效应靶点。分子细胞生物学。2003;23:5293–5300. [PMC免费文章][公共医学][谷歌学者] 7Rakyan VK等人。小鼠表观遗传状态的跨代遗传Axin公司傅等位基因发生在母系和父系传播之后。美国国家科学院程序。2003;100:2538–2543. [PMC免费文章][公共医学][谷歌学者] 8West-Eberhard MJ公司。发育可塑性和进化。纽约:牛津大学出版社;2003[谷歌学者] 9沃丁顿CH。动物是如何发育的。伦敦:Allen&Unwin;1935[谷歌学者] 11Handel AE,Ramagopalan SV.表观遗传学对公共健康的影响。遗传学。2009;182:1397–1398. [PMC免费文章][公共医学][谷歌学者] 12Carbone L等人。长臂猿进化断点表明胞嘧啶甲基化与核型进化之间存在关联。公共科学图书馆-遗传学。2009;5:e1000538。 [PMC免费文章][公共医学][谷歌学者] 13Janion C.蛋氨酸对鼠伤寒沙门菌.突变研究。1982;94:331–338.[公共医学][谷歌学者] 14Irizarry RA等。在保守的组织特异性CpG岛海岸,人类结肠癌甲基组表现出类似的低甲基化和高甲基化。自然遗传学。2009;41:178–186. [PMC免费文章][公共医学][谷歌学者] 15.Irizarry RA等人,用于相对甲基化的综合高通量阵列(CHARM)基因组研究。2008;18:780–790. [PMC免费文章][公共医学][谷歌学者] 16纳多·JH。表型变异和疾病风险的跨代遗传效应。人类分子遗传学。2009;18(R2):R202–R210。 [PMC免费文章][公共医学][谷歌学者] 17SalathéM,Van Cleve J,Feldman MW。非对称健身环境中随机切换率的演变。遗传学。2009;182:1159–1164. [PMC免费文章][公共医学][谷歌学者] 18考夫曼公司。秩序的起源:进化中的自我组织和选择。纽约:牛津大学出版社;1994[谷歌学者] 19Gimelbrant A,Hutchinson JN,Thompson BR,Chess A.人类常染色体上广泛的单等位基因表达。科学。2007;318:1136–1140.[公共医学][谷歌学者] 20He L,et al.印迹基因的超可变等位基因表达模式IGF2型肿瘤细胞中的基因。致癌物。1998;16:113–119.[公共医学][谷歌学者] 21Kaminsky ZA等。单卵和双卵双胞胎的DNA甲基化谱。自然遗传学。2009;41:240–245.[公共医学][谷歌学者] 22第RE,Jr.、Scheiner R、Erber J、Amdam GV页。8.社会昆虫分工和觅食专业化的发展和演变(蜜蜂L.)当前最高开发生物。2006;74:253–286. [PMC免费文章][公共医学][谷歌学者] 23Amdam GV Omholt西南。蜜蜂工作者衰老的表观遗传调控。科学老龄化知识环境。2004;26:pe28。[公共医学][谷歌学者] 24Vogt G等。通过发育变异在相同环境中从相同基因型产生不同表型。实验生物学杂志。2008;211:510–523.[公共医学][谷歌学者]