老年学的一个中心原则是,常见的致病机制导致不同器官和组织中的年龄相关表型。例如,肝脏、骨髓和肺部的端粒功能障碍分别与年龄相关的组织特异性疾病有关,如肝硬化、再生障碍性贫血和肺纤维化(阿玛尼奥斯2011). 一些广泛的途径被认为是人类衰老的候选全局调节剂,包括西尔图因、胰岛素/IGF-1、活性氧代谢、炎症和细胞衰老。对共同致病途径导致不同组织衰老这一概念的预测是,应该有基因的表达调控这些途径,并且这些基因在人群中的异质表达应该与多种看似不同的组织特异性疾病相关。
高密度单核苷酸多态性(SNP)阵列为群体遗传学家提供了一种高通量的方法,用于识别与复杂表型(例如生理特征和/或标记物、先天异常和疾病易感性/耐药性)发病相关的多态性。利用SNP阵列深入了解可能促进/导致复杂表型的基因的大规模、基于人群的研究包括候选基因关联研究(CGAS)和全基因组关联研究(GWAS)。这两种流行病学研究方法之间的关键区别在于CGAS采用假设驱动的方法,而GWAS是以无偏见的方式进行的(参见(约根森等。2009)有关这些方法的优缺点的详细讨论)。此外,现代系谱研究(连锁分析)可以使用SNP阵列进行全基因组搜索,以识别与阿尔茨海默病等复杂疾病相关的变异(祖克内尔等。2008),但从这些努力中确定的变体可能仅限于少数实际病例(即个别家庭)。
GWAS已被成功地用于鉴定导致几种复杂表型的常见多态性变异。GWAS的价值因已在独立人群中复制的风险等位基因的现成鉴定而得到强调,这些等位基因已鉴定出新的和已知的疾病发病机制调节剂,并揭示了新的治疗靶点(阿尔茨舒勒等。2008). 此外,国家人类基因组研究所(NHGRI)保存着一份已出版的GWAS目录,目前包含约1000项研究,这些研究已经鉴定了4500个以上SNP到500个以上表型(辛多夫等。2011). 为了了解GWAS告诉我们的关于人类衰老疾病的信息,我们对NHGRI GWAS目录进行了荟萃分析。特别是,我们使用该资源以无偏见、全基因组的方式询问是否存在与多种疾病易感性/耐药性表型相关的“热点”基因座。为此,我们筛选了NHGRI数据集,使其仅包括专注于临床相关人类疾病的研究。更好地可视化与多种不同人类疾病相关的染色体位点和候选基因;特别是年龄相关疾病,我们总结了跨越整个基因组的200 kb基因座中疾病相关SNP的频率。虽然“年龄相关疾病”显然与“衰老”不是一回事,但鉴于许多线性良好的疾病对GWAS的可控制性,我们选择将此分析的重点放在疾病易感性上,而不是针对不太离散的终点(如寿命、虚弱等)获得的混合结果。我们相信这种方法仍然是老年病学家感兴趣的,因为远离疾病(健康)是健康寿命的重要决定因素。
为了编译和筛选识别人类抗病/易感性特异SNP的GWAS,2011年6月29日NHGRI GWAS数据库的完整版本从NHGRI GWAS网站下载(辛多夫等。2011). 该版本包含932个已发布的GWAS,在511个表型中鉴定出4558个SNP,每个SNP的组合p值<1.0*10−5目录中的研究还需要包括至少100000个SNP,才能进行真正的全基因组分析。我们的分析没有区分“易感”SNP和“保护性”SNP,因为每个“易感性”等位基因都意味着在同一位置存在另一个“保护性的”等位。对该数据集进行过滤,以排除小GWAS(<300例)以及调查非疾病特征、先天畸形和有限发病率医疗条件(如不宁腿综合征)的患者。在GWAS的疾病与非疾病分类不明显的罕见情况下(n=14),对GWAS结果进行盲法分类(参见补充表1和表2包括和排除的“疾病”)。纳入/排除这些边界条件不会影响分析结论。过滤后的GWAS数据集包括372项研究,确定1775个SNP与105种独特人类疾病的易感性/耐药性相关。这372项研究的患者总数超过230万,来自不同种族背景。
然后使用该数据集构建全基因组疾病易感性图(). 人类基因组的hg19释放被分成15157个箱子,每个箱子包含200 kb的基因组序列(参见补充表3用于与每个仓相关联的基因组坐标和命中)。该分析对垃圾箱尺寸的选择也不敏感。来自过滤后GWAS数据集的SNP被映射到同一疾病的重复点击数被计算为单个点击数的binned基因组。例如,当GWAS SNP映射到一种疾病的同一个bin,该疾病包含更多特定的疾病状态(例如炎症性肠病(IBD)、克罗恩病和溃疡性结肠炎)时,它被视为该bin的单一疾病。或者,如果只有特定形式的IBD映射到同一bin,这一方法允许纳入对疾病亚型有明显影响的研究,而不会过度代表专注于识别与疾病类别相关的SNP的研究。区分疾病亚型(即IBD)对我们的研究结果影响最小,只有一个位点17q12超出显著性阈值。然后在“曼哈顿图”中,将每个垃圾箱中独特疾病关联的数量与染色体位置进行对比()并对映射的SNP进行10000次迭代排列分析,以估计统计显著性。
人类疾病的遗传景观曼哈顿图描绘了与GWAS确定的疾病易感性单核苷酸多态性相关的每箱独特人类疾病数量。每个点代表一个按染色体位置排序的200kb bin。虚线表示通过10000次迭代排列检验确定的统计显著性的截止值(p<0.05)。圈出疾病相关性的两个最高峰值(p<0.0001)。
我们选择使用排列测试来估计统计显著性,因为这种方法考虑了测试的SNP数量的变化、我们计算共享类别中疾病的方法以及评估每个bin显著性的多次比较。置换测试是确定重要性的黄金标准,前提是它可以进行计算(约翰逊等。2010). 在该测试的每一次迭代中,所有SNP都被随机且独立地分配到代表整个基因组的15157个箱子中,并确定了随机分配SNP数量最多的箱子。在进行的10000次迭代中,含有四个以上独特的疾病相关SNP的Bin出现率不到5%(即p<0.05),将其设置为我们的显著性阈值(用虚线表示). 尽管有可能并非所有15000个以上的箱子都能通过GWAS进行同样好的分析,但NHGRI的纳入标准要求至少有100000个映射SNP,这表明这些分析涵盖了绝大多数基因组,即使置换分析仅限于基因组的一小部分,该研究的主要结论仍然具有重要意义。
这项分析揭示了人类基因组在疾病易感性方面的实质性异质性。大多数垃圾桶(15157个垃圾桶中的13900个;92%)不包含任何与疾病相关的SNP。相比之下,只有10个箱子(2Mb或基因组的0.06%)显示出疾病关联的统计显著性富集(p<0.05),具有两个多疾病关联的强“峰值”(p<0.0001)。最大的峰值跨越四个相邻的包含染色体6p21上基因丰富的MHC位点的箱子(800 kb)(). 这个箱子中的SNP与24种独特的疾病有关,其中大多数是自身免疫性疾病(例如哮喘、炎症性肠病、狼疮、霍奇金病、,)而不是典型的衰老疾病。这一发现证实了MHC多态性在多种自身免疫性疾病发展中的既定致病作用(费尔南多等。2008;里乌等。2009). 因此,虽然MHC基因座与自身免疫性疾病的关联并不奇怪,但这一发现为分析提供了积极的对照。
表1
染色体区域 | #独特疾病/垃圾箱 | 候选基因 | 相关疾病敏感性 |
---|
第11.3页 | 5 | IL23R(IL23R) | 免疫:IBD一个(x2)B类,白塞氏病,银屑病,强直性脊柱炎 |
第26.1页 | 5 | REL公司 | 免疫:IBD,RAC类、银屑病、腹腔疾病、霍奇金淋巴瘤 |
第5页15.33 | 5 | TERT(地形) | 衰老:癌症(x5),特发性肺纤维化 |
第6页第21页 | 26个跨四个箱子 | MHC,槽口4 | 免疫:关节炎(x4)、IBD(x2)、癌症(x5)、狼疮、MSD类、硬皮病、腹腔疾病、T1DME类、哮喘、原发性胆汁性肝硬化、银屑病 |
7季度32.1 | 5 | IRF5、TNPO3 | 免疫:系统性红斑狼疮F类、IBD、RA、原发性胆汁性肝硬化、硬皮病 |
9第21.3页 | 10 | 第15页墨水4b,第16页INK4a公司,第14页农业研究基金,ANRIL公司 | 衰老:MIG公司,中风,2型糖尿病H(H)、青光眼、主动脉瘤、颅内动脉瘤、癌症(x3)、子宫内膜异位症 |
2012年第17季度 | 5 | IKZF3、GSDMA、GSDMB | 免疫:IBD(x2)、哮喘、RA、T1DM |
第二高的疾病易感性关联峰映射到染色体9p21.3上的基因缺陷。这个箱子里只有四份来自墨水4/ARF(或CDKN2a/b)包含三个相关蛋白编码转录物(p15)的位点墨水4b,第16页INK4a公司,第14页农业研究基金)以及长的非编码RNA(安里尔)这对p15来说是反意义的墨水4b. The墨水4/ARF基因座是细胞衰老的关键介体,抑制细胞周期从G1对各种形式的细胞应激的S期反应(Sharpless&DePinho 2007年). 9p21.3基因与10种独特的疾病有关,几乎所有这些疾病都与年龄有关:癌症(如乳腺癌、胶质母细胞瘤)、2型糖尿病(T2DM)、青光眼和几种动脉粥样硬化疾病(如中风、主动脉瘤、心肌梗死)(). 值得注意的是,这两个峰值的规模相当大:6p21和9p21.3疾病易感性热点占基因组的0.03%,但结合起来与GWAS分析的近三分之一(105个中的34个)的独特疾病有关。
其余五个因疾病相关而显著富集的箱子(1p31.3、2p16.1、5p15.33、7q32.1、17q12)也与免疫/炎症或细胞衰老途径直接相关。1p31和2p16基因分别含有IL23R和REL,它们调节免疫和淋巴细胞生物学,这些基因主要与自身免疫性疾病相关(). 5p15.33 bin包括端粒酶的一个关键亚单位TERT,它通过调节端粒长度与细胞衰老相关(Martinez&Blasco 2011年). 映射到5p15.33 bin的疾病易感性主要由癌症组成,这与端粒长度和癌症易感性之间的关系一致() (Hills&Lansdorp 2009年;威利特等。2010). 5p15.33 bin也与特发性肺纤维化(IPF)相关,这与先天性端粒酶缺乏症患者IPF增加的发现一致(阿玛尼奥斯等。2007;察基里等。2007). 7q32和17q12基因座中的候选基因不太明显,但这些基因座也仅与自身免疫性或炎症性疾病相关()这表明这些箱子里藏有免疫反应调节剂。总的来说,与免疫和炎症相关的5个基因座大多与自身免疫性疾病(如T1DM、哮喘、IBD、霍奇金病)相关,与衰老相关的两个基因座(即癌症、动脉粥样硬化、T2DM、青光眼、肺纤维化)相比,与年龄相关疾病的相关性不强。
尽管发现所有与广泛抗病性相关的基因座似乎都与免疫或衰老的影响有关,但这一分析仍有局限性。首先,顺调控元件可以在大基因组范围内发挥作用(例如几个Mb);例如,9p21.3变异体被认为会影响癌旁抑癌蛋白的表达INK4a/ARF公司轨迹,以及干扰素-21,一种更远(~1Mb)的炎症调节因子(线路接口单元等。2009;哈里斯曼迪等。2011). 同样,5p15.33基因中的另一个基因,CLPTM1L型也被认为有助于癌症的进展(麦凯等。2008). 因此,位于GWAS识别的SNP附近的真正因果变异可能影响一个或多个局部转录物的表达,其中一些或全部可能不位于同一个基因座中。此外,在某些明确的疾病状态(例如自身免疫性疾病)中存在确定偏差与临床上不太明显的实体(如社区获得性肺炎)相比,GWAS似乎更容易控制。因此,并非所有衰老的病态状况都能被GWAS所控制。
重要的是,本研究未对每种疾病的患病率和发病率进行加权。例如,硬皮病(罕见)和心肌梗死(常见)都被视为每个基因组箱中的单一、独特疾病,尽管它们对人类发病率的总贡献有很大差异。此外,这项分析没有说明SNP的流行率或其影响的规模。未来的工作可以结合这些因素来估计与某些SNP基因型相关的多疾病人群归因风险。由于这些局限性,该分析可能高估了MHC基因座的重要性,该基因座与几种罕见疾病密切相关。相比之下,它可能低估了9p21.3 bin的相关性,而9p21.3与常见的高度病态疾病相关().
尽管衰老调节剂如TERT(地形)和第16页INK4a公司对于癌症和具有自身免疫性的MHC基因座来说,这一发现并不令人惊讶,所有已确定的复发性疾病关联热点都映射到与炎症/免疫或细胞衰老相关的基因座。与9p21.3基因相关的年龄相关疾病的多样性尤为显著(). 在与年龄相关的发病率的四个主要原因中(肿瘤、代谢疾病、动脉粥样硬化和神经变性),有三个与基因多态性映射有关墨水4/ARFGWAS轨迹(). 最近,基于晚发性阿尔茨海默病全基因组系谱研究,即使是异常的神经退行性疾病也与该基因座有关(祖克内尔等。2008). 虽然目前尚不清楚调节衰老是如何导致9p21.3蛋白中的某些疾病的,但这一发现与最近几项显示调节p16作用的小鼠研究一致INK4a公司表达体内许多非恶性、年龄相关的表型,包括T2DM、动脉粥样硬化、T细胞功能、白内障和肌肉减少(里希纳穆尔蒂等。2006;贝克等。2011;陈等。2011;郭等。2011;线路接口单元等。2011).
这个墨水4/ARF基因座是老年相关疾病易感性的基因组热点人类体内的主要转录物墨水4/ARF包括长非编码RNA ANRIL在内的基因座是相对于9号染色体描述的。GWAS识别的疾病易感性SNP映射到墨水4/ARF基因座由基因组标尺上方的彩色编码圆圈表示。通过非GWAS关联研究(如全基因组系谱研究)确定标尺下方显示的敏感性SNP。每种颜色代表SNP颜色键中描述的特定人类疾病。与特定疾病相关的易感SNP簇以大的彩色编码卵形标记。缩写:ASVD=动脉粥样硬化性血管疾病和T2DM=2型糖尿病。
值得注意的是,与广泛的疾病易感性无关的是:调节模型生物体寿命的保守途径(例如胰岛素/IGF-1信号、mTOR信号、活性氧物种信号、Sirtuins等)。这些途径的调节可能在人群中不可变,或者这些途径不调节人类的一般抗病性,但我们认为这一观察更可能反映出GWAS荟萃分析方法的不足。因此,在候选研究和系谱分析中,IGF1R、FOXO3A和AKT1附近的SNP与寿命相关(苏(Suh)等。2008;帕利科夫斯卡等。2009;塞巴斯蒂亚尼等。2012),这表明随着进一步研究,在全基因组分析中可能会出现这些基因座与年龄相关疾病的关联。尽管如此,这项对约230万患者的结果进行的无偏见的荟萃分析仅将细胞衰老和免疫的多态性调节确定为人类疾病遗传易感性的一般决定因素,尤其是衰老与年龄相关的疾病。这些遗传数据支持这些特定途径的治疗靶向性,以提高广泛的疾病抵抗力并延长人类健康寿命。