美国人类遗传学杂志。2005年7月;77(1): 64–77.
C-反应蛋白(CRP)启动子区的多态性与血浆CRP水平相关
,1 ,三 ,1 ,4 ,2 ,1 ,5 ,6 ,7 ,6 ,8 ,8 ,9 ,10 ,1 ,三 ,2和2
克里斯托弗·S·。卡尔森
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
雪莉·福斯·奥尔德雷德
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6阿拉巴马大学伯明翰分校预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
菲利普·K·。李
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
罗素·P·。特蕾西
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
斯蒂芬·M·。施瓦茨
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
马克·里德
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
Jiang Liu(刘江)
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
O.戴尔·威廉姆斯
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
卡洛斯·伊里波伦
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
E.科拉·刘易斯
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
Myriam Fornage公司
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6阿拉巴马大学伯明翰分校预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
埃里克·博温克尔
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
迈伦·格罗斯
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
卡舍尔·贾奎
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8得克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
黛博拉A。尼克森
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
理查德·M·。迈尔斯
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
大卫·S·。西斯科维克
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
亚历山大·P。雷纳
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
1基因组科学和2西雅图华盛顿大学心血管健康研究室;三斯坦福大学遗传学系;4佛蒙特大学伯灵顿分校;5芝加哥西北大学;6伯明翰阿拉巴马大学预防医学系;7奥克兰凯撒永久研究部;8德克萨斯大学休斯顿分校;9明尼阿波利斯明尼苏达大学;和10贝塞斯达国家心脏、肺和血液研究所(NHLBI)
2005年1月24日收到;2005年4月26日接受。
摘要
血浆C反应蛋白(CRP)水平升高是一种炎症敏感标记物,已成为明显健康男性和女性未来心血管疾病和代谢异常的重要预测指标。在这里,我们对包含CRP基因位点的基因组区域的常见核苷酸变异进行了系统调查。在确定的常见单核苷酸多态性(SNPs)中,CRP启动子区域中的几个与欧洲裔美国人和非洲裔美国人年轻人心血管风险的大型队列研究中的CRP水平密切相关。我们还证明了这些SNP在体外的功能重要性。
介绍
C反应蛋白(CRP)最初被定义为血清中与C多糖结合的蛋白质斯特雷普肺炎球菌(蒂勒和弗朗西斯1930)是作为人类急性期反应的一部分上调的原型蛋白吗(Abernathy和Avery1941). 最近,CRP升高被确定为心血管疾病(CVD)风险的生物标志物,补充了BMI、吸烟、糖尿病和胆固醇水平等传统风险因素(Ridker等人。1997,2000,2005; Danesh等人。2000,2004; 哈卡姆和阿南德2003). 家庭和双胞胎研究表明,加性遗传因素占血浆CRP水平变化的40%(Pankow等人。2001; Retterstol等人。2003; MacGregor等人。2004),但具体的遗传决定因素仍然缺乏特征。
CRP的人类遗传关联研究包括一些评估基因型和血浆CRP水平之间关系的研究(Szalai等人。2002; Zee和Ridger2002; Brull等人。2003; Russell等人。2004)或疾病风险(Zee和Ridger2002; Wolford等人。2003; Russell等人。2004). 这通常是因为缺乏DNA序列变异的功能数据。其他地方报道的与CRP水平相关的多态性包括启动子区域的多态性(Kovacs等人。2005),第2外显子的同义多态性(Russell等人。2004; Suk等人。2005),3′UTR的多态性(Brull等人。2003)以及3′UTR中的第二个多态性(Russell等人。2004). 这些研究仅限于CRP基因位点内的少数多态性,而没有考虑整个位点的变异模式。因此,尽管报告的关联性表明CRP位点的变异与基础CRP水平显著相关,但观察到的关联仍可能归因于与报告的多态性强连锁不平衡(LD)中的其他多态性,因为之前的研究都没有证明等位基因之间的功能差异。之前的分析也主要局限于欧洲人群,之前没有研究包括100多名非裔美国人(AA)。
为了探讨人类CRP基因位点的常见遗传变异是否影响血浆CRP,我们使用了一种从基因组重测序开始的方法,以确定核苷酸多样性的所有常见模式,并定义欧美(EA)和AA人群的常见单倍型。然后,我们对一组多态性进行基因分型,这些多态性代表了在一个更大的基于人群的研究样本中确定的常见变异模式,并且我们确定了与特定单倍型的关联。最后,我们在人类肝细胞系中使用体外CRP启动子分析实验验证了所观察到的与启动子区多态性的关联。
材料和方法
SNP发现、标记SNP选择和基因分型
通过使用应用生物系统公司(ABI)的标准BigDye Terminator v3.1化学试剂,对跨CRP基因区域的PCR产物进行重新测序,以确定多态性位点。对47个样本的基因和侧翼区域进行了重新测序:24个来自Coriell AA100组的无关AA和23个来自CEPH家系的无关EA。Coriell样本标识符可在SeattleSNPs基因组应用程序我们在每个样本中重新测序6800 bp,包括两个外显子、插入内含子以及该基因的1.7 kbp 5′和2.8 kbp 3′。SNP编号基于GenBank(基因银行)注册号AF449713。强LD中常见SNPs的Bins(次要等位基因频率[MAF]>10%),定义如下第页2>通过使用LDselect v1.0在每个人群中识别出0.64个(Carlson等人。2004). 选择了7个tagSNP,用于覆盖两个测序群体中的所有箱子。相对于AF449713,7个tagSNP位置为790(数据库SNP 3093058卢比), 1440 (3091244卢比), 1919 (1417938卢比), 2667 (1800947卢比), 3006 (3093066卢比), 3872 (rs1205型)和5237(2808630卢比).
以前的文献通常使用一个命名法来表示相对于ATG密码子的多态性位置。因此,先前报道的启动子多态性被称为−286(Kovacs等人。2005)外显子2的同义多态性被称为+1059(Russell等人。2004; Suk等人。2005),3′UTR的多态性被称为+1444(Brull等人。2003)和+2147(Russell等人。2004). 由于我们的重新测序工作确定了CRP基因区域中的几个插入/缺失多态性,相对于起源(如ATG密码子)的编号将不明确,因此我们选择了相对于其在GenBank登录号AF449713中的位置的每个多态性,其中详细介绍了我们多态性发现调查的结果。为了方便起见,以下是其他地方报道的多态性假名的简要列表:−717是1009(2794521卢比),−286是1440(3091244卢比),+1059是2667(rs1800847),+1444等于3014(1130864卢比),+2147是3872(1205卢比).
tagSNP基因分型使用塔克标准条件下的人体试验(ABI),但三等位基因标记SNP除外(详见下文)。每个分析的探针和引物序列列于在SDS软件(ABI)中手动对标记SNPs 790、3872和5237的终点荧光值进行基因分型。实时读取的阈值周期(Ct)值被导出到Excel(Microsoft),并用于对1919、2667和3006的基因型进行聚类和手动评分。三等位基因SNP(1440)通过使用试剂在5μl反应中以以下最终浓度在单管试验中进行基因分型:塔克Man探针分别为0.2μM、两个PCR引物分别为1μM、1×Universal Mastermix(ABI)、1 M甜菜碱(Sigma-Aldrich)和1 ng/μl基因组DNA。热循环反应如下:50°2 min,95°10 min,然后在95°下45个循环15 s,53°30 s,60°1 min。在ABI 7900HT仪器上获得实时数据。所有三种探针实时数据的Ct值均从SDS 2.1软件(ABI)中导出,并用于在Excel中可视化和手动调用基因型。利用PHASE v2.0(Stephens和Donnelly2003).
表1
| 底漆(5′→3′)
| | |
SNP公司 | 福沃德 | 反向 | 阿勒一 | 等位基因探针 |
790 | GACAGTGTGAGGGATTCATGAAT公司 | GTAAAGCTTCAGGCAGGAGTCA公司 | A类b条 | VIC ATCTGATTCTCTTCC MGBNFQ公司 |
| | | T型b条 | 6FAM CTGATTCTACTTCC MGBNFQ公司 |
1440 | TGTTGGAGAGCAGCTACA公司 | tcctgcgaaaaaaatggaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa | A类 | NED ATGGCACTAGTTA MGBNFQ公司 |
| | | T型 | VIC ATGGCACTTTTTAA MGBNFQ公司 |
| | | C类 | 6FAM TGGCCACTCGTTAA MGBNFQ公司 |
1919 | TGCTTTTGGCCAGAGAGGTAA公司 | 塔加CCCCCCACTACC | A类 | VIC ATGGGAGATTGAT MGBNFQ公司 |
| | | T型 | 6FAM CTATGGGAGAGTTTTG经理 |
2667 | CCGCCAAGATAGTGTTAATC公司 | CCTGGTGGGAGACATTGGAA公司 | C类b条 | 6FAM CTGGTGAGCACAAA MGBNFQ公司 |
| | | 克b条 | VIC CTGGTGACAGCACAA MGBNFQ公司 |
3006 | CCTGAGAATGGTAAAGTGTCT公司 | AAACACCTCTCAATTCGATTTTGGAC公司 | A类 | VIC CTCGTTAACTATGATGAA MGBNFQ公司 |
| | | C类 | 6个家庭 |
3872 | GCCATCTTGTTTGCCACATG公司 | GCTCCTCCACTTCCAGTTTGG公司 | A类b条 | VIC TGTCCTCATAGTCT MGBNFQ公司 |
| | | 克b条 | 6FAM CCTCACAGTCTCC MGBNFQ公司 |
5237 | TCTTCAGAATTCAGTTGCTTGCAT公司 | AAATTATTAAGGCGAGGCTGTCT公司 | A类b条 | VIC ACCAGACTATGTATAGTAAG管理 |
| | | 克b条 | 6FAM CCAGACTACGATAA MGBNFQ公司 |
CARDIA人群研究样本
青年人冠状动脉风险发展(CARDIA)研究是一项基于人群的研究,始于1985年,旨在调查一个大型双种族青年队列中心血管风险因素的演变(Hughes等人。1987; Friedman等人。1988). 通过社区抽样(伯明翰、亚利桑那州、芝加哥和明尼阿波利斯)和大型预付医疗计划(奥克兰)的会员资格,从四个地理位置招募了年龄在18-30岁的参与者。1985-1986年,对5115名参与者(即51%的合格联系人)进行了基线检查。每6个月联系一次参与者,并在五次随访检查中重新检查(1987年至1988年的第2年、1990年至1991年的第5年、1992年至1993年的第7年、1995年至1996年的第10年和2000年至2001年的第15年)。
最初的研究人群在年龄(45%为18-24岁;55%为25-30岁)、性别(46%为男性;54%为女性)、种族(52%为AA;48%为EA)和教育(40%完成了12年的教育;60%完成了>12年)方面大致平衡。存活参与者的随访检查总保留率在第2年为91%,第5年为86%,第7年为81%,第10年为79%,第15年为74%。CARDIA数据库包括对生活方式、生理和代谢风险因素的重复测量,包括吸烟、肥胖和体力活动。符合当前研究条件的参与者包括那些同意从第10年检查时获得的外周血白细胞中分离基因组DNA并有足够DNA样本的人(n个=3,790).
表型测量和统计分析
使用BNII免疫比浊法(BNII浊度仪100分析仪[Dade Behring])对第7年储存的血浆、3382名同样同意DNA检测的返回CARDIA参与者和3146名15年返回的同意参与者的血浆进行血浆CRP水平测定。后一个数字代表了参加15年检查的3672名原始CARDIA受试者中的86%。在第15年进行了两次CRP测量,即BNII和ELISA。BNII是一种比ELISA更敏感的检测方法(Wener等人。2000)因此,尽管第15年的ELISA数据分析结果是一致的(未显示数据),但只显示了BNII数据的分析结果。BNII血浆CRP测量范围为0-333 mg/L。基于ELISA的CRP>10 mg/L的样本被认为代表急性疾病、压力或感染(Shine等人。1981; Pearson等人。2003); 在第15年观察到48个此类样本,与第15年BNII CRP>18 mg/L的50个样本相比。排除BNII>18 mg/L的样品对第7年或第15年的结果影响可忽略不计(数据未显示)。高于该阈值的样本在第7年和第15年的血浆CRP测量值显著相关,因此CRP测量结果较高的样本没有从分析中剔除。
在R统计程序v2.0.1中进行逐步线性回归,以第7年的ln(血浆CRP)(血浆CRP-的自然对数)、第15年的ln-(血浆CRP.)或第7年至第15年之间ln(血清CRP)的变化为因变量。允许以下表型指标作为自变量进入模型:ln(BMI)、年龄、性别、种族、收缩压、舒张压、ln(葡萄糖)、ln、ln总胆固醇、ln高密度脂蛋白、ln和ln(胰岛素/葡萄糖)。贝叶斯信息准则(Hastie等人。2001),衡量每个模型与模型中参数数量受到惩罚的数据的拟合程度,用于所有模型比较。
在分析单倍型对ln(血浆CRP)的影响时,对于每一个因变量(第7年的CRP和第15年的CRP),在这两个时间点保留在最佳拟合模型中的自变量被纳入协变量。使用单倍体统计软件包对R进行分析(Lake等人。2003)这是一个广义线性回归框架,通过使用期望最大化(EM)单倍型参考算法,而不是通过为每个样本分配最可能的单倍型相位分辨率,推断每个个体的单倍体可能性概率矩阵,从而纳入了单倍型相不确定性。对完整的CARDIA队列进行单因素统计分析,将种族和性别作为协变量,并对按性别和种族分层的CARDIA队列子集进行单因素分析。单倍型统计分析仅限于单倍型,推断频率>1%,代表该队列中的~33条染色体。
体外启动子变异载体的构建
将来自代表几种单倍型的CRP启动子区的PCR产物克隆到修饰的pGL3碱性萤光素酶表达载体(Promega)中。本地启动子的短克隆和扩展克隆分别代表bps 540–1726和bps 1023–1726,相对于GenBank(基因银行)AF449713(对应于位置−1186至+1和−703至+1,相对于Li等人讨论的转录起始位点(TSS)[1990]). 为了降低白细胞介素6(IL6)的依赖性,用SV40最小启动子(pDsRed2-C1[Promega]的bps 2349–2513)替换近端CRP启动子(相对于TSS为−107到+1)。构建序列通过标准荧光重测序进行验证,并且所有构建序列都已放入GenBank(基因银行)制备每种构建物的Maxipreps(Plasmid Maxi Kit,零件号12162[QIAGEN]),并通过紫外密度测定法稀释至200 ng/μl的浓度,并通过琼脂糖凝胶中系列稀释液的溴化乙锭染色进行验证。
荧光素酶分析
在24孔板中对人肝癌细胞系(来自ATCC[Manassas]的PLC/PRF/5细胞)进行瞬时转染分析,每个实验每个构建体24个重复孔。细胞接种在含血清的培养基中。24小时后,将细胞转染到无血清培养基中(因此转染时间也可用作血清饥饿时间)。在每个孔中,按照试剂提供的方案,用Fugene 6转染试剂(Roche Diagnostics)转染200 ng质粒。18小时后,去除转染介质,用200 U/ml人IL6(干细胞技术)在无血清介质中诱导细胞,或用非IL6无血清介质模拟诱导细胞。24小时后制备细胞裂解物,并根据荧光素酶检测系统(Promega)的方案,在Wallac平板光度计中检测荧光素酶活性。
对于每个24孔数据集,去掉两个最高值和两个最低值,以删除可能与转染效率变化有关的异常值。对于剩下的数据,荧光素酶值在自然启动子实验中被标准化为无启动子空载体的平均活性,或者在替换启动子实验中将其标准化为SV40最小启动子,以获得反映每个CRP启动子构建物的折叠活性高于基线水平的数据。标准误差测量和双尾学生t吨测试用于评估单倍型结构之间差异的显著性。
结果
CRP基因tagSNP的发现与筛选
通过对47个个体(24个AA和23个EA)的直接重测序,确定了CRP基因区域的多态性。我们共鉴定出31个SNP,30个AA多态性,13个EA多态性(). 在两个群体中均未发现氨基酸变化的SNP。共有18个常见的SNP(即,在两个群体中至少有一个群体中,相对MAF>10%的SNP)。通过使用贝叶斯统计方法重建单倍型(PHASE v2.0),从18个常见SNP中推断出10个独特的CRP单倍型。2001).
CRP的基因SNP图像,显示了多态性扫描区域。外显子的编码区显示为蓝色,UTR显示为绿色。轴下方的扁虱表示多态位置,扁虱的长度表示组合种群中的MAF。内含子的高度重复区域(以粉红色显示)无法通过重测序来筛选多态性。Nonsyn=非同义;同义词;同义词;CDS-编码序列。
接下来,我们使用了基于LD的tagSNP选择算法(LDselect)(Carlson等人。2004)阈值为第页2>0.64,我们确定了五个tagSNP,总结了测序样本中CRP基因的常见变异模式(). 另外两个SNP是来自启动子区域的常见三等位SNP和一个罕见的同义SNP,之前与CRP水平相关(Zee和Ridger2002)-选择进行独立于LDselect结果的分析。7个tagSNP将测序样品中观察到的10个独特单倍型分解为8个相关单倍型分支()每个tagSNP等位基因标记一个特定单倍型(SNPs 790、1919、2667、3006和5237)或一个进化相关单倍型分支(SNP 1440和3872)。
CRP位点常见变异模式的可视基因型图。每行对应于多态性发现面板中的单个DNA样本;E001–E023是EA,D001–D040是AA。每列对应一个多态位点。位点是按LD排序的,而不是沿着染色体的位置,显示相似的基因型模式的位点彼此相邻。站点编号与GenBank(基因银行)注册号AF449713。所选标记SNP用箭头表示。
常见CRP单倍型的系统发育。利用PHASE v 2.0推断出所有18个常见SNP的单倍型(AA或EA测序样品中MAF>10%)。图中显示了使用七个选定的tagSNP解析的主要CRP单倍型的邻接系统发育树,分支长度表示进化距离,即所有18个常见SNP共享的等位基因的比例。显示了与每个解析单倍型相关的tagSNP等位基因。
CRP基因型-表型关联研究
随后,我们对作为CARDIA研究一部分招募的3790名美国成年人中的七个选定tagSNP进行了基因分型(Hughes等人。1987; Friedman等人。1988). 这些受试者基线年龄为18-30岁,进行了15年的前瞻性随访,并对各种心血管危险因素进行了系列评估(). 测序样本和CARDIA队列中所有tagSNP的等位基因频率一致()尽管在AA和EA之间tagSNP等位基因频率存在显著差异。测序样本和CARDIA队列中推断的单倍型频率也相似().
表2
按种族和性别分列的15岁CARDIA参与者特征[注]
| AA公司
| 每个
|
特性 | 男(n个=603) | 女性(n个=851) | 雄性(n个=815) | 女性(n个=895) |
年龄(年) | 39.5 (3.70) | 39.6 (3.85) | 40.6 (3.34) | 40.6 (3.37) |
BMI,单位:kg/m2 | 29.0 (6.15) | 31.6 (7.89) | 27.7 (4.81) | 26.7 (6.60) |
总胆固醇,mg/dl | 184.9 (40.71) | 179.2 (33.21) | 191.2 (38.47) | 182.2 (32.05) |
胆固醇(mg/dl): | | | | |
低密度脂蛋白 | 115.4 (35.70) | 108.5 (31.09) | 121.4 (33.01) | 107.1 (29.10) |
高密度脂蛋白 | 47.6 (13.72) | 54.1 (13.65) | 43.1 (11.56) | 56.1 (14.76) |
甘油三酯,mg/dl | 106.1 (66.99) | 83.1 (56.53) | 140.7 (149.43) | 94.1 (59.36) |
糖尿病(%) | 4.8 | 4.7 | 3.1 | 1.6 |
空腹血糖,mg/dl | 88.2 (17.84) | 86.9 (26.85) | 89.4 (18.77) | 82.6 (13.88) |
空腹胰岛素水平,mU/ml | 15.3 (12.25) | 16.6 (12.83) | 14.0 (9.98) | 11.8 (7.44) |
血压(mmHg): | | | | |
收缩性的 | 118.8 (15.78) | 116.1 (16.17) | 113.7 (12.82) | 106.4 (12.22) |
舒张性 | 79.0 (12.50) | 75.6 (12.41) | 75.5 (10.12) | 69.5 (9.57) |
当前吸烟者(%) | 32.7 | 25.5 | 17.1 | 15.1 |
每日饮酒量(ml) | 16.5 (35.48) | 6.1 (24.60) | 15.1 (25.84) | 8.0 (13.42) |
C反应蛋白,单位:μg/ml | 3.1 (5.11) | 4.8 (6.38) | 2.0 (4.70) | 2.8 (4.28) |
表3
tagSNP等位基因在SNP发现和CARDIA人群中的频率
| | | 等位基因频率(%)in
|
| | | AA公司
| 每个
|
SNP公司 | 数据库SNP 编号 | 等位基因 | 已排序样本(n个=24) | 心脏病队列(n个=1,557) | 已排序样本(n个=23) | 心脏病队列(n个=1,820) |
790 | 309358卢比 | 自动转账 | 77/23 | 83/17 | 100/0 | 100/0 |
1440 | 3091244卢比 | A/C/T(A/C/T) | 33/26/41 | 26/45/29 | 5/62/33 | 7/64/30 |
1919 | 1417938卢比 | 自动转账 | 83/17 | 88/12 | 70/30 | 70/30 |
2667 | 1800947卢比 | 克/克 | 2/98 | 1/99 | 4/96 | 6/94 |
3006 | 3093066卢比 | A/C公司 | 29/71 | 23/77 | 0/100 | 0/100 |
3872 | 1205卢比 | A/G公司 | 15/85 | 19/81 | 25/75 | 34/66 |
5237 | rs2808630 | A/G公司 | 94/6 | 82/18 | 65/35 | 72/28 |
表4
| 标签SNP单倍型频率(%)
|
| AA公司
| 每个
|
单倍型 | 已排序样本(n个=24) | 心脏病队列(n个=1,557) | 已排序样本(n个=23) | 心脏病队列(n个=1,820) |
上半年 | 2 | 1 | 4 | 6 |
氢气 | 15 | 18 | 24 | 28 |
H3级 | 4 | 9 | 0 | 2 |
H4型 | 6 | 17 | 35 | 28 |
H5型 | 17 | 12 | 30 | 29 |
H6型 | 23 | 17 | 0 | 0 |
H7型 | 4 | 三 | 7 | 6 |
H8型 | 29 | 22 | 0 | 0 |
其他 | 0 | 1 | 0 | 1 |
对选定的临床、人口统计学和生活方式测量值的对数转换CRP值进行逐步线性回归,确定了第7年和第15年BMI、种族、性别、甘油三酯、胰岛素水平和当前吸烟量的六个具有统计学意义的预测因子,以及CRP水平的两个显著交互作用,在性和甘油三酯之间(P(P)<.0001)以及性与吸烟之间(P(P)<.0001). 每个时间点的最佳拟合模型如所示(第7年)和(第15年)。在这两个时间点上,性和甘油三酯之间的相互作用反映出女性与甘油三酸酯水平的强烈关联,而男性与甘油三酯水平的弱关联,性和吸烟之间的相互关系反映出男性与吸烟的强关联,但女性与吸烟的关联不明显(数据未显示)。
表5
所有受试者第7年ln(血浆CRP)水平的最佳模型预测值(N个=3,051一)[注]
变量 | 系数 | 东南方 | t吨 | P(P) |
拦截 | −10.94494 | 2.88816 | … | … |
ln(体重指数) | 5.18221 | .75648 | 6.85 | <.00001 |
男性 | −3.56098 | .87599 | −4.065 | .00005 |
ln(甘油三酯) | 1.64048 | .59597 | 2.753 | .00594 |
每个 | −.19726 | .04202 | −4.694 | <.00001 |
当前吸烟者 | .83452 | .14108 | 5.915 | <.00001 |
ln(胰岛素) | .18478 | .05211 | 3.546 | .00040 |
ln(高密度脂蛋白) | −1.0518 | .2822 | −3.727 | .00020 |
性别×ln(甘油三酯) | .50974 | .07917 | 6.439 | <.00001 |
性别×吸烟 | −.39441 | .0877 | −4.497 | <.00001 |
ln(BMI)×ln(甘油三酯) | −.6605 | .17643 | −3.744 | .00019 |
性别×ln(HDL) | .51058 | .17352 | 2.942 | .00328 |
表6
所有受试者15岁时ln(血浆CRP)水平的最佳模型预测值(N个=2,995一)[注]
变量 | 系数 | 东南方 | t吨 | P(P) |
拦截 | −6.97033 | .71399 | … | … |
ln(体重指数) | 2.64426 | .12112 | 21.832 | <.00001 |
性别=男性 | −1.83951 | .33939 | −5.42 | <.00001 |
ln(甘油三酯) | −.32598 | .12674 | −2.572 | .01016 |
种族=EA | −.1184 | .04667 | −2.537 | .01123 |
当前吸烟者 | 5.43416 | .88041 | 6.172 | <.00001 |
胰岛素 | −.07988 | .12149 | −.658 | .51090 |
性别×ln(甘油三酯) | .40566 | .08014 | 5.062 | <.00001 |
ln(BMI)×吸烟 | −.93057 | .21364 | −4.356 | .00001 |
种族×吸烟 | −.37527 | .09451 | −3.971 | .00007 |
性别×吸烟 | −.31565 | .09251 | −3.412 | .00065 |
性别×ln(胰岛素) | .19499 | .07463 | 2.613 | .00902 |
CRP单倍型之间的CRP水平存在显著差异(P(P)<10-6),并且两个时间点的关联模式相似(和表格和)以及按性别和种族分层的分析(数据未显示)。无协变量的类似分析结果也一致(数据未显示)。单倍型1(H1)(由SNP 2667标记)与两个时间点相对于H2(参照物)的CRP水平显著降低相关。此外,携带三等位SNP1440的C等位基因的H1–H4分支的CRP水平低于H5–H8分支。在后一组中,H6(由SNP 790标记)与所有其他单倍型相关的最高CRP水平。无协变量的类似分析结果也一致(数据未显示)。在等位基因独立性假设下拟合的模型比隐性或显性模型在任何位点的拟合效果更好(数据未显示)。在单倍型和种族以外的表型变量之间没有相互作用的情况下拟合的模型显示出比包括这种相互作用的模型更好的拟合(数据未显示)。排除BNII CRP值>18 mg/L的48名受试者并没有改变这些结果。同样,排除CRP值的上限和下限5%也不会改变结果,因此观察到的相关性不太可能归因于少数有影响力的数据点。将完整模型的残差方差与排除单个预测因子的模型的残值方差进行比较,结果表明,在两个时间点,只有BMI比tagSNP解释的方差比例更大(). 按种族分层的分析结果相似(数据未显示)。
tagSNP单倍型对ln(CRP)的相对影响。对每个单倍型的单倍体glm分析的回归系数进行估计,表型变量包括为协变量。系数反映了每拷贝平均ln(CRP)相对于H2的差异,H2是最常见的单倍型。H1显著低于H2,H5–H8显著高于H2(参见P(P)表中的值和).
表7
变量 | tagSNP等位基因 | 单倍型频率一 | 系数 | 东南方 | t吨 | P(P) |
拦截 | … | … | −8.0161 | .0703 | … | … |
每个 | … | … | −.0332 | .0502 | −.661 | .509 |
男性 | … | … | −1.0083 | .1817 | −5.549 | <.00001 |
ln(体重指数) | … | … | 2.4367 | .1008 | 24.18 | <.00001 |
ln(胰岛素) | … | … | .1963 | .0511 | 3.845 | .00012 |
ln(甘油三酯) | … | … | −.2996 | .0722 | −4.151 | .00003 |
当前吸烟者 | … | … | .7819 | .1406 | 5.561 | <.00001 |
上半年 | ACACAA公司 | .0381 | −.1262 | .0728 | −1.734 | .0831 |
氢气 | ACAGCAA公司 | .2306 | 参考 | … | … | … |
H3级 | ACAGCGA公司 | .0398 | .1387 | .0725 | 1.912 | .056 |
H4型 | ACAGCGG公司 | .2215 | .0563 | .0393 | 1.432 | .152 |
H5型 | ATTGCGA公司 | .2053 | .2818 | .0398 | 7.085 | <.00001 |
H6型 | TTAGCGA公司 | .0717 | .4498 | .0592 | 7.602 | <.00001 |
H7型 | AAAGCGA公司 | .0481 | .3128 | .0669 | 4.677 | <.00001 |
H8型 | AAAGAGA公司 | .0948 | .1749 | .054 | 3.236 | .00122 |
其他b条 | … | .0502 | .1908 | .0705 | 2.706 | .00685 |
性别×ln(甘油三酯) | … | … | .367 | .0441 | 8.324 | <.00001 |
性别×吸烟 | … | … | −.3587 | .0877 | −4.091 | .00004 |
表8
15岁时CRP单倍型与血浆CRP水平的相关性[注]
变量 | tagSNP等位基因 | 单倍型频率一 | 系数 | 东南方 | t吨 | P(P) |
拦截 | … | … | −7.1203 | .0745 | … | … |
每个 | … | … | −.0405 | .0495 | −.819 | .413 |
男性 | … | … | −1.69 | .1824 | −9.265 | <.00001 |
ln(体重指数) | … | … | 2.4717 | .0963 | 25.657 | <.00001 |
ln(胰岛素) | … | … | .2016 | .0438 | 4.605 | <.00001 |
ln(甘油三酯) | … | … | −.4544 | .0671 | −6.771 | <.00001 |
当前吸烟者 | … | … | .7411 | .1456 | 5.09 | <.00001 |
上半年 | ACACAAA公司 | .0378 | −.2275 | .0717 | −3.172 | .00153 |
氢气 | ACAGCAA公司 | .2262 | 引用 | | | |
H3级 | ACAGCGA公司 | .0414 | −.0335 | .0706 | −.475 | .635 |
H4型 | ACAGCGG公司 | .2231 | .0534 | .0386 | 1.381 | .167 |
H5型 | ATTGCGA公司 | .205 | .2125 | .0391 | 5.437 | <.00001 |
H6型 | TTAGCGA公司 | .0733 | .5219 | .0573 | 9.107 | <.00001 |
H7型 | AAAGCGA公司 | .0475 | .3152 | .066 | 4.778 | <.00001 |
H8型 | AAAGAGA公司 | .096 | .2044 | .0531 | 3.851 | .00012 |
其他b条 | … | .0496 | .1552 | .0725 | 2.142 | .0323 |
性别×ln(甘油三酯) | … | … | .4801 | .0418 | 11.487 | <.00001 |
性别×吸烟 | … | … | −.3583 | .0914 | −3.918 | .00009 |
表9
| 第15年的数据
| 第7年数据
|
模型一 | 解释的差异比例 | 从完整模型更改 | 解释的差异比例 | 从完整模型更改 |
完整模型 | .3757 | … | .3208 | … |
完整单倍型 | .3427 | .0330 | .3047 | .0161 |
全身指数(BMI) | .2637 | .1120 | .2187 | .1021 |
全速比赛 | .3760 | −.0003 | .3204 | .0003 |
完全性爱 | .3406 | .0351 | .2785 | .0423 |
全胰岛素 | .3721 | .0036 | .3174 | .0033 |
全-ln(甘油三酯) | .3554 | .0203 | .3057 | .0151 |
在相隔8年的时间点进行的高灵敏度BNII CRP测量使我们能够评估CRP基因型对CRP水平时间变化的潜在影响。总体而言,7至15岁受试者的ln(CRP)相关性为第页=0.60 (P(P)≪.001). 在8年的间隔期内,平均增加了0.33毫克/升,即11.6%。尽管BMI的变化和甘油三酯的变化与CRP水平的变化显著相关,但CRP单倍型和水平的变化之间没有显著关联(数据未显示)。
CRP基因型对人群CRP水平差异的贡献
EAs和AAs的中位CRP水平分别为1.0 mg/L和2.0 mg/L(P(P)<10-6通过t吨日志转换数据测试)。由于低水平CRP变异(H1)在EA中更为常见,而高水平变异(H6)在AA中更为普遍,我们评估了CRP基因型或其他已知预测因子在人群样本中解释AA和EA之间CRP水平变化的程度。为此,我们分析了一系列嵌套的多变量回归模型,这些模型可变地包括或排除了种族/民族、性别、BMI、甘油三酯、胰岛素水平、吸烟状态、CRP单倍型或tagSNP基因型等术语。非基因型协变量性别、甘油三酯、胰岛素水平和吸烟状况对种族间CRP水平的平均差异贡献相对较小,根据回归模型估计——ln(CRP)的差异水平=0.55±0.04未调整;经性别、甘油三酯、胰岛素水平和吸烟状态调整后为0.43±0.04。在回归模型中进一步增加BMI对ln(CRP)的影响更大水平=0.20±0.04,表明种族间CRP水平差异的一半以上归因于AA和EA之间的BMI差异。模型中添加CRP基因型导致种族系数的下降更大(例如ln(CRP)的平均差异水平=第15年为-0.04±0.05[])在这两个时间点,种族组之间不再存在统计上的显著差异(P(P)=.51 [];P(P)=.41 []).
CRP启动子分析硅胶材质
CRP基因座的人类和小鼠基因组序列的比较(Mayor等人。2000)显示了外显子的一个高度保守的启动子区域5′()其包含参与IL6诱导CRP的几个肝脏转录因子家族(HNF、C/EBP和NFKB)的应答元件(Li等人。1990). 两个SNP映射到该区域的5′边缘,即tagSNP 1440和一个与tagSNP7901421完全相关的SNP。转录因子-该区域的基序分析(TFSEARCH搜索; Heinemeyer等人。1998)确定了两个上游刺激因子1(USF1)-由SNP 1421和1440改变的结合基序(). 在CRP转录本或上游区域中仅预测了另外两个USF1结合基序,分别为1630和2650。
CRP启动子和预测的USF1位点。上面板,远景图(Mayor等人。2000)人类CRP基因座的小鼠同源性。CRP转录本和重复元件在图的顶部进行了注释(见左边的图例),第二外显子编码区的强烈进化保守性明显表现为带阴影的蓝色峰。一个推定的启动子区(75%保守)是可见的,从1444延伸到1650的粉红色峰;两个假定的功能多态性USF1位点(1421和1440)位于该区域的边缘。下面板,1421和1440的多态性单倍型,假定的USF1结合位点用大写字母表示。预测破坏USF1结合的等位基因显示为红色,预测保留USF1结合功能的等位蛋白显示为绿色。H1–H3代表祖先的单倍型,根据这些SNP的黑猩猩等位基因推断。LINE=长散布的核元素;LTR=长终端重复;SINE=短的散布的核元素。
体外基因报告检测
鉴于启动子区多态性与CRP水平之间的相关性,以及生物信息学启动子分析、体外试验用于探索CRP启动子多态性的变异。将五种独特的启动子区域单倍型中的每一种克隆到荧光素酶报告质粒中,用于体外分析。在没有IL6诱导的情况下,天然启动子结构中的启动子活性很弱(). 因此,我们还分析了每个启动子单倍型,用SV40 TSS取代了天然TSS,以在没有IL6诱导的情况下产生可检测信号(). 相对于H1–H3,IL6诱导的天然H7/H8构建体显示出升高的启动子活性()但不在SV40替换构造中()提示与H7/H8相关的CRP水平升高需要近端IL6应答元件。相比之下,在天然启动子中,没有证据表明IL6诱导的H5或H6启动子活性增加。
天然启动子构建体活性。将CRP启动子区域的短版本(相对于TSS,从−703到+1)和扩展版本(从−1186到+1)克隆到荧光素酶报告基因质粒中。瞬时转染数据显示,在未诱导和IL6诱导的环境中,每个构建体的转录水平都高于质粒缺失启动子的转录水平。阴影圆圈识别给定SNP的次要等位基因。无阴影圆圈识别出bp 1440处的一个三等位SNP变异体。误差线反映了20个重复实验中的SEM。根据H4中不包含在短克隆结构中的唯一1009 SNP,将H1–H4的短结构群分为两类长克隆。在IL6诱导的扩展构造中,t吨测试表明H4活性显著降低,而H7-H8活性显著增加(P(P)<.05),与诱导的短结构一致,其中t吨测试表明H1–H4活性显著降低,而H7–H8活性显著增加(P(P)<.05). 未经引导的活动显示出类似的趋势,但信号相对较弱。
SV40替换启动子构建活性。为了增加未诱导表达的水平,用SV40最小启动子替换CRP启动子近端(−107到+1)的IL6反应性负调控元件。瞬时转染数据显示,与SV40最小启动子相比,每个构建体的转录水平都有所增加。阴影圆圈识别给定SNP的次要等位基因。无阴影圆圈识别出bp 1440处的一个三等位SNP变异体。误差条反映SE测量值。在构造长度和诱导条件的每个组合中,t吨测试表明,单倍型之间的所有行为差异都是显著的(P(P)<.05),但IL6诱导的延长结构中H1–H3与H7–H8的情况除外。
在SV40替代结构中观察到显著更强的非诱导表达,并且在单倍型之间观察到显著差异(). 与人群研究中观察到的CRP基因型-表型关联一致,H6启动子显示出最高活性,与H5结构相关的启动子活性也显著增加。有趣的是,H5/H6和H1–H4 SV40替代启动子活性在IL6诱导和未诱导时的差异程度相似,这表明,尽管H5和H6启动子单倍型与升高的CRP水平相关,但这种相关性不是IL6依赖性的,而是,反映了基本启动子活性的变化。
讨论
为了确定人类CRP基因位点的常见遗传变异如何影响血浆CRP,我们采用了三阶段实验设计。在第一阶段,通过在多种族变异发现小组中重新测序该区域来定义整个基因区域的所有常见遗传变异,并在更大的临床表型样本小组中选择代表每个种族中所有常见模式的tagSNPs进行基因分型。选择了7个tagSNP进行基因分型,这些标记定义了8种常见的单倍型(). 在第二阶段,使用标准回归模型研究tagSNPs单倍型与CRP水平之间的相关性,并确定假定启动子区域中的几个SNPs的显著相关性。在第三阶段,通过体外人肝细胞CRP启动子分析实验验证观察到的相关性。
我们的大量人群样本的结果表明,根据相关CRP水平,CRP单倍型可分为四类:最低(H1)、低(H2–H4)、高(H5、H7和H8)和最高(H6)(). 这些结果在第7年和第15年之间是一致的。相对于第15年3.1毫克/升的协变量调整群体平均值,与最低水平(H1)相关的单倍型降低了血浆CRP,平均每拷贝1.5毫克/升,而与最高水平(H6)相关的单倍型增加了血浆CRP,每拷贝1.5毫克/升。
使用基于详细序列变异和LD数据定义的标签SNP的优点是,将观察到的单倍型关联映射到潜在的功能多态性(或其组合)可以很简单。例如,2667的同义SNP是在SNP发现样本中观察到的H1和H2之间的唯一差异。因此,这种多态性很可能直接影响CRP水平,这与以前的报告一致(Szalai等人。2002; Zee和Ridger2002; Brull等人。2003; Russell等人。2004),虽然直接作用的机制尚不清楚,但2667仍有可能是LD较强,远端调控元件的多态性不在多态性扫描区域内。同样,与低CRP水平相关的单倍型分支(H1–H4)和与高CRP水平有关的单倍体分支(H5–H8)之间唯一一致的差异似乎是三等位基因启动子SNP 1440的基因型(); 低分支与C等位基因有关,高分支与A或T等位基因相关。最后,五个SNP(tagSNP 790和未命名SNP 1123、1421、4741和6333)的罕见等位基因仅限于与最高CRP水平(H6)相关的单倍型,因此该单倍型的观察效果可能归因于这些SNP中的几个单倍型。
有趣的是,以表型和tagSNP基因型为自变量的逐步回归分析确定了功能重要的同一组tagSNPs,因为功能重要的单倍型与单个tagSNP-的罕见等位基因唯一相关。只有当其中一个没有tagSNP的单倍型(H2、H3或H7)对CRP有显著影响时,基于单倍型的分析才被证明是有利的。在这种情况下,单倍型分析甚至可以被认为是一个缺点,因为需要努力将观察到的单倍型效应映射到特定的tagSNP,而直接的tagSNP分析可以立即识别关键的tagSNP。单倍型分析可能在重组历史更复杂的基因中或在单倍型标记SNP尚未被全面描述的情况下更有效,但我们的示例表明,基于单倍型的分析并不一定优于直接的tagSNP分析。
为了解决上游区域SNP在CRP基因调控中的功能重要性的可能性,将最小启动子区域(相对于TSS,为−703到+1)和(−1186到+1)扩展启动子区域的单倍型克隆到荧光素酶报告质粒中,以进行启动子活性分析。CRP区域中的一些tagSNP单倍型在启动子区域(例如H1–H3)中没有差异,因此单个启动子结构代表这些单倍型。在培养的人肝癌细胞中评估了五种独特启动子单倍型中每一种的相对基础表达和IL6诱导表达。自然CRP启动子的基础表达水平没有明显的趋势,因为基础表达相当弱(). 然而,IL6诱导的H7/H8结构(由1440 A等位基因标记)启动子活性略高于所有其他单倍型结构(P(P)<.05[未修正多次试验])。这些结果与在人群数据中观察到的与H7/H8相关的较高CRP水平一致。与基础CRP水平相比,IL6诱导的活动是急性期反应期间CRP水平的更好模型。然而,随着时间的推移,我们没有观察到H7/H8对CRP水平变化的任何明显影响。
CRP启动子的弱组成活性似乎是由于位于近端启动子区域的负调控元件所致(Li等人。1990). 因此,我们进行了额外的实验,用SV40最小启动子替换TSS附近的107 bp(包括CRP启动子区域内的近端IL6应答元件)。正如预期的那样,SV40替换启动子结构显示出显著更高的活性(). 对于一些单倍型比较,有可能将功能差异分配给单个SNP,因为结构只在一个SNP上不同。例如,H5和H1–H3结构之间观察到的显著差异()完全归因于SNP1440的等位基因(C vs.T),这是这些结构之间唯一的序列差异。同样,H4和H1–H3结构之间的显著差异完全归因于SNP 1009。因此,我们在人群样本中观察到H4的CRP水平有略微显著升高的趋势()可能真正代表H4-相关SNP 1009的功能效应,如其他地方所建议的(Wolford等人。2003). 在H6和H5构建体之间观察到的显著差异可能归因于几个多态位点中的任何一个,但来自较短SV40替换构建体的数据表明,这种差异可归因于1123或1421().
特别令人感兴趣的是,短替换启动子结构显示出显著不同的转录活性,其仅基于三等位SNP 1440位点的等位基因。之前的报告显示,CRP水平升高与SNP 3014相关,SNP 301仅限于欧洲人的H5(Brull等人。2003; Russell等人。2004),可能反映LD与功能性1440T等位基因,尽管3014多态性除了在1440显示的功能性变化外,还可能具有功能性,因为它位于3′UTR中,可能影响RNA结构或周转。
与H5和H6结果相反,体外试验有力地支持了这样一个假设,即观察到的这些单倍型之间的关联主要归因于启动子区域内的功能多态性,而H7和H8的体外结果最多只能为观察到的关联提供弱支持。这可能反映了几种可能性之一:1440A等位基因可能确实与1440C等位基因在功能上不同,但在所分析的条件下并非如此。也就是说,除了IL6外,已知IL1B和肿瘤坏死因子α可以调节CRP,H7和H8对这些或其他as-yet-unidentified信号的反应可能不同,但在基础活性分析或IL6诱导下则不同。或者,这些单倍型的关联可能是一个多态性的结果,该多态性与1440A等位基因具有较强的LD,但不在启动子活性检测区域内。奇怪的是,只有四个SNP等位基因限制在H7和H8上:969C、1440A、6192A和6469G。前两个SNP位于长克隆的分析启动子区域内,而后两个SNP>2000 bp,超过转录物的多聚腺苷酸化位点,并且似乎不位于可能暗示远端调控元件的强进化保守区域。因此,目前我们还没有在启动子区域外发现一个好的候选SNP来解释H7和H8活性升高的原因。
这些实验结果支持这样一种假设,即在CARDIA队列中观察到的CRP单倍型-表型关联至少部分归因于启动子位点1421和1440的功能改变,每个启动子位点也被预测会改变转录因子USF1的结合基序。启动子区USF1位点的聚类()提示USF1可能在CRP基因的调控中起重要作用。鉴于最近的出版物强调USF1作为葡萄糖和脂质代谢基因调节器的潜在重要性,与H5–H8相关的启动子活性增加特别有趣(Pajukata等人。2004).
非洲地区人群的平均CRP水平高于欧洲地区人群(Wener等人。2000)尽管各民族之间的水平范围存在广泛重叠。由于各种医疗、社会、行为和经济原因,美国自我报告的种族也与心血管疾病和代谢性疾病的发病率和死亡率差异有关(沃特金斯2004). 因此,种族间差异的遗传部分似乎归因于三个CRP SNP(790、1440和2667)的频率差异,其中与低CRP水平(790A、1440C和2667C)相关的等位基因在EA中的频率高于AA。这些结果证实了最近的观察结果,即肥胖等代谢因素在与种族/民族相关的CRP水平变化中占很大比例(Albert等人。2004; Anand等人。2004)并表明,与年轻人种族/民族相关的CRP水平的大多数剩余变异是由CRP基因座内的遗传变异引起的。
目前尚不清楚CRP是炎症过程的风险标志物还是与CVD的发病机制有关。本文所述的CRP基因型和血浆CRP水平之间的密切联系并不能直接解决这个问题,但可能有助于检验CRP水平在CVD发病机制中起因果作用的假设。功能性CRP启动子变异体似乎独立于其他CRP相关物(尤其是BMI)改变CRP水平,并且随着时间的推移在个体中持续改变。因此,我们预计,如果CRP与疾病发病机制有关,那么与高CRP水平相关的等位基因应与更大的CVD风险相关。目前,CARDIA队列的平均年龄为42岁,因此CVD事件的发生数量尚不足以验证这一假设。然而,评估动脉粥样硬化疾病进展或临床心血管事件(如心肌梗死)发生的大型、多民族老年人研究可以用来解决这一重要问题。此类研究目前正在进行中。常用的降胆固醇药物,如他汀类药物和PPARα激活剂,还可以通过抗炎作用降低心血管风险,包括降低组成性和诱导性CRP基因表达(Kleemann等人。2004; Ridker等人。2005). 因此,进一步表征共同的影响和相互作用顺式-作用于CRP基因转录调控的核苷酸替代可能对心血管、代谢和相关炎症疾病的治疗和预防具有广泛意义。
在证明中添加注释。-Szalai等人的一项独立研究证实了1440和1421启动子SNP与基础CRP水平之间的功能关联(正在印刷中).
致谢
这项工作得到了NHLBI的炎症基因组学和动脉粥样硬化预防辅助CARDIA拨款HL71017(给D.S.)、CARDIA合同N01-HC-95095、N01-HC-48047、N01-HC-48048、N01--HC-48049、N01-HF-48050、N01-HC-45134和N01-HC-05187的支持,以及NHLBI基因组应用计划拨款HL66682和HL66642(给D.N.和M.R.)。
工具书类
Abernathy TJ,Avery OT(1941)急性感染期间血液中通常不存在的蛋白质的发生。I.患者血清中反应蛋白的分布以及钙对肺炎球菌C-多糖絮凝反应的影响。实验医学杂志73:173–182[PMC免费文章][公共医学][谷歌学者] Albert MA、Glynn RJ、Buring J、Ridker PM(2004)美国不同种族女性的C反应蛋白水平(摘自《女性健康研究》)。美国心脏病杂志93:1238–1242[公共医学][谷歌学者] Anand SS、Razak F、Yi Q、Davis B、Jacobs R、Vuksan V、Lonn E、Teo K、McQueen M、Yusuf S(2004)C反应蛋白作为多民族人群心血管风险筛查试验。动脉硬化血栓血管生物学24:1509–1515[公共医学][谷歌学者] Brull DJ、Serrano N、Zito F、Jones L、Montgomery HE、Rumley A、Sharma P、Lowe GD、World MJ、Humphries SE、Hingorani AD(2003)人类CRP基因多态性影响CRP水平:对冠心病预测和发病机制的影响。动脉硬化血栓血管生物学23:2063–2069[公共医学][谷歌学者] Carlson CS、Eberle MA、Rieder MJ、Yi Q、Kruglyak L、Nickerson DA(2004)使用连锁不平衡选择一组信息量最大的单核苷酸多态性进行关联分析。美国人类遗传学杂志74:106–120[PMC免费文章][公共医学][谷歌学者] Danesh J、Wheeler JG、Hirschfield GM、Eda S、Eiriksdottir G、Rumley A、Lowe GD、Pepys MB、Gudnason V(2004)C反应蛋白和其他循环炎症标志物预测冠心病。《英国医学杂志》350:1387–1397[公共医学][谷歌学者] Danesh J、Whincup P、Walker M、Lennon L、Thomson A、Appleby P、Gallimore JR、Pepys MB(2000)《低度炎症和冠心病:前瞻性研究和最新荟萃分析》。英国医学杂志321:199-204[PMC免费文章][公共医学][谷歌学者] Friedman GD、Cutter GR、Donahue RP、Hughes GH、Hulley SB、Jacobs DR Jr、Liu K、Savage PJ(1988)《心脏病:研究设计、招募和受试者的一些特征》。临床流行病学杂志41:1105–1116[公共医学][谷歌学者] Hackam DG,Anand SS(2003)动脉粥样硬化性血管疾病的新风险因素:证据的批判性审查。JAMA杂志290:932–940[公共医学][谷歌学者] Hastie T、Tibshirani R、Friedman J(2001)《统计学习的要素:数据挖掘、推理和预测》。纽约施普林格-弗拉格[谷歌学者] Heinemeyer T、Wingender E、Reuter I、Hermjakob H、Kel AE、Kel OV、Ignatieva EV、Ananko EA、Podkolodnaya OA、Kolpakov FA、Podkolodny NL、Kolchanov NA(1998)转录调控数据库:TRANSFAC、TRRD和COMPEL。核酸研究26:362–367[PMC免费文章][公共医学][谷歌学者] Hughes GH、Cutter G、Donahue R、Friedman GD、Hulley S、Hunkeler E、Jacobs DR Jr、Liu K、Orden S、Pirie P、Tucker B、Wagenknecht L(1987)《年轻人冠状动脉疾病风险发展(CARDIA)研究中的招募》。对照临床试验8:68S–73S[公共医学][谷歌学者] Kleemann R,Verschuren L,de Rooij BJ,Lindeman J,de Maat MM,Szalai AJ,Princen HM,Kooistra T(2004)他汀类药物和PPARα激活剂在体内和体外培养的人肝细胞中抗炎活性的证据。血液103:4188–4194[公共医学][谷歌学者] Kovacs A、Green F、Hansson LO、Lundman P、Samnegard A、Boquist S、Ericsson CG、Watkins H、Hamsten A、Tornvall P(2005)C反应蛋白基因启动子区与C反应蛋白血浆浓度相关的一种新的常见单核苷酸多态性。动脉粥样硬化178:193–198[公共医学][谷歌学者] Lake SL,Lyon H,Tantisira K,Silverman EK,Weiss ST,Laird NM,Schaid DJ(2003),连锁阶段不明确时单倍型与环境相互作用的估计和测试。哼,这里55:56–65[公共医学][谷歌学者] Li SP、Liu TY、Goldman ND(1990)顺式-白细胞介素-6诱导的C反应蛋白基因表达的作用元件。生物化学杂志265:4136–4142[公共医学][谷歌学者] MacGregor AJ、Gallimore JR、Spector TD、Pepys MB(2004)C反应蛋白和血清淀粉样蛋白A基线值的遗传效应:单卵双胞胎和双卵双胞胎的比较。临床化学50:130–134[公共医学][谷歌学者] Mayor C、Brudno M、Schwartz JR、Poliakov A、Rubin EM、Frazer KA、Pachter LS、Dubchak I(2000)VISTA:可视化任意长度的全球DNA序列比对。生物信息学16:1046–1047[公共医学][谷歌学者] Pajukanta P、Lilja HE、Sinsheimer JS、Cantor RM、Lusis AJ、Gentile M、Duan XJ、Soro-Paavonen A、Naukkarin J、Saarela J、Laakso M、Ehnholm C、Taskinen MR、Peltonen L(2004)家族性复合型高脂血症与上游转录因子1相关(USF1)。《自然遗传学》36:371–376[公共医学][谷歌学者] Pankow JS、Folsom AR、Cushman M、Borecki IB、Hopkins PN、Eckfeldt JH、Tracy RP(2001)全身炎症标记物的家族和遗传决定因素:NHLBI家族心脏研究。动脉粥样硬化154:681–689[公共医学][谷歌学者] Pearson TA、Mensah GA、Alexander RW、Anderson JL、Cannon RO 3rd、Criqui M、Fadl YY、Fortmann SP、Hong Y、Myers GL、Rifai N、Smith SC Jr、Taubert K、Tracy RP、Vinicor F(2003)炎症和心血管疾病的标志物:临床和公共卫生实践的应用:来自疾病控制和预防中心和美国心脏协会的医疗专业人员的声明。循环107:499–511[公共医学][谷歌学者] Retterstol L,Eikvar L,Berg K(2003)C反应蛋白与其他冠心病危险因素的对比研究。动脉粥样硬化169:279–282[公共医学][谷歌学者] Ridger PM、Cannon CP、Morrow D、Rifai N、Rose LM、McCabe CH、Pfeffer MA、Braunwald E(2005)C反应蛋白水平和他汀类药物治疗后的结果。《新英格兰医学杂志》352:20–28[公共医学][谷歌学者] Ridger PM、Cushman M、Stampfer MJ、Tracy RP、Hennekens CH(1997),表面健康男性的炎症、阿司匹林和心血管疾病风险。英国医学杂志336:973–979[公共医学][谷歌学者] Ridger PM、Hennekens CH、Buring JE、Rifai N(2000)C反应蛋白和其他炎症标记物在预测女性心血管疾病中的作用。《新英格兰医学杂志》342:836–843[公共医学][谷歌学者] Russell AI、Cunninghame Graham DS、Shepherd C、Roberton CA、Whittaker J、Meeks J、Powell RJ、Isenberg DA、Walport MJ、Vyse TJ(2004)C反应蛋白位点的多态性影响基因表达和系统性红斑狼疮的易感性。人类分子遗传学13:137–147[PMC免费文章][公共医学][谷歌学者] Shine B,de Beer FC,Pepys MB(1981),人类C反应蛋白的固相放射免疫分析。《临床医学杂志》117:13–23[公共医学][谷歌学者] Stephens M,Donnelly P(2003)从人群基因型数据重建单倍型的贝叶斯方法比较。《美国人类遗传学杂志》73:1162–1169[PMC免费文章][公共医学][谷歌学者] Stephens M,Smith NJ,Donnelly P(2001)从人口数据重建单倍型的新统计方法。美国人类遗传学杂志68:978–989[PMC免费文章][公共医学][谷歌学者] Suk HJ,Ridker PM,Cook NR,Zee RY(2005)C反应蛋白基因多态性与血浆CRP水平的关系。动脉粥样硬化178:139–145[公共医学][谷歌学者] Szalai AJ、McCorry MA、Cooper GS、Wu J、Kimberly RP(2002)C反应蛋白(CRP)基线水平与CRP基因内含子二核苷酸重复多态性之间的关联。基因免疫3:14–19[公共医学][谷歌学者] Szalai AJ、Wu J、Lange EM、McCorry MA、Langefeld CD、Williams A、Zakharkin SO、George V、Allison DB、Cooper GS、Xie F、Fan Z、Edberg JC、Kimberly RP。影响转录因子结合、改变转录活性的C反应蛋白基因启动子中的单核苷酸多态性,与基线血清CRP水平的差异相关。分子医学杂志(出版中)[公共医学][谷歌学者] Tillet W,Francis T(1930)肺炎与肺炎球菌非蛋白体细胞部分的血清学反应。实验医学杂志52:561–571[PMC免费文章][公共医学][谷歌学者] Watkins LO(2004)《非裔美国人冠心病透视》。心血管医学评论(增刊3)5:S3–S13[公共医学][谷歌学者] Wener MH、Daum PR、McQuillan GM(2000)年龄、性别和种族对血清C反应蛋白浓度参考上限的影响。风湿病杂志27:2351–2359[公共医学][谷歌学者] Wolford JK、Gruber JD、Ossowski VM、Vozarova B、Antonio Tataranni P、Bogardus C、Hanson RL(2003)C反应蛋白启动子多态性与Pima印第安人的2型糖尿病相关。分子遗传学Metab 78:136–144[公共医学][谷歌学者] Zee RY,Ridker PM(2002)人类C反应蛋白(CRP)基因多态性、血浆CRP浓度和未来动脉血栓风险。动脉粥样硬化162:217–219[公共医学][谷歌学者]