跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
人类基因组学。2006; 2(5): 287–296.
2006年3月1日在线发布。 数字对象标识:10.1186/1479-7364-2-5-287
预防性维修识别码:PMC3500178
PMID:16595073

乳腺组织中致癌相关基因的功能性nsSNPs:潜在乳腺癌风险等位基因及其在人群中的分布

摘要

虽然高度渗透的等位基因巴西航空公司1巴西航空公司2已经证明易患乳腺癌,大多数乳腺癌病例被认为是由低中度渗透性等位基因和环境致癌物的存在引起的。非同义单核苷酸多态性(nsSNP)被假设为与疾病易感性有关,其中约30%被预测具有生物学意义。在这项研究中,我们应用了一种基于生物信息学的策略,从乳腺组织中表达的981个致癌相关基因中识别出乳腺癌相关的nsSNP。我们的结果显示,共有367个经验证的nsSNP,其中109个(29.7%)预计会影响蛋白质功能(功能性nsSNP),这表明这些nsSNP可能会影响乳腺组织的发育和体内平衡,从而导致乳腺癌的易感性。67个功能性nsSNPs表现为常见的nsSNPs(次要等位基因频率≥5%),代表了乳腺癌易感性的优秀候选者。此外,在不同人群中观察到常见功能性nsSNP的分布不均匀:据报告,所有分析人群中都存在15个nsSNP,而另一组15个nssnP是特定人群特有的。我们认为,本研究中分析的nsSNP是乳腺癌易感性潜在遗传因素的独特来源。此外,功能性nsSNP等位基因频率在主要人群背景中的差异可能表明不同人群乳腺癌易感性和治疗反应的分子基础存在潜在差异。

关键词:乳腺癌易感性、nsSNP、乳腺组织表达、致癌相关基因、PolyPhen

介绍

的突变巴西航空公司1[1]和巴西航空公司2[2]给携带者带来高乳腺癌风险。这种高渗透性突变只占所有乳腺癌病例的一小部分(约5-10%)[,4]然而,这表明在其他乳腺癌易感基因中存在其他尚未确定的突变[5-7]. 一些基因的突变,例如第53页,[8]自动取款机[6]和契克2,[9]研究还表明,在极少数乳腺癌病例中,有助于增加患乳腺癌的风险。到目前为止,还没有发现其他高渗透性乳腺癌易感基因;然而,包括单核苷酸多态性(SNPs)在内的遗传变异被认为是低-中度渗透性等位基因,与乳腺癌以及其他复杂疾病有关[7,10-12].

蛋白质序列和功能的变化主要是由于SNPs(nsSNPs)的非同义形式。基因组中nsSNP的比例相对较低(约占所有编码SNP的10%)[13]与其他类型相比,它们更有可能改变蛋白质的结构、功能和相互作用,从而构成一组与疾病易感性相关的候选遗传因素[14,15]. 预计大约30%的nsSNP具有生物后果[16-18]. 蛋白质中的几个nsSNP作用于多种细胞途径,如凋亡、[19]氧化应激[20]和信号转导[21]--已经有报道称与乳腺癌风险增加/降低有关。

一些研究描述了与癌症相关的nsSNP;[22-25]然而,据我们所知,它们还没有在特定组织中基因表达的背景下进行研究。显然,为了使基因与组织疾病相关,其蛋白产物应以某种方式影响特定组织,如外源蛋白质(如激素)或内源性蛋白质(如该组织中表达的蛋白质)[26,27]. 在这项研究中,我们应用了一种基于生物信息学的策略,从乳腺组织中表达的内源性致癌相关蛋白中鉴定出潜在的功能性nsSNP。

方法

基因

合奏成绩单标识符(网址:http://www.ensembl.org/)[28]从TissueInfo数据库(db)检索乳腺组织中表达的基因(http://icb.med.cornell.edu/services/tissueinfo/query) [29]. 来自18个不同类别的致癌相关基因列表(“DNA加合物”、“DNA损伤”、“DNA复制”、“血管生成”、“凋亡”、“行为”、“细胞周期”、“信号传导”、“发育”、“基因调控”、“转录”、“免疫学”、“代谢”、“转移”、“药理学”、“讯号转导”、“抑癌基因/癌基因”和“其他”)检索自美国国家癌症研究所癌症基因组解剖学项目基因注释倡议([CGAP-GAI]网站[http://lpgws.nci.nih.gov/html-cgap/cgl/]) [30]. 然后,从TissueInfo和CGAP-GAI资源中检索到的基因相互参照,以确定乳腺组织中表达的致癌相关基因组。

非标准SNP

从dbSNP构建120中检索乳腺组织中表达的致癌相关基因组的nsSNP(http://www.ncbi.nlm.nih.gov/SNP/) [31]. 本研究仅包括在≥40条染色体的样本组中检测到的≥2条染色体上的nsSNP(经验证的nsSNPs)。在不同样本集中分析的染色体中,发现17个nsSNP,分别位于5%和5%以上;为了简单起见,在本文中,我们将此类nsSNP分类在次要等位基因频率≥5%的nsSNP集合中。

PolyPhen分析

PolyPhen预测[18]从预先计算的dbSNP-PolyPhen资源中检索。所有的PolyPhen预测都是基于至少五种相似蛋白质的比对(为了更可靠的预测)或结构参数。

结果

表中总结了本研究的结果表11通过PolyPhen预测工具进行可靠预测,仅构成经验证的nsSNP(见方法)。共有367个nsSNP来自189个乳腺组织中表达的致癌相关基因。据预测,来自75个基因的109个nsSNP(28.4%)可能会影响蛋白质功能(功能性nsSNP)。此外,61.5%(n个=67)潜在功能性nsSNP代表人群中常见的nsSNP(≥5%的次要等位基因频率;表表2)。2). 本文主要讨论了常见的功能性nsSNP;然而,很少出现的功能性nsSNP列表也可以在补充表中找到(http://www.ozceliklab.com/Breast_rare_nsSNPs/).

表1

结果总结。

n个
基因

致癌相关基因2,832

  在乳腺组织中表达981

   使用经验证的nsSNP189

   具有功能性nsSNP75

非标准SNP

已验证的nsSNP367

  PolyPhen的Benign258

  PolyPhen的功能109

   次要等位基因频率≥5%67

   次要等位基因频率<5%42

缩写:n个=数量;nsSNP=非同义形式的单核苷酸多态性。请注意,本表中仅显示了可靠PolyPhen预测(基于比对中≥5个蛋白质)的基因和nsSNP。

表2

乳腺组织表达致癌相关基因的功能性和常见非同义形式单核苷酸多态性(nsSNP)。

基因加入
SNP IDb条氨基酸
改变c(c)
密码子d日破坏性的
等位基因
破坏性的
氨基酸e(电子)
PolyPhen公司
预测
通路(f)
ACY1型NM_000666.1号2229152卢比R386C(兰特)c(c)gt公司/t吨gt公司t吨C类可能会造成破坏感应电动机

添加1NM_014189.2号rs4961型G460瓦gg(希腊)/t吨gg(希腊)t吨W公司可能会造成破坏感应电动机

添加1NM_014189.2号4962卢比N541I号吨/年t吨t吨t吨可能会造成破坏感应电动机

添加1NM_014189.2号4971卢比Y270N型t吨在/N个可能会造成破坏感应电动机

ADM公司NM_001124.1号5005卢比S50R系列c(c)/银R(右)可能会损坏AN公司

美国存托凭证2纳米_000024.31042713卢比G16R系列加仑/加仑R(右)可能会损坏比利时,IM

ALDH2型NM_000690.2rs671码E504K型aa公司/aa公司K(K)可能会损坏IM、PH

APOE公司纳米_000041.1429358卢比130卢比t吨气相色谱法/c(c)气相色谱法c(c)R(右)可能会造成破坏感应电动机

AXIN2型NM_004655.1号2240308卢比第50S页c(c)电流互感器/t吨计算机断层扫描t吨S公司可能具有破坏性判定元件

指挥与控制NM_000063.3号4151648卢比R734C型c(c)气相色谱法/t吨气相色谱法t吨C类可能会损坏感应电动机

CD2(CD2)NM_001767.2号699738卢比H266Q型加利福尼亚州c(c)/加利福尼亚州可能会造成破坏AN、IM、MET

CDH12型NM_004061.2rs4371716V68万热失重/热重(tg)V(V)可能会造成破坏感应电动机

CHGA公司NM_001275.2号729940卢比399瓦c(c)gg(希腊)/t吨gg(希腊)t吨W公司可能会造成破坏感应电动机

CHGA公司纳米_001275.29658667卢比G382S公司气相色谱法/气相色谱法S公司可能会损坏感应电动机

CLU公司NM_001831.1号9331936卢比N317H型交流/c(c)交流电c(c)H(H)可能会损坏感应电动机

CSF1型NM_000757.3号2229165卢比G438R型gg(希腊)/gg(希腊)R(右)可能具有破坏性感应电动机

CSF3R公司NM_000760.2号3917973卢比M231吨t吨克/年c(c)c(c)T型可能会造成破坏感应电动机

CSF3R公司NM_000760.2号3917974卢比第346季度c(c)克/立方厘米R(右)可能会损坏感应电动机

CSF3R公司NM_000760.2号3917991卢比D510H型交流/c(c)交流电c(c)H(H)可能会损坏感应电动机

CYBA公司NM_000101.1号4673卢比Y72H型t吨交流/c(c)交流电c(c)H(H)可能会损坏感应电动机

塞浦路斯11B1NM_000497.2号4541卢比A386伏c(c)克/克t吨c(c)A类可能具有破坏性酸碱度

塞浦路斯11B1NM_000497.2号5287卢比M160I型/在c(c)c(c)可能会损坏酸碱度

塞浦路斯11B1NM_000497.2号5294卢比Y439H型t吨交流/c(c)交流电t吨Y(Y)可能具有破坏性酸碱度

塞浦路斯11B1NM_000497.2号5312卢比E383伏克/克t吨t吨V(V)可能会造成破坏酸碱度

CYP1B1型纳米_000104.21800440卢比N453S型信用证c(c)S公司可能会损坏IM、PH

CYP2A6系列NM_000762.4号1801272卢比长160Hc(c)t吨信用证c(c)H(H)可能会造成破坏IM、PH

塞浦路斯2B6NM_000767.3号2279343卢比K262R公路克/年K(K)可能会损坏酸碱度

CYP2C9公司NM_000771.2号1799853卢比R144C合金c(c)gt公司/t吨gt公司t吨C类可能会造成破坏IM、PH

DAG1号机组NM_004393.1号rs2131107S14瓦t吨c(c)克/吨c(c)S公司可能会造成破坏感应电动机

电子工程师NM_000118.1号1800956卢比D366小时交流/c(c)交流电c(c)H(H)可能具有破坏性AN、DE、IM、MET

EPHX1型NM_000120.2号1051740卢比Y113小时t吨交流/c(c)交流电c(c)H(H)可能会损坏我,我,PH

ERBB2号机组NM_004448.1号1058808卢比P1170A页c(c)抄送/复写的副本A类可能会损坏IM、ST、TS/ON

第二层NM_001992.2号2230849卢比187N日元t吨交流/交流电N个可能会造成破坏感应电动机

FPR1系列NM_002029.3号867228卢比E346A型克/克c(c)c(c)A类可能会损坏感应电动机

FUCA2公司NM_032020.3号rs3762001号h371年c(c)在/t吨t吨Y(Y)可能会损坏感应电动机

公认会计准则NM_000152.2号1800307卢比G576S型气相色谱法/气相色谱法S公司可能会损坏感应电动机

1英镑NM_002053.1号1048425卢比T349S型c(c)信用证c(c)S公司可能会损坏反恐精英

GYS1型NM_002103.3号5453卢比P691A页c(c)加利福尼亚州/加利福尼亚州A类可能会造成破坏感应电动机

GYS1公司NM_002103.3号rs5456K130E型银/E类可能会损坏感应电动机

GYS1公司NM_002103.3号5461卢比N283S气体吨/年t吨S公司可能会损坏感应电动机

香港2号NM_000189.4号2229629卢比844K兰特克/年R(右)可能会损坏IM、MIS

图4NM_002312.2号1805388卢比T9I型c(c)吨/年t吨t吨t吨可能会损坏达,日

MC1R(最大持续功率)NM_002386.2号1805005卢比V60升热失重/t吨热重(tg)t吨L(左)可能会损坏感应电动机

MC1R(最大持续功率)NM_002386.2号1805007卢比151C兰特c(c)气相色谱法/t吨气相色谱法t吨C类可能会造成破坏感应电动机

MC1R(最大持续功率)NM_002386.2号3212366卢比1996年1月t吨总胆固醇/c(c)总胆固醇c(c)L(左)可能会造成破坏感应电动机

基质金属蛋白酶9NM_004994.1号2250889卢比574P兰特c(c)克/立方厘米c(c)R(右)可能会损坏安,我

基质金属蛋白酶9NM_004994.1号3918252卢比127K奈特aa公司c(c)/aa公司K(K)可能会造成破坏AN、IM

MNDA公司NM_002432.1号2276403卢比H357Y型c(c)交流/t吨交流电t吨Y(Y)可能会损坏希腊、土耳其

粘液4NM_004532.2号2259292卢比G88D型c/g(立方厘米)c(c)G公司可能会损坏感应电动机

NFATC1NM_006162.3号rs754093型C751G型t吨gt公司/gt公司G公司可能会造成破坏感应电动机

槽口4NM_004557.2号2071282卢比第203页c(c)c(c)信用证t吨c(c)t吨L(左)可能会造成破坏IM、TS/ON

前列腺素M3纳米_015599.1473267卢比D466牛顿在/N个可能会损坏感应电动机

PLAU公司NM_002658.12227564卢比141便士c(c)t吨克/立方厘米c(c)t吨L(左)可能会损坏AN公司

普劳尔NM_002659.1号4760卢比L317P型c(c)t吨信用证c(c)c(c)c(c)P(P)可能会损坏AN公司

PTGS2型NM_000963.1号5272卢比E488G型克/克G公司可能会造成破坏IM、MIS

PTPN3号机组NM_002829.2号3793524卢比A90P型抄送/c(c)复写的副本A类可能会造成破坏CC、CS

SLC1A5型纳米_005628.13027956卢比第17A页c(c)抄送/复写的副本A类可能会损坏感应电动机

STAT2(状态2)NM_005419.2号2066816卢比Q66H问题加利福尼亚州/加利福尼亚州t吨t吨H(H)可能会损坏IM、ST

TBXAS1型纳米_001061.25760卢比G390伏c/g(立方厘米)t吨c(c)t吨V(V)可能会造成破坏感应电动机

TBXAS1型NM_001061.2号rs5762型R425C型c(c)气相色谱法/t吨气相色谱法t吨C类可能会造成破坏感应电动机

TBXAS1型NM_001061.2号5770卢比R261G型gg(希腊)/gg(希腊)G公司可能会造成破坏感应电动机

TDG公司NM_003211.2号4135113卢比G199S系列气相色谱法/气相色谱法S公司可能会损坏尽职调查

TUBA1号机组NM_006000.1号3731891卢比243C兰特c(c)气相色谱法/t吨气相色谱法t吨C类可能会造成破坏碳钢、金属

泰尔(TYR)NM_000372.2号1042602卢比192年t吨c(c)吨/吨t吨Y(Y)可能会损坏

VCAM1公司NM_001078.2号3783613卢比G413A型吨/克c(c)t吨c(c)A类可能会损坏AN、CS、IM、MET

XRCC1公司NM_006297.1号25489卢比280小时c(c)吨/年t吨H(H)可能会损坏DD、DR、IM

XRCC1公司NM_006297.1号1799782卢比194瓦c(c)gg(希腊)/t吨gg(希腊)t吨W公司可能会造成破坏DD、DR、IM

缩写:AN=血管生成;BE=行为,CC=细胞周期;CS=细胞信号;DA=DNA加合物;DD=DNA损伤;DE=开发;GR=基因调控;IM=免疫学;ME=代谢;

MET=转移;MIS=其他;PH=药理学;ST=信号转导;TS/ON=抑癌基因;TR=转录。

所有nsSNP的次要等位基因频率均≥5%。

基因符号由HUGO基因命名委员会批准[67].

b条SNP标识符(ID)对应于dbSNP ID(http://www.ncbi.nlm.nih.gov/SNP网站/) [31].

c(c)指出了氨基酸替代的位置以及由主要和次要SNP等位基因指定的氨基酸。

d日显示了由主要和次要SNP等位基因指定的密码子。核苷酸变化以下划线表示。

e(电子)PolyPhen预测会影响蛋白质功能的氨基酸的一个字母编码。

(f)癌症基因组解剖学项目遗传注释倡议网站显示了这些蛋白质所涉及的途径(http://lpgws.nci.nih.gov/html-cgap/cgl/) [30].

含有常见功能性nsSNP的基因的一部分蛋白产物被发现与CGAP-GAI编译的一个或多个致癌相关生物途径有关[30](表(表2)。2). 这种nsSNP主要存在于DNA修复蛋白中(三个基因,四个nsSNP);转移(四个基因,四个nsSNP);血管生成(7个基因,8个nsSNPs);药理学(7个基因,10个nsSNP);和免疫学(38个基因,51个nsSNP)。

我们还分析了常见功能性nsSNP在人群中的分布。为了简单起见,我们将从不同dbSNP条目中获得的频率信息分为三大类:非洲(非洲和非洲-美国)、高加索(高加索和欧洲)和亚洲(中国和东亚)人口。在67种常见的功能性nsSNP中,至少有30种不同人群中存在nsSNP的次要等位基因频率(表(表3)。). 在所有分析的人群中发现了15个nsSNP(n个≥ 3). 在其余15个nsSNPs的情况下,5个仅在一个群体中发现(非洲人的ADM-S50R和MMP9-N127K;亚洲人的ALDH2-E504K和MNDA-H357Y;高加索人的MC1R-R151C)。此外,在高加索人、亚洲人或西班牙裔样本中发现了三个nsSNP,但在非洲样本中没有发现(CHGA-G382S、CYP1B1-N453S和CYP2C9-R144C)。此外,在5个nsSNP的情况下,所分析的群体之间的主要和次要等位基因不同(ADBR2-G16R、CDH12-V68M、ERBB2-P1170A、PGM3-D466N和SLC1A5-P17A)。

表3

功能性和常见非同义形式的单核苷酸多态性(nsSNP),具有不同人群的频率信息。

基因SNP IDb条氨基酸变化c(c)非洲的亚洲的高加索人西班牙裔
添加14961卢比G460瓦46铬。G=0.891 T=0.10948 chr。G=0.521 T=0.47948 chr。G=0.833 T=0.167不适用

ADM公司5005卢比S50R系列46铬。C=0.957克=0.04348 chr。C=1.00048 chr。C=1.000不适用

美国存托凭证21042713卢比G16R系列46铬。G=0.609 A=0.39148 chr。A=0.583 G=0.41746铬。G=0.674 A=0.326不适用

ALDH2型rs671码E504K型48 chr。G=1.00048 0克=0.771安=0.22958克。G=1.00044铬。G=1.000

CDH12型rs4371716V68万46铬。温度=0.674摄氏度=0.32648 chr。C=0.812 T=0.18848 chr。C=0.729 T=0.271不适用

CHGA公司729940卢比399瓦114铬。C=0.954 T=0.04688铬。C=0.715 T=0.285104 chr。C=0.893 T=0.10756铬。C=0.769 T=0.231

CHGA公司9658667卢比G382S公司114铬。G=1.00088铬。G=0.982 A=0.018104 chr。G=0.951 A=0.04956克。G=0.941 A=0.059

CSF3R公司3917973卢比M231吨48 chr。温度=0.938摄氏度=0.06248小时。T=1.00058铬。温度=0.983摄氏度=0.01746铬。T=1.000

CSF3R公司3917991卢比D510H型48 chr。G=0.750 C=0.25048 chr。G=1.00058铬。G=1.00046铬。G=0.935 C=0.065

CYBA公司4673卢比Y72H型48 chr。C=0.542 T=0.4581480铬。G=0.907 A=0.09360 chr。C=0.683 T=0.31746铬。C=0.783 T=0.217

CYP1B1型1800440卢比N453S型48 chr。A=1.00048小时。A=0.958 G=0.04262 chr。A=0.806 G=0.19446铬。A=0.761 G=0.239

CYP2A6系列rs1801272长160H46铬。T=1.00046铬。T=1.00060 chr。T=0.900 A=0.10046铬。T=0.978 A=0.022

CYP2C9公司1799853卢比144C兰特48 chr。C=1.00048 chr。C=0.979 T=0.02162 chr。C=0.871 T=0.12946铬。C=0.935 T=0.065

电子工程师rs1800956D366小时46铬。C=0.978 G=0.0221480铬。C=0.942 G=0.05846铬。C=1.000不适用

EPHX1型1051740卢比Y113小时48小时。T=0.917
C=0.083
84铬。T=0.620
C=0.380
62 chr。T=0.613
C=0.387
46铬。T=0.587
C=0.413

ERBB2号机组1058808卢比P1170A页40 chr。C=0.775 G=0.2251502铬。G=0.514 C=0.48648 chr。G=0.646 C=0.354不适用

FPR1系列867228卢比E346A型44铬。G=0.818 T=0.18246铬。G=0.761 T=0.23948小时。G=0.771 T=0.229不适用

FUCA2公司rs3762001号H371Y型44铬。G=0.818 A=0.1821282 chr。G=0.789 A=0.21144铬。G=0.795 A=0.205不适用

图4rs1805388T9I型48 chr。C=0.979
T=0.021
48 chr。G=0.792
A=0.208
62 chr。C=0.871
T=0.129
46铬。
C=0.848
T=0.152

MC1R(最大持续功率)1805007卢比151C兰特42铬。C=1.00040 chr。C=1.00046铬。C=0.891 T=0.109不适用

基质金属蛋白酶92250889卢比574P兰特46铬。C=0.870 G=0.1301488铬。C=0.688 G=0.31248 chr。C=0.896 G=0.104不适用

基质金属蛋白酶93918252卢比127K奈特48 chr。C=0.938 G=0.06248 chr。C=1.00048 chr。C=1.000不适用

跨国公司2276403卢比H357Y型46铬。C=1.0001484铬。C=0.944 T=0.05648小时。C=1.000不适用

前列腺素M3473267卢比D466牛顿46铬。温度=0.565摄氏度=0.43584铬。C=0.750 T=0.25048 chr。C=0.688 T=0.312不适用

PLAU公司2227564卢比L141P级48 chr。C=0.979 T=0.0211492 chr。G=0.783 A=0.21744铬。C=0.659 T=0.341不适用

PTPN3型3793524卢比A90P型46铬。G=0.522 C=0.4781498 chr。G=0.628 C=0.37246铬。C=0.717 G=0.283不适用

SLC1A5型3027956卢比第17A页46克。G=0.957 C=0.04342铬。G=0.524 C=0.476146铬。C=0.710 G=0.290不适用

泰尔(TYR)1042602卢比第192年46铬。C=0.957 A=0.04348 chr。C=1.00048 chr。C=0.750 A=0.250不适用

VCAM1公司3783613卢比G413A型48 chr。G=0.938 C=0.06244铬。G=0.977 C=0.02348 chr。G=1.000不适用

XRCC1公司25489卢比R280小时48 chr。G=0.937
A=0.063
84铬。C=1.00062 chr。G=0.968
A=0.032
46铬。
G=0.957
A=0.043

缩写:chr:染色体;不适用:不可用。

基因符号由HUGO基因命名委员会批准[67].

b条SNP标识符(ID)对应于dbSNP ID(http://www.ncbi.nlm.nih.gov/SNP网站/) [31].

c(c)指出了氨基酸替代的位置以及由主要和次要SNP等位基因指定的氨基酸。频率信息如dbSNP构建123所示,基于≥40条染色体。请注意,标注为非洲和非洲裔美国人的样本;高加索人和欧洲人;中国人和东亚人在这里结合在一起,分别被称为非洲人、高加索人和亚洲人。每当一个组有多个条目可用时,这里只包括来自染色体数目最多的条目的信息。

讨论

一部分SNP被认为有助于复杂疾病的发展[7,10-12]. 候选基因中或周围的SNP可能与疾病直接相关;然而,并不是所有的SNP都会影响基因的表达和功能,所以选择那些具有潜在影响的SNP是一个激烈的争论[32]. 一些研究开发了工具和/或系统地分析了nsSNP,以根据进化保守性或结构参数识别那些影响基因功能的nsSNP[16-18,33]. PolyPhen公司[18]是一种基于网络的工具,用于选择可能影响蛋白质功能的nsSNP。简而言之,PolyPhen的预测基于蛋白质比对、结构参数或序列注释。据报道,PolyPhen的灵敏度约为82%[18].

在本研究中,我们假设对受影响组织中表达的候选基因进行系统分析可能会改进和丰富对疾病敏感等位基因的识别。因此,使用基于生物信息学的策略,我们从与乳腺组织中表达的致癌相关通路(DNA修复、细胞周期、信号转导等)相关的大量基因中鉴定出功能性nsSNP。我们认为,这些具有潜在功能的nsSNP可能导致蛋白质水平的异常,这可能会影响乳腺组织的发育、代谢和体内平衡,从而导致乳腺癌的易感性。

本研究中发现的具有功能性nsSNP的基因来自多种致癌相关的细胞途径。根据这一信息,这些nsSNP可能具有生物学作用。例如,来自血管生成和转移相关蛋白的nsSNP可能在肿瘤生长和转移性肿瘤的发展中起作用[34,35]. 此外,DNA修复nsSNP可能导致体细胞突变的积累,从而参与癌症的发生和促进[34-36]. 此外,与DNA修复nsSNP一起,来自药理学基因的nsSNP也可能是针对乳腺癌化疗/放疗的疗效、差异反应和不良反应的研究的良好候选对象[37-39]. 大多数nsSNP来自与免疫反应相关的基因(74.6%),这些基因可以抑制和促进肿瘤的发生[34]. 免疫系统相关基因中功能性nsSNP数量较多可能反映了乳腺组织表达基因集中存在大量免疫基因(60%)。

相当多的具有功能性nsSNPs的基因先前与乳腺癌病因有关:ADM公司,[40]美国存托凭证2,[41]APOE公司,[42]CHG公司A、[43]CSF1型,[44]CYP1B1型,[45]DAG1号机组,[46]电子工程师,[47]EPHX1型,[48]ERBB2号机组,[49]第二层,[50]基质金属蛋白酶9,[51]粘液4,[52]NFATC1,[53]槽口4,[54]PLAU公司,[55]普劳尔,[55]PTGS2型[56]和VCAM1公司[57]. 因此,我们建议表中的nsSNP表22是参与乳腺癌发生、发展或进展的遗传因素的优秀候选者。此外,其中一些nsSNP可能对乳腺癌治疗结果至关重要。

当分析常见功能性nsSNP的分布时,发现主要等位基因和等位基因频率在人群中存在差异。例如,在所有人群中发现了15个常见的nsSNP,而另一组15个nsSNP是特定人群特有的。这些差异可能反映了等位基因的年龄、创始人效应或作用于不同人群的不同选择压力[58,59]. 最重要的是,数据还表明,在我们的数据集中,一种具有潜在生物学后果的常见nsSNP很可能在不同人群中流行,或仅限于某些人群。显然,后者促使我们得出结论,特定人群的功能性nsSNP可能与特定背景个体的遗传倾向有关。在这方面,这一结论与先前的研究一致,在先前的研究中,发现人群中具有显著不同等位基因频率的遗传变异与特定疾病或不同的药物反应有关[60-65]. 这些信息可能对研究人员确定哪些nsSNP与特定人群研究中的使用相关特别有帮助。此外,尽管需要进一步分析,但很容易推测这些nsSNP可能是不同人群乳腺癌易感性和药物反应的分子基础潜在变异的一部分。

来自多个数据库的数据集成构成了我们确定乳腺组织表达基因功能SNP策略的基础。单个数据库中基因组数据的质量和数量影响组合数据的全面性。本研究中的功能SNP列表是来自三个数据库的数据集成的结果,即TissueInfo、[29]合奏[28]和dbSNP[31]. TissueInfo、Ensembl和dbSNP之间的非匹配数据字段(如转录标识符)是缺失数据的主要来源。例如,尽管巴西航空公司1已知具有潜在功能SNP(先前预测),但由于以下内容的转录本标识符信息不匹配,因此尚未捕获此信息巴西航空公司1在数据库中。因此,不同数据库中数据的不兼容性是本文提出的基于生物信息学的策略的一个速率限制因素。提高数据库中基因组数据的质量和数量将有助于研究复杂问题。此外,本文中呈现的基因基于表达的序列标签信息,这可能导致很少表达的基因的低表达[29,66]. 使用其他组织表达数据库进行数据集成可能会丰富所生成数据的质量。尽管如此,尽管此处提出的SNP可能并不代表最全面的列表,但使用建议策略确定的SNP代表了研究乳腺癌遗传易感性的宝贵资源。

结论

总之,我们设计了一种新的策略来识别乳腺组织中表达的癌相关基因的潜在功能变体。我们的结果显示存在109个具有潜在生物学后果的nsSNP,其中67个在人群中常见。我们认为,与其他遗传和环境因素一起,这些nsSNP可能参与乳腺癌的发生和发展;因此,这些nsSNPs代表了乳腺癌易感性的遗传变异的优质候选者。我们还建议,实际上,相当一部分nsSNP可能是人群特有的遗传变异。

致谢

作者感谢Baris Tuncertan和Mehjabeen Shariff从dbSNP和预先计算的PolyPhen资源中检索数据,感谢Michelle Cotterchio博士批判性地阅读手稿。这项工作得到了美国苏珊·科门乳腺癌基金会和加拿大乳腺癌基金的资助(BCTR0100627)。Sevtap Savas部分得到了“CIHR战略培训计划拨款——Samuel Lunenfeld研究所培训计划:将基因组学应用于人类健康”奖学金的支持。

工具书类

  • Miki Y、Swensen J、Shattuck-Eidens D.等人。乳腺癌和卵巢癌易感基因的有力候选基因巴西航空公司1.科学。1994;266:66–71. doi:10.1126/science.7545954。[公共医学] [交叉参考][谷歌学者]
  • Wooster R、Bignell G、Lancaster J.等人,乳腺癌易感基因的鉴定巴西航空公司2.自然。1995;378:789–792. doi:10.1038/378789a0。[公共医学] [交叉参考][谷歌学者]
  • Hofmann W,Schlag PM。巴西航空公司1巴西航空公司2--乳腺癌易感基因。癌症研究临床肿瘤学杂志。2000;126:487–496. doi:10.1007/s004320000140。[公共医学] [交叉参考][谷歌学者]
  • Hodgson SV、Morrison PJ、Irving M.乳腺癌遗传学:在不断扩大的临床实践中未解决的问题和开放的观点。美国医学遗传学杂志。2004;129:56–64.[公共医学][谷歌学者]
  • Dong C,Hemminki K。2112616个核心家庭的兄弟姐妹和父母癌症对后代癌症风险的影响。国际癌症杂志。2001;92:144–150. doi:10.1002/1097-0215(200102)9999:99999<:AID-IJC1147>3.0.CO;2-摄氏度。[公共医学] [交叉参考][谷歌学者]
  • Chenevix-Trench G、Spurdle AB、Gatei M.等。乳腺癌家族中主要负ATM突变。美国国家癌症研究所。2002;94:205–215. doi:10.1093/jnci/94.3.205。[公共医学] [交叉参考][谷歌学者]
  • 思考文学学士。癌症遗传学。自然。2001;411:336–341. doi:10.1038/35077207。[公共医学] [交叉参考][谷歌学者]
  • Malkin D,Li FP,Strong LC等。乳腺癌、肉瘤和其他肿瘤家族综合征中的生殖系p53突变。科学。1990;250:1233–1238. doi:10.1126/science.1978757。[公共医学] [交叉参考][谷歌学者]
  • Meijers-Heijboer H,van den Ouweland A,Klijn J.等人。非携带者CHEK2(*)1100delC对乳腺癌的低遗传易感性巴西航空公司1巴西航空公司2突变。自然遗传学。2002;31:55–59. doi:10.1038/ng879。[公共医学] [交叉参考][谷歌学者]
  • Risch N,Merikangas K。复杂人类疾病遗传研究的未来。科学。1996;273:1516–1517. doi:10.1126/science.273.5281.1516。[公共医学] [交叉参考][谷歌学者]
  • Collins A,Lonjou C,Morton NE。单核苷酸多态性的遗传流行病学。美国国家科学院院刊。1999;96:15173–15177. doi:10.1073/pnas.96.26.15173。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Houlston RS,Peto J.寻找低遗传率癌症易感性等位基因。致癌物。2004;23:6471–6476. doi:10.1038/sj.onc.1207951。[公共医学] [交叉参考][谷歌学者]
  • Reumers J,Schymkowitz J,Ferkinghoff Borg J,SNP效应:人类非同义编码SNP的分子表型效应数据库映射。核酸研究。2005年,第D527–D532页。[PMC免费文章][公共医学]
  • Chanock S.人类疾病研究中的候选基因和单核苷酸多态性(SNP)。Dis标记。2001;17:89–98. [PMC免费文章][公共医学][谷歌学者]
  • 法老PD,Dunning AM,Ponder BA,Easton DF。发现易感癌基因变异的关联研究。Nat Rev癌症。2004;4:850–860. doi:10.1038/nrc1476。[公共医学] [交叉参考][谷歌学者]
  • Wang Z,Moult J.单核苷酸多态性,蛋白质结构和疾病。哼,变种。2001;17:263–270. doi:10.1002/humu.22。[公共医学] [交叉参考][谷歌学者]
  • Ng PC,Henikoff S.预测影响蛋白质功能的人类多态性的解释。基因组研究。2002;12:436–446. doi:10.1101/gr.212802。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Ramensky V,Bork P,Sunyaev S。人类非同义SNPs:服务器和调查。核酸研究。2002;30:3894–3900. doi:10.1093/nar/gkf493。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • MacPherson G,Healey CS,Teare MD等人CASP8公司降低乳腺癌风险的基因。美国国家癌症研究所。2004;96:1866–1869. doi:10.1093/jnci/dji001。[公共医学] [交叉参考][谷歌学者]
  • Menzel HJ、Sarmanova J、Soucek P.等。NQO1多态性与两个独立人群中自发性乳腺癌的相关性。英国癌症杂志。2004;90:1989–1994. doi:10.1038/sj.bjc.6601779。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Rutter JL、Chatterjee N、Wacholder S、Struewing J.阿什肯纳西姆地区HER2 I655V多态性与乳腺癌风险。流行病学。2003;14:694–700. doi:10.1097/01.ede.0000083227.74669.7b。[公共医学] [交叉参考][谷歌学者]
  • Livingston RJ、von Niederhausern A、Jegga AG等。213个环境响应基因的序列变异模式。基因组研究。2004;14:1821–1831. doi:10.1101/gr.2730004。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Savas S,Kim DY,Ahmad MF.等人。使用蛋白质保守性分析识别DNA修复途径中的功能性遗传变异。癌症流行生物标志物预防。2004;13:801–807.[公共医学][谷歌学者]
  • Xi T、Jones IM、Mohrenweiser HW。在人群筛查期间,DNA修复基因中发现的许多氨基酸替代变体预计会影响蛋白质功能。基因组学。2004;83:970–979. doi:10.1016/j.ygeno.2003.12.016。[公共医学] [交叉参考][谷歌学者]
  • Savas S,Ahmad MF,Shariff M.等。可影响细胞周期蛋白功能和相互作用的候选nsSNPs。蛋白质。2005;58:697–705.[公共医学][谷歌学者]
  • Ben-Shlomo I、Vitt UA、Hsueh AJ。透视图:卵巢万花筒数据库-II。特定器官数据库的功能基因组分析。内分泌学。2002;143:2041–2044. doi:10.1210/en.143.62041。[公共医学] [交叉参考][谷歌学者]
  • Morton CC。使用组织特异性方法在听觉系统中发现基因。美国医学遗传学杂志。2004;130:26–28.[公共医学][谷歌学者]
  • 哈伯德·T、安德鲁斯·D、卡卡莫·M、合奏2005。核酸研究。2005年,第D447–D453页。[PMC免费文章][公共医学]
  • Skrabanek L,Campagne F.TissueInfo:组织表达谱和特异性的高通量鉴定。核酸研究。2001;29:E102–2。doi:10.1093/nar/29.21.e102。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Clifford R、Edmonson M、Hu Y.等人。癌症基因组解剖项目确定的单核苷酸多态性的基于表达的遗传/物理图。基因组研究。2000;10:1259–1265. doi:10.1101/gr.10.8.1259。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Sherry ST,Ward MH,Kholodov M.等人dbSNP:遗传变异的NCBI数据库。核酸研究。2001;29:308–311. doi:10.1093/nar/29.1.308。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Daly AK,Day CP。候选基因病例对照关联研究:优势和潜在陷阱。英国临床药理学杂志。2001;52:489–499. doi:10.1046/j.0306-5251.2001.01510.x。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Sunyaev S、Ramensky V、Koch I.等。有害人类等位基因的预测。人类分子遗传学。2001;10:591–597. doi:10.1093/hmg/10.6.591。[公共医学] [交叉参考][谷歌学者]
  • Jakobisiak M,Lasek W,Golab J.预防癌症的自然机制。免疫Lett。2003;90:103–122. doi:10.1016/j.imlet.2003.08.005。[公共医学] [交叉参考][谷歌学者]
  • Kirsch M,Schackert G,Black PM,《转移与血管生成》。癌症治疗研究。2004;117:285–304. doi:10.1007/9781-4419-8871-317。[公共医学] [交叉参考][谷歌学者]
  • Mohrenweiser硬件。遗传变异和接触相关风险评估:毒理学会进入一个新时代吗?DNA修复和癌症作为一个范例。毒理学。2004;32:136–145.[公共医学][谷歌学者]
  • Andreassen CN,Alsner J,Overgaard M,Overgaard J.从候选基因多态性预测正常组织的放射敏感性。放射疗法。2003;69:127–135. doi:10.1016/j.radonc.2003.09.010。[公共医学] [交叉参考][谷歌学者]
  • Watters JW,McLeod HL。癌症药物基因组学:当前和未来的应用。Biochim生物物理学报。2003;1603:99–111.[公共医学][谷歌学者]
  • Sullivan A、Syed N、Gasco M.等人。野生型p53基因多态性调节化疗反应在体外体内.致癌物。2004;23:3328–3337. doi:10.1038/sj.onc.1207428。[公共医学] [交叉参考][谷歌学者]
  • Oehler MK,Fischer DC,Orlowska-Volk M.等。乳腺癌中血管生成肽肾上腺髓质素的组织和血浆表达。英国癌症杂志。2003;89:1927–1933. doi:10.1038/sj.bjc.6601397。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Cakir Y、Plummer HK、Tithof PK、Schuller HM。人乳腺癌细胞系的β-肾上腺素能和花生四烯酸介导的生长调节。国际癌症杂志。2002;21:153–157.[公共医学][谷歌学者]
  • Zunarelli E,Nicoll JA,Migaldi M,Trentini GP。载脂蛋白E多态性与乳腺癌:与细胞增殖指数和临床结果的相关性。乳腺癌研究治疗。2000;63:193–198. doi:10.1023/A:1006464409137。[公共医学] [交叉参考][谷歌学者]
  • Pagani A、Papotti M、Hofler H.等。乳腺癌中嗜铬粒蛋白A和B基因的表达。免疫细胞化学、免疫印迹和杂交分析的相关性。《美国病理学杂志》。1990;136:319–327. [PMC免费文章][公共医学][谷歌学者]
  • Lin EY、Gouon-Evans V、Nguyen AV、Pollard JW。巨噬细胞生长因子CSF-1在乳腺发育和肿瘤进展中的作用。乳腺生物肿瘤杂志。2002;7:147–162. doi:10.1023/A:1020399802795。[公共医学] [交叉参考][谷歌学者]
  • Spink DC、Spink BC、Cao JQ。等。CYP1A1和CYP1B1在人类乳腺上皮细胞和乳腺肿瘤细胞中的差异表达。致癌。1998;19:291–298. doi:10.1093/carcin/19.2.291。[公共医学] [交叉参考][谷歌学者]
  • Sgambato A、Migaldi M、Montanari M等。Dystroglycan在人类乳腺癌和结肠癌中的表达经常降低,并与肿瘤进展相关。《美国病理学杂志》。2003;162:849–860. doi:10.1016/S0002-9440(10)63881-3。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Li C,Guo B,Bernabeu C,Kumar S.乳腺癌血管生成:转化生长因子β和CD105的作用。Microsc Res技术。2001;52:437–449. doi:10.1002/1097-0029(20010215)52:4<437::AID-JEMT1029>3.0.CO;2-G型。[公共医学] [交叉参考][谷歌学者]
  • Fritz P,Murder TE,Eichelbaum M.等。作为原发性乳腺癌三苯氧胺反应预测因子的微粒体环氧化物水解酶表达:一项具有长期随访的回顾性探索性研究。临床肿瘤学杂志。2001;19:3–9.[公共医学][谷歌学者]
  • 周碧萍,洪美忠。HER2/neu对乳腺癌细胞信号的调节障碍。塞明·昂科尔。2003;30:38–48.[公共医学][谷歌学者]
  • Booden MA,Eckert LB,Der CJ,Trejo J.凝血酶受体运输失调的持续信号传导促进乳腺癌细胞侵袭。分子细胞生物学。2004;24:1990–1999. doi:10.1128/MCB.24.5.1990-1999.2004。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Lee PP,Hwang JJ,Murphy G,Ip MM。MMP-9在肿瘤坏死因子诱导的乳腺上皮细胞增殖和分支形态发生中的功能意义。内分泌学。2000;141:3764–3773. doi:10.1210/en.141.10.3764。[公共医学] [交叉参考][谷歌学者]
  • Carraway KL、Price-Schiavi SA、Komatsu M.等人。乳腺癌和乳腺癌中的Muc4/唾液幻觉复合物。乳腺生物肿瘤杂志。2001;6:323–337. doi:10.1023/A:1011327708973。[公共医学] [交叉参考][谷歌学者]
  • Jauliac S、Lopez-Rodriguez C、Shaw LM。等。NFAT转录因子在整合素介导的肿瘤侵袭中的作用。自然细胞生物学。2002;4:540–544. doi:10.1038/ncb816。[公共医学] [交叉参考][谷歌学者]
  • Politi K,Feirt N,Kitajewski J.Notch在乳腺发育和乳腺癌中的作用。塞明癌症生物学。2004;14:341–347. doi:10.1016/j.semcancer.2004.04.013。[公共医学] [交叉参考][谷歌学者]
  • Sliva D.负责癌细胞侵袭的信号通路是癌症治疗的靶点。当前癌症药物靶点。2004;4:327–336. doi:10.2174/1568009043332961。[公共医学] [交叉参考][谷歌学者]
  • Singh B,Lucci A.环氧合酶-2在乳腺癌中的作用。外科研究杂志。2002;108:173–179. doi:10.1006/jsre.2002.6532。[公共医学] [交叉参考][谷歌学者]
  • O'Hanlon DM、Fitzsimons H、Lynch J.等。乳腺癌中的可溶性粘附分子(E-selectin、ICAM-1和VCAM-1)。欧洲癌症杂志。2002;38:2252–2257. doi:10.1016/S0959-8049(02)00218-6。[公共医学] [交叉参考][谷歌学者]
  • Cavalli-Sforza LL,Feldman MW。分子遗传学方法在人类进化研究中的应用。自然遗传学。2003;33:266–275. doi:10.1038/ng1113。[公共医学] [交叉参考][谷歌学者]
  • Fay JC,Wu CI。蛋白质进化中的序列差异、功能约束和选择。《基因组学与人类遗传学年鉴》。2003;4:213–235. doi:10.1146/annurev.genom.4.020303.162528。[公共医学] [交叉参考][谷歌学者]
  • 伦敦SJ、雷曼TA、Taylor JA。髓过氧化物酶基因多态性与肺癌风险。癌症研究。1997;57:5001–5003.[公共医学][谷歌学者]
  • Evans DA、McLeod HL、Pritchard S.等。人类药物反应的种族间变异性。药物代谢处置。2001;29:606–610.[公共医学][谷歌学者]
  • Gibson AW、Edberg JC、Wu J.等人。末端IL-10启动子中的新型单核苷酸多态性影响IL-10的产生并增加系统性红斑狼疮的风险。免疫学杂志。2001;166:3915–3922.[公共医学][谷歌学者]
  • 料斗JL。女性乳腺癌的遗传流行病学。塞明癌症生物学。2001;11:367–374. doi:10.1006/scbi.2001.0392。[公共医学] [交叉参考][谷歌学者]
  • Xu C、Goodz S、Sellers EM、Tyndale RF。CYP2A6基因变异和潜在后果。高级药物交付版本。2002;54:1245–1256. doi:10.1016/S0169-409X(02)00065-0。[公共医学] [交叉参考][谷歌学者]
  • Shimizu E,Hashimoto K,Iyo M.BDNF 196G/A(val66met)多态性频率的种族差异:解释种族心理特征的可能性。美国医学遗传学杂志B神经精神病学遗传学。2004;126:122–123.[公共医学][谷歌学者]
  • Wang SM、Rowley JD。全基因组基因分析策略:基因鉴定的综合程序。美国国家科学院院刊。1998;95:11909–11914. doi:10.1073/pnas.95.20.11909。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Povey S、Lovering R、Bruford E.等人。HUGO基因命名委员会(HGNC)人类遗传学。2001;109:678–680. doi:10.1007/s00439-001-0615-0。[公共医学] [交叉参考][谷歌学者]

文章来自人类基因组学由以下人员提供BMC公司