自然。作者手稿;PMC 2013年4月2日提供。
以最终编辑形式发布为:
预防性维修识别码:PMC3613847型
美国国立卫生研究院:尼姆斯361899
外显子的模式和比率从头开始自闭症谱系障碍的突变
,1,2 ,三,4 ,5 ,三 ,1,2 ,6 ,7 ,2 ,7 ,4,8 ,2,9 ,4,8 ,2 ,10 ,10 ,7 ,7 ,5 ,11 ,11 ,4,8 ,4,8 ,三 ,12 ,12 ,6 ,6 ,6 ,6 ,6 ,6 ,6 ,2,13 ,1,2 ,1,2 ,1,2 ,2 ,1,2 ,2 ,2 ,2 ,2 ,2 ,2 ,2 ,14 ,14 ,14 ,15 ,2,9 ,6,16 ,4,8,12,17,° ,18 ,19 ,6 ,5,° ,7 ,10和1,2,°
本杰明·尼尔
1马萨诸塞州波士顿市马萨诸塞总医院和哈佛医学院医学部分析和转化遗传学室,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
燕寇
三药理学和系统治疗学,西奈山医学院,纽约,10029
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
李柳
5宾夕法尼亚州匹兹堡卡内基梅隆大学统计系,15232
阿维·马扬
三药理学和系统治疗学,西奈山医学院,纽约,10029
Kaitlin E.Samocha公司
1马萨诸塞州波士顿市马萨诸塞总医院和哈佛医学院医学部分析和转化遗传学室,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
阿尼科·萨博
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
乔凤琳
7宾夕法尼亚大学佩雷尔曼医学院病理学和实验医学,宾夕法尼亚州费城,19104
克里斯汀·史蒂文斯
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
王立三
7宾夕法尼亚大学佩雷尔曼医学院病理学和实验医学,宾夕法尼亚州费城,19104
弗拉德米尔·马卡洛夫
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
8纽约州纽约市西奈山医学院精神病学系,邮编:10029
帕兹·波拉克
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
9马萨诸塞州波士顿市Brigham&Women’s Hospital and Harvard Medical School医学院遗传科,邮编02115
Seungtai Yoon先生
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
8纽约州纽约市西奈山医学院精神病学系,邮编:10029
贾里德·马奎尔
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
艾米莉·克劳福德
10田纳西州纳什维尔范德比尔特大学分子生理学、生物物理和精神病学系范德比特大脑研究所,37232
尼古拉斯·G·坎贝尔
10田纳西州纳什维尔范德比尔特大学分子生理学、生物物理和精神病学系范德比特大脑研究所,37232
埃文·盖勒
7宾夕法尼亚大学佩雷尔曼医学院病理学和实验医学,宾夕法尼亚州费城,19104
奥托·瓦拉达雷斯
7宾夕法尼亚大学佩雷尔曼医学院病理学和实验医学,宾夕法尼亚州费城,19104
查德·沙弗
5宾夕法尼亚州匹兹堡卡内基梅隆大学统计系,15232
韩流(Han Liu)
11约翰霍普金斯大学生物统计系和计算机科学系,马里兰州巴尔的摩,21205
拓兆
11约翰霍普金斯大学生物统计系和计算机科学系,马里兰州巴尔的摩,21205
蔡桂青
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
8纽约州纽约市西奈山医学院精神病学系,邮编:10029
杰扬·利姆
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
8纽约州纽约市西奈山医学院精神病学系,邮编:10029
露丝·丹纳费尔瑟
三药理学和系统治疗学,西奈山医学院,纽约,10029
奥马尔·贾巴多
12遗传与基因组科学,西奈山医学院,纽约,10029
祖莱马·佩拉塔
12遗传与基因组科学,西奈山医学院,纽约,10029
乌玛·纳加斯瓦米
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
唐娜·穆兹尼
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
杰弗里·里德
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
艾琳·纽瑟姆
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
吴元庆
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
洛拉·刘易斯
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
易汉
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
本杰明·福伊特
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
13宾夕法尼亚大学佩雷尔曼医学院药理学系,宾夕法尼亚州费城,19104
伊莱恩·林
1马萨诸塞州波士顿市马萨诸塞总医院和哈佛医学院医学部分析和转化遗传学室,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
伊丽莎白·罗辛
1马萨诸塞州波士顿市马萨诸塞总医院和哈佛医学院医学部分析和转化遗传学室,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
安德鲁·柯比
1马萨诸塞州波士顿,马萨诸塞州总医院和哈佛医学院医学部分析和转化遗传学部门,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
杰森·弗兰尼克
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
Menachem Fromer公司
1马萨诸塞州波士顿市马萨诸塞总医院和哈佛医学院医学部分析和转化遗传学室,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
哈立德·夏基尔
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
蒂姆·芬内尔
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
基兰·加里梅拉
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
埃里克·班克斯
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
瑞安·波普林
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
斯泰西·加布里埃尔
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
马克·德普里斯托
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
杰克·R·温比什
14哈德逊阿尔法生物技术研究所,阿拉巴马州亨茨维尔,35806
布莱登·布恩
14哈德逊阿尔法生物技术研究所,阿拉巴马州亨茨维尔,35806
肖恩·利维
14HudsonAlpha生物技术研究所,阿拉巴马州亨茨维尔,35806
Catalina Betancur公司
15INSERM U952和CNRS UMR 7224以及法国巴黎UPMC大学06,75005
沙米尔·苏尼亚耶夫
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
9马萨诸塞州波士顿市Brigham&Women’s Hospital and Harvard Medical School医学院遗传科,邮编02115
埃里克·博温克尔
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
16德克萨斯州休斯顿市德克萨斯大学健康科学中心人类遗传学中心,邮编77030
约瑟夫·巴克斯鲍姆
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
8纽约州纽约市西奈山医学院精神病学系,邮编:10029
12遗传与基因组科学,西奈山医学院,纽约,10029
17弗里德曼大脑研究所,西奈山医学院,纽约,10029
小埃德温·库克。
18伊利诺伊大学芝加哥分校精神病学系,伊利诺伊州芝加哥,60608
伯尼·德夫林
19宾夕法尼亚州匹兹堡市匹兹堡大学医学院精神病学系,15213
理查德·吉布斯
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
凯瑟琳·罗德
5宾夕法尼亚州匹兹堡卡内基梅隆大学统计系,15232
杰拉德·D·谢伦伯格
7宾夕法尼亚大学佩雷尔曼医学院病理学和实验医学,宾夕法尼亚州费城,19104
詹姆斯·萨特克利夫
10田纳西州纳什维尔范德比尔特大学分子生理学、生物物理和精神病学系范德比特大脑研究所,37232
马克·戴利
1马萨诸塞州波士顿,马萨诸塞州总医院和哈佛医学院医学部分析和转化遗传学部门,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
1马萨诸塞州波士顿市马萨诸塞总医院和哈佛医学院医学部分析和转化遗传学室,02114
2哈佛大学和麻省理工学院广泛研究所医学和人口遗传学项目,马萨诸塞州剑桥市剑桥中心7号,02142
三药理学和系统治疗学,西奈山医学院,纽约,10029
4西弗自闭症研究与治疗中心,西奈山医学院,纽约,10029
5宾夕法尼亚州匹兹堡卡内基梅隆大学统计系,15232
6德克萨斯州休斯顿贝勒医学院人类基因组测序中心,邮编77030
7宾夕法尼亚大学佩雷尔曼医学院病理学和实验医学,宾夕法尼亚州费城,19104
8纽约州纽约市西奈山医学院精神病学系,邮编:10029
9马萨诸塞州波士顿市Brigham&Women’s Hospital and Harvard Medical School医学院遗传科,邮编02115
10田纳西州纳什维尔范德比尔特大学分子生理学、生物物理和精神病学系范德比特大脑研究所,37232
11约翰霍普金斯大学生物统计系和计算机科学系,马里兰州巴尔的摩,21205
12遗传与基因组科学,西奈山医学院,纽约,10029
1319104年宾夕法尼亚州费城佩雷曼医学院宾夕法尼亚大学药理学系
14哈德逊阿尔法生物技术研究所,阿拉巴马州亨茨维尔,35806
15INSERM U952和CNRS UMR 7224以及法国巴黎UPMC大学06,75005
16得克萨斯州休斯顿得克萨斯大学健康科学中心人类遗传学中心,77030
17弗里德曼大脑研究所,西奈山医学院,纽约,10029
18伊利诺伊大学芝加哥分校精神病学系,伊利诺伊州芝加哥,60608
19宾夕法尼亚州匹兹堡市匹兹堡大学医学院精神病学系,15213
尽管遗传率很高,但几乎没有发现ASD的遗传危险因素1,2拷贝数变体(CNV),通常从头开始并覆盖多个相邻基因,已被确定为具有风险三,4虽然这些CNV为基础生物学提供了重要线索,但它们很少涉及单个基因,很少具有完全渗透性,并且许多CNV具有广泛疾病风险,包括智力残疾(ID)、癫痫和精神分裂症5也有记录在案的罕见单核苷酸变体(SNV)对ASD具有高度渗透性6.
大规模的遗传学研究表明,ASD风险的来源多种多样,根据CNV数据的最新估计,独立风险位点的数量为数百个4然而,关于ASD的特定风险决定基因和总体遗传结构的知识仍然不完整。尽管新的测序技术提供了基因组中大多数变异的目录,但ASD的深刻基因座异质性使得区分具有风险的变异与无关紧要的SNV的背景噪声具有挑战性。从头开始变异频率较低,且可能更有害,可以为风险决定基因的研究提供见解。因此,我们试图仔细评估从头开始自闭症患者外显子的点突变。
我们使用多种方案和验证技术对五个中心的175名ASD先证者及其父母进行了外显子组测序(补充信息). 我们使用了基于当前最佳实践的敏感而具体的分析管道7-9对所有数据进行分析,未观察到中心间突变率的异质性。
在整个样本中,我们观察到161个编码区点突变(101个错义,50个无义和10个无义),另外2个保守剪接位点(CSS)SNV和6个移码指数被验证并包含在通路分析中(补充表1).
为了确定编码区点突变率是否升高,我们使用两种并行方法根据覆盖率和基础上下文估计突变率(补充信息). 基于这两个模型,外显子目标与基因组相比,突变率应显著增加(≈30%)。保守地说,通过假设最近全基因组数据估计的突变率的低端(1.2×10-8)10,我们估计突变率为1.5×10-8这里捕获的外显子序列。与预期相比,观察到的0.92/exome点突变率略有升高,但没有显著升高()对低覆盖区域的调整不敏感(补充信息). 事实上,我们的比率与Sanders等人(新闻稿)相似。
表1
事件/ 家庭 | 所有ASD三人组 | 随机 多出口三 |
---|
外显子DN SNV公司 | 费用 |
---|
0 | 71 | 69.7 | 73.2 |
1 | 62 | 64.2 | 63.8 |
2 | 28 | 29.5 | 27.8 |
三 | 10 | 9.1 | 8.1 |
4 | 2 | 2.1 | 1.8 |
5 | 1 | 0.4 | 0.3 |
| | 0.920 | 0.871 |
根据泊松分布分布家庭间事件()没有证据表明ASD追踪到高发病率从头开始突变。“功能性”(错义、无意义、CSS和直读)与无声更改的相对比率没有偏离预期(). 然而,我们确实观察到了10个无意义突变(6.2%),这超出了预期(3.3%)(单尾P(P)=0.04;补充信息).
表2
的类型从头开始 突变 | De Novo公司1 | 随机 De Novo公司 | 单体2 | 道尔顿2 | ≥ 32 |
---|
误解 | 62.7% | 66.1% | 59.5% | 55.4% | 48.8% |
胡说 | 6.2% | 3.3% | 1.2% | 0.8% | 0.4% |
同义词 | 31.1% | 30.6% | 39.3% | 43.8% | 50.8% |
温和的三 | 35.0% | 35.9% | 46.6% | 51.3% | 63.4% |
可能损坏三 | 21.0% | 18.9% | 18.8% | 17.7% | 15.1% |
可能造成损坏三 | 44.0% | 45.2% | 34.7% | 31.0% | 21.4% |
我们检测了错义突变,因为这种变异会导致功能丧失11使用PolyPhen2分数12以测量突变的严重程度。这些数据也没有偏离随机预期。观察到的PolyPhen2分数明显偏离了父母的站立变异():这种变化,即使是最罕见的种类,也经受住了选择压力,不适合控制从头开始事件。
我们观察到3个基因有两个从头开始突变:巴西航空公司2(2个错义),工厂验收试验1(2个错义)和KCNMA1型(1个错义,1个沉默)。具有两个或多个非同义词的基因从头开始一组三人小组的结果可能表明他们有很强的候选人资格。然而,模拟(补充信息)研究表明,鉴于研究中观察到的事件数量,两次这样的点击不足以将一个基因定义为决定性的风险因素。
从次级表型分析(补充表2-3)最显著的结果是,父母亲年龄本身高度相关(r2=0.679,P(P)-值<0.0001),每个值都强烈预测从头开始每个后代的事件数(父系年龄P(P)=0.0013,产妇年龄P(P)=0.000365),与父系生殖细胞的聚集突变一致13与遗传学理论一致从头开始女性与男性病例的突变(女性为1.214,男性为0.914);然而,差异并不显著,可能是由于样本量有限。考虑到表型相关性,我们观察到严格自闭症患者与更广泛自闭症诊断患者之间、阳性家族史与阴性家族史之间、或任何显著的自闭症影响之间的比率差异从头开始言语、非言语或全面智商突变(补充表3).
虽然数百个基因座显然与孤独症有关4和从头开始其中的突变影响ASD风险,对不同数量的风险基因和外显率进行建模(补充信息)显示了数百个基因的模型具有高外显率突变被我们的数据排除在外;然而从头开始变体不是。例如,10-20%的病例携带从头开始与这些数据一致的是,风险事件和风险增加10至20倍(补充表4). 因此,我们的数据与偶然突变或对从头开始风险突变。
因此,我们提出了两个关于基因群的问题从头开始功能性突变:这些基因的蛋白产物是否比预期的相互作用更大,它们是否异常丰富或与之前策划的ASD相关基因列表相关?使用生物信息学进近(DAPPLE)14,15113个功能基因的蛋白质连接性从头开始对突变进行评估。这些分析()显示出在从头开始鉴定出的蛋白质比预期的要多(P(P)<0.001) (补充信息).
具有观察功能基因的蛋白质相互作用从头开始事件来自InWeb的直接蛋白质连接,仅限于携带从头开始DAPPLE分析突变。我们发现了两个广泛的网络,第一个网络以SMARCC2为中心,11个基因有12个连接,第二个网络以FN1为中心,6个基因有7个连接。每个基因的P值与观察到的连接数一样多,将网络的节点着色。
查询先前定义的手动基因列表6与有ID和无ID的ASD高风险相关(补充表5)和高风险ID基因(补充表6),我们询问从头开始这些基因的突变。5个具有“功能性”新发事件的基因以前与ASD和/或ID相关(STXBP1型,MEF2C公司,KIRREL3号机组,RELN公司和TUBA1A公司); 这些基因中的四个(除了RELN公司)先前的证据表明常染色体显性遗传。
然后我们评估了平均距离(D我,补充图2)的从头开始脑表达基因中的编码变异(参见补充)使用蛋白质-蛋白质相互作用背景网络将其添加到ASD/ID列表中。为了增强功效,使用了来自配套研究(Sanders等人)的数据,包括观察到的沉默从头开始变体和从头开始未受影响同胞中的变体作为对照。病例组中非同义变体的平均距离明显小于对照组(3.66±0.42 vs.3.78±0.59;排列P(P)=0.033) (). 这些信号大多来自三项大规模突触蛋白质组研究(D我=3.47±0.46对3.57±0.60;置换P=0.084)(补充图3; 另请参见补充图4完整数据)。总的来说,这些独立的基因集分析,以及从头开始ASD背景率的变异表明从头开始本研究中观察到的事件可能会导致孤独症风险。
功能基因的直接和间接蛋白质相互作用从头开始事件和现有ASD/ID基因新生变异体和先前ASD基因的PPI网络分析(ASD112)。节点的大小取决于连接性。含有新生变异体的基因(左)和之前的ASD基因(右)为蓝色,节点为深蓝色,代表属于这些列表之一的基因,也是中间蛋白。中间蛋白质(中间)根据比例测试计算的p值以橙色着色,深色代表较低的p值。绿色边缘表示含有新生变异体(左)的基因和之前的ASD基因之间的直接联系。连接到中间蛋白质的所有其他边缘均显示为灰色。
利用自闭症三人组的全基因组测序,我们证明了从头开始突变很大程度上与序列上下文控制的偶然突变过程一致。这种与随机突变过程的显著偏差的缺乏表明从头开始的ASD发病机制的突变15,并特别强调了这样一个事实:从头开始突变,即使是一个明显“严重”的LOF等位基因,也不足以表明基因是一个危险因素。然而,这里提出的通路分析断言,整个基因组都具有“功能性”从头开始突变并不是随机的,它们在生物学上相互关联,并与之前确定的ASD/ID候选基因相关。建模从头开始一系列遗传模型下的突变过程表明,一些模型与观察到的数据不一致,例如,100个类似于Rett综合征的罕见的、完全渗透的孟德尔基因,而另一些则不是1000个基因中自发的“功能性”突变,这会使风险增加10或20倍(补充表4). 适合数据的模型与大多数情况下估计的相对风险一致从头开始CNV公司4并建议从头开始与大多数CNV一样,SNV通常与其他风险因素结合,而不是完全导致疾病。此外,这些模型表明从头开始SNVs事件可能解释自闭症风险总方差的<5%(补充表4).
考虑到这两份手稿,18个基因有两个功能从头开始在完整的数据中观察到突变。通过模拟,平均11.91个基因存在功能突变(补充表7). 因此,一组具有两个或更多命中的18个基因并不十分显著(p=0.063)。然而,在SCN2A公司,KATNAL2和CHD8(补充表7)不太可能偶然发生,因为从头开始无意义、拼接和移码变体。我们利用外显子组测序对935例病例和870例对照进行了进一步评估KATNAL2公司和瑞士法郎8,在对照组无LoF突变的病例中观察到三个额外的LoF突变(在SCN2A基因). 使用NHLBI Exome Variant Server中5000多个个体的数据作为额外的对照,在KATNAL2公司但再也没有了瑞士法郎8,对3进行附加观察瑞士法郎8我们病例中的LoF突变是一个真正的自闭症易感基因的显著证据(p<0.01)。并不是所有的基因都有双重命中率(补充信息;补充表8-9)支持上述估计,即大多数此类观察只是偶然事件。总的来说,这些数据强调了将单个基因确定为ASD决定性风险因素的挑战,这将需要更大的样本量,并且很可能需要与遗传变异进行更深入的分析整合。
方法(仅限在线版本)
表型评估
受影响的先证者由研究负责的研究人员使用自闭症诊断访谈-修订(ADI-R)进行评估,自闭症检测观察计划-普通(ADOS)和DSM-IV由一名临床医生对一种普遍性发育障碍进行诊断。所有先证者在ADI-R上均符合自闭症标准,在ADOS上均符合孤独症标准或ASD标准,但AGRE中的3名受试者除外,他们未使用ADOS进行评估。在所有85%的先证者中,ADI-R和ADOS均被归类为自闭症。所有受试者都提供了知情同意书,研究得到了机构人类受试者委员会的批准。
外显子序列测定、变异体鉴定和从头开始侦查
使用类似的方法在每个位点进行外显子捕获和测序。使用Agilent 38Mb SureSelect v2(宾夕法尼亚大学和布罗德研究所n=118)、NimbleGen Seq Cap EZ SR v2,(范德比尔特大学西奈山医学院n=51)或NimbleGen VCRome 2.1(贝勒n=6)捕获外显子。捕获后,进行另一轮LM-PCR以增加可用于测序的DNA数量。使用IlluminaHiSeq2000对所有库进行测序。
序列处理和变量调用在所有站点使用类似的计算工作流执行。使用Picard处理数据(http://picard.sourceforge.net网站/)利用基础质量分数重新校准和已知指数的局部重新校准8和BWA7用于将读取映射到hg19。使用GATK调用SNP8,9为所有三人组联合。我们在分析中考虑的可变站点仅限于那些通过GATK标准过滤器的站点。从这组变体中,我们确定了假定的从头开始突变是指双亲都是参考序列的纯合子,后代是杂合子,并且每个基因型调用都是自信的(参见补充信息).
的验证从头开始事件
假定从头开始的通过使用桑格测序方法(宾夕法尼亚大学、西奈山医学院、范德比尔特大学、贝勒医学院)或Sequenom MALDI-TOF基因分型法(布罗德)对携带者和双亲进行测序来验证事件。
基因注释
然后使用Refseq hg19对所有识别的突变进行注释。对每个基因的所有亚型评估变体的功能影响,以最严重的注释为优先。剪接位点变异被鉴定为发生在任何内含子/外显子边界的两个碱基对内。
对的期望从头开始突变计算
计算预期从头开始速率,我们评估了人类基因组基因间区域中所有可能的三核苷酸上下文的突变,以两种方式进行变异:与黑猩猩和狒狒相比的固定基因组差异12以及从1000基因组项目中确定的变异。然后,通过对成功捕获的外显子中所有碱基的突变概率求和,确定外显子的总突变率。我们还通过对带注释的变体求和来确定每个类功能突变的概率。
路径分析
我们申请了DAPPLE14,它使用InWeb数据库15,以确定受功能性从头开始事件。我们还评估了这些基因是否与ASD基因列表有更密切的联系。6
建模从头开始事件
我们建模了一个泊松过程,该过程与突变模型定义的预期分布和观测数据一致。我们改变了影响风险的基因比例、基因中变异具有功能的概率以及功能外显率从头开始事件。我们还模拟了一组随机的从头开始事件来估计多次命中一个基因的概率。
关联分析
我们使用SKAT公司17,C-alpha的推广18我们的初步分析分别处理了Baylor和Broad产生的病例对照数据(23个基因X2个位点),但我们也进行了大型和荟萃分析(23个基因组X2个方法)。