跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2008年10月;40(10):1253-60.
doi:10.1038/ng.237。 Epub 2008年9月7日。

SNP、常见拷贝数多态性和罕见CNV的综合基因型调用和关联分析

附属公司
比较研究

SNP、常见拷贝数多态性和罕见CNV的综合基因型调用和关联分析

约书亚·M·科恩等。 自然基因. 2008年10月.

摘要

为了了解基因变异在疾病中的作用,需要准确完整地测量常见和罕见的单核苷酸(SNP)和拷贝数(CNV)变异。我们提出了Birdsuite,一个在软件中实例化的四阶段分析框架,用于推导完整且相互一致的拷贝数和SNP基因型。该方法顺序分配常见拷贝数多态性(CNPs)区域的拷贝数,称为SNPs的基因型,通过隐马尔可夫模型(HMM)识别罕见的CNV,并在每个位点生成一个完整的序列和拷贝数基因型(例如,除了AA、AB和BB调用外,还包括A-null、AAB和BBB等基因型)。这种基因型更准确地描述了每个个体的潜在序列,减少了明显的孟德尔不一致性。这里将Birdsuite软件应用于Affymetrix SNP 6.0阵列的数据。此外,我们描述了一种在PLINK中实现的方法,利用这些SNP和CNV基因型组合进行表型关联测试。

PubMed免责声明

数字

图1
图1
鸟服概述。在步骤1中,金丝雀估计已知常见拷贝数多态性区域的拷贝数(“CNP基因分型”)。在步骤2中,Birdseed将典型SNP基因型(AA、AB或BB)分配给Canary估计具有两个SNP位点拷贝的样本(“SNP基因分型”)。此外,它还计算特定于问题的平均值和方差。在步骤3中,鸟瞰估计罕见或从头开始拷贝数变体,使用金丝雀和鸟籽提供的特定探针的平均值和方差,并结合该地区多个探针的数据(“CNV发现”)。在步骤4中,福克斯将每个位点每个样本的拷贝数信息与等位基因特异性信息结合起来,指定一个综合SNP基因型,包括非经典基因型,如a-null或AAB。
图2
图2
CNP如何通过金丝雀进行处理的示意图,以第4号染色体的数据为例。()单个拷贝号探针的原始数据直方图。(b条)88个HapMap样本中相邻探针强度分布的互相关矩阵(图13)。对于SNP,使用的强度是A和B等位基因强度的总和。中心的高一致相关性表明拷贝数变化与随机噪声相反,从而划定了CNP的边界。(c(c))描绘88个样本中相邻探针归一化强度的热图;红色表示低强度,黄色表示高强度。拷贝号探针由下面的粉红色点表示x个轴。用于汇总CNP的探针底部用黑线表示。(d日)总结了该CNP的强度测量结果(共88个样本),用加那利符合数据的高斯簇覆盖,并用拷贝数着色。(e(电子))金丝雀多等位基因CNP的六批HapMap数据中的基因型x个轴是批处理加抖动轴是样本强度。也沿着轴表示不同拷贝数基因型类别应位于何处的先前预期。“混合”批次的设计应确保样品不被祖先群体分离。((f))与相同e(电子),除了显示YRI特定的简单删除CNP,其批处理效果明显。
图3
图3
单一SNP如何通过Birdsuite处理以及孟德尔不一致性评估的示意图。()SNP的原始数据,绘制等位基因A强度与等位基因B强度。与阵列上的大多数SNP不同,该SNP不形成三个离散的簇,因为它位于图2中描述的通用CNP中。(b条)与相同,由CNP基因型着色(由图2d中的金丝雀确定)。(c(c))鸟籽使用该位点有两个拷贝的样本来确定SNP的等位基因特异性探针特征(“簇”)。(d日)基于双拷贝模型插补的拷贝变异聚类。这些基因反过来又用于帮助鸟瞰公司寻找未发现的CNV,并由福克斯指定等位基因特异性拷贝数基因型,如A/null(右下绿色区域)或BBBB(左上品红区域)。(e(电子))图中显示了91名仅使用鸟籽(无加那利)的儿童与使用整个鸟衣的儿童的SNP中与已知CNP重叠的孟德尔不一致率(MI)。只使用复制正常调用来测试MI;MI率是不一致的数量除以测试数量。((f))使用鸟巢的MI率直方图除以仅使用鸟巢种子的MI率,使用所有常染色体SNP进行计算。所有91个样本的MI率都有所下降,这表明相当大比例的不一致是由于遗传、,从头开始或体拷贝数变异。
图4
图4
发现未知或从头开始使用鸟瞰仪改变拷贝数。()来自拷贝号探测器的原始数据,其中一个样本(箭头)为绿色(左上角)。来自相邻SNP的原始数据,相同的样本(箭头)为绿色(右上角)。尽管样本的强度相对较低,但人们无法仅根据这些数据进行删除(底部)。这两个探针位置周围较大区域的视图。将一个点放置在每个查询位点该样本的估计拷贝数处(不考虑相邻探针)。有了足够的探针来支持缺失的证据,HMM在85kb的区域(蓝线)转变为该样本中的杂合缺失。(b、 c(c))此外,在中显示的示例中调用删除,鸟瞰测定了该样本各亲本中相同缺失的相对对数似然。由于有强有力的证据表明父母中的这种缺失,该地区代表了从头开始孩子中的事件。(d日)数据来自生物信息学性别混合实验。发现不同大小的模拟删除的灵敏度和断点准确性(左)。只有当删除的lod得分高于2时,才认为发现了删除。发现模拟缺失的敏感性与每个基因组的预期假阳性发现数成正比(右)。将点放置在5、2、1和0的lod阈值处。

类似文章

  • SNP和拷贝数变异的综合检测和群体遗传学分析。
    McCarroll SA、Kuruvilla FG、Korn JM、Cawley S、Nemesh J、Wysoker A、Shapero MH、de Bakker PI、Maller JB、Kirby A、Elliott AL、Parkin M、Hubbell E、Webster T、Mei R、Veitch J、Collins PJ、Handmaker R、Lincoln S、Nizzari M、Blume J、Jones KW、Rava R、Daly MJ、Gabriel SB、Altshuler D。 McCarroll SA等人。 自然遗传学。2008年10月;40(10):1166-74. doi:10.1038/ng.238。Epub 2008年9月7日。 自然遗传学。2008 PMID:18776908
  • 通过全基因组SNP基因分型对拷贝数变异检测进行系统评估。
    Cooper GM、Zerr T、Kidd JM、Eichler EE、Nickerson DA。 Cooper GM等人。 自然遗传学。2008年10月;40(10):1199-203. doi:10.1038/ng.236。Epub 2008年9月7日。 自然遗传学。2008 PMID:18776910 免费PMC文章。
  • Affymetrix 6.0 SNP阵列平台基因组拷贝数变异评估软件比较。
    Eckel-Passow JE、Atkinson EJ、Maharjan S、Kardia SL、de Andrade M。 Eckel-Passow JE等人。 BMC生物信息学。2011年5月31日;12:220. doi:10.1186/1471-2105-12-220。 BMC生物信息学。2011 PMID:21627824 免费PMC文章。
  • 使用SNP基因分型阵列发现CNV。
    Yau C、Holmes CC。 Yau C等人。 细胞遗传学基因组研究2008;123(1-4):307-12. doi:10.1159/000184722。Epub 2009年3月11日。 2008年细胞遗传学研究。 PMID:19287169 审查。
  • 人类疾病的拷贝数变异和关联研究。
    McCarroll SA,Altshuler DM公司。 McCarroll SA等人。 自然遗传学。2007年7月;39(7补充):S37-42。doi:10.1038/ng2080。 自然遗传学。2007 PMID:17597780 审查。

引用人

  • 突尼斯和HapMap人群拷贝数多态性的种族和功能分化揭示了基因组组织可塑性的见解。
    Romdhane L、Kefi S、Mezzi N、Abassi N、Jmel H、Roddhane S、Shan J、Chouchane L、Abdelhak S。 Romdhane L等人。 科学报告2024年2月26日;14(1):4654. doi:10.1038/s41598-024-54749-8。 科学报告2024。 PMID:38409353 免费PMC文章。
  • 骨肉瘤多组学景观和亚型。
    Tang S、Roberts RD、Cheng L、Li L。 Tang S等人。 癌症(巴塞尔)。2023年10月13日;15(20):4970. doi:10.3390/cancers15204970。 癌症(巴塞尔)。2023 PMID:37894336 免费PMC文章。
  • 抑郁症的病理生理学、复发风险预测和使用全基因组分析的共病精神疾病。
    Als TD、Kurki MI、Grove J、Voloudakis G、Therrien K、Tasanko E、Nielsen TT、Naamanka J、Veerapen K、Levey DF、Bendl J、Bybjerg-Grauholm J、Zeng B、Demontis D、Rosengren A、Athanasiadis G、Bkved-Hansen M、Qvist P、Bragi Walters G、Thorgeirsson T、Stefánsson H、Musliner KL、Rajagopal VM、Farajzadeh L、Thirstrup J、Vilj-almsson BJ、McGrath J J、,Mattheisen M、Meier S、Agerbo E、Stefánsson K、Nordentoft M、Werge T、Hougaard DM、Mortensen PB、Stein MB、Gelernter J、Hovatta I、Roussos P、Daly MJ、Mors O、Palotie A、Borglum AD。 Als TD等人。 《国家医学》,2023年7月;29(7):1832-1844. doi:10.1038/s41591-023-02352-1。Epub 2023年7月18日。 《国家医学》,2023年。 PMID:37464041 免费PMC文章。
  • 癌症非整倍体的形成主要取决于对肿瘤适合性的影响。
    Shih J、Sarmashghi S、Zhakula-Kostadinova N、Zhang S、Georgis Y、Hoyt SH、Cuoco MS、Gao GF、Spurr LF、Berger AC、Ha G、Rendo V、Shen H、Meyerson M、Cherniack AD、Taylor AM、Beroukhim R。 Shih J等人。 自然。2023年7月;619(7971):793-800. doi:10.1038/s41586-023-06266-3。Epub 2023年6月28日。 自然。2023 PMID:37380777 免费PMC文章。
  • 评估使用人类染色体尺度长度变异计算的遗传风险评分,以预测乳腺癌。
    Ko C、Brody JP。 Ko C等人。 人类基因组学。2023年6月16日;17(1):53。doi:10.1186/s40246-023-00482-8。 人类基因组学。2023 PMID:37328908 免费PMC文章。

工具书类

    1. Rabbee N,速度TP。affymetrix SNP阵列的基因型调用算法。生物信息学。2006;22:7–12.-公共医学
    1. Nicolae DL、Wu X、Miyake K、Cox NJ。GEL:一种使用经验似然的新型基因型调用算法。生物信息学。2006;22:1942–1947.-公共医学
    1. McCarroll SA等。人类基因组中常见的缺失多态性。自然遗传学。2006;38:86-92。-公共医学
    1. Conrad DF、Andrews TD、Carter NP、Hurles ME、Pritchard JK。人类基因组中缺失多态性的高分辨率调查。自然遗传学。2006;38:75–81.-公共医学
    1. McCarroll SA,Altshuler DM。人类疾病的拷贝数变异和关联研究。自然遗传学。2007;39(补充):S37–S42。-公共医学

出版物类型

LinkOut-更多资源