PennCNV:一种用于全基因组SNP中高分辨率拷贝数变化检测的集成隐马尔可夫模型基因分型数据

  1. 王凯(Kai Wang)1,
  2. 李明耀2,
  3. 德克斯特·哈德利1,,
  4. 刘瑞(Rui Liu)1,
  5. 约瑟夫·格莱斯纳4,
  6. 斯特朗F.A.格兰特4,
  7. 哈科·哈科纳森4,以及
  8. 马贾·布坎1,5
  1. 1宾夕法尼亚大学遗传学系,费城,宾夕法尼亚19104,美国;
  2. 2宾夕法尼亚大学生物统计学系,美国宾夕法尼亚州费城,19104;
  3. 宾夕法尼亚大学生物系,费城,宾夕法尼亚19104,美国;
  4. 4美国宾夕法尼亚州费城儿童医院应用基因组中心,19104

摘要

需要对拷贝数变化(CNV)进行全面识别和编目,以提供人类的完整视图遗传变异。在以前的实验设计中,CNV检测的分辨率被限制为几十或数百千基。这里我们提出了一种基于隐马尔可夫模型(HMM)的PennCNV方法,用于CNV的千基分辨率检测来自Illumina高密度SNP基因分型数据。该算法包含多个信息源,包括每个SNP标记的信号强度和等位基因强度比、相邻SNP之间的距离、等位基因频率SNP,以及可用的系谱信息。我们将PennCNV应用于112个HapMap个体的基因分型数据;平均而言,我们检测到每个个体约27个CNV,平均大小约为12 kb。排除淋巴母细胞中常见的重排在细胞系中,未在亲本中检测到的子代中的CNV比例(CNV-NDP)为3.3%。我们的结果证明了可行性通过高密度SNP基因分型对CNV进行全基因组精细定位。

脚注

  • 5通讯作者。

    5电子邮件布坎{位于}pobox.upenn.edu; 传真:(215)573-2041。

  • [补充材料可在线获取,网址为网址:www.genome.org。PennCNV软件可从http://www.neurogenome.org/cnv/penncnv.]

  • 文章在印刷前在线发布。文章和发布日期为http://www.genome.org/cgi/doi/10.1101/gr.6861907

  • 6AGRE财团:Dan Geschwind,加州大学洛杉矶分校;Maja Bucan,宾夕法尼亚大学,费城,宾夕法尼亚州;W.特德Brown,N.Y.S.发育障碍基础研究所,纽约州斯塔顿岛;Rita M.Cantor,加州大学洛杉矶分校Medicine,加利福尼亚州洛杉矶;约翰·康斯坦蒂诺,密苏里州圣路易斯华盛顿大学医学院;T.Conrad Gilliam,芝加哥大学,伊利诺伊州芝加哥;玛莎·赫伯特,哈佛医学院,马萨诸塞州波士顿;Clara Lajonchere,立即治愈自闭症/自闭症演讲,加利福尼亚州洛杉矶;David H.Ledbetter,佐治亚州亚特兰大埃默里大学;Christa Lese-Martin,亚特兰大埃默里大学,GA;Janet Miller,立即治愈孤独症/孤独症演讲,加利福尼亚州洛杉矶;Stanley F.Nelson,加州大学洛杉矶分校医学院,CA;Gerard D.Schellenberg,华盛顿大学,西雅图,华盛顿州;Carol A.Samango-Sprouse,乔治华盛顿大学,华盛顿特区;Sarah Spence,加州大学洛杉矶分校,加利福尼亚州洛杉矶;马萨诸塞州纽黑文市耶鲁大学马修·斯泰尔分校;马萨诸塞州Rudolph E.Tanzi马萨诸塞州波士顿综合医院。

    • 收到日期:2007年6月29日。
    • 2007年9月5日接受。
| 目录

这篇文章

  1. 基因组研究。 17:1665-1674 版权所有©2007,冷泉港实验室出版社

文章类别

相关内容

分享

预打印服务器