PennCNV:一种用于全基因组SNP中高分辨率拷贝数变化检测的集成隐马尔可夫模型基因分型数据
摘要
需要对拷贝数变化(CNV)进行全面识别和编目,以提供人类的完整视图遗传变异。在以前的实验设计中,CNV检测的分辨率被限制为几十或数百千基。这里我们提出了一种基于隐马尔可夫模型(HMM)的PennCNV方法,用于CNV的千基分辨率检测来自Illumina高密度SNP基因分型数据。该算法包含多个信息源,包括每个SNP标记的信号强度和等位基因强度比、相邻SNP之间的距离、等位基因频率SNP,以及可用的系谱信息。我们将PennCNV应用于112个HapMap个体的基因分型数据;平均而言,我们检测到每个个体约27个CNV,平均大小约为12 kb。排除淋巴母细胞中常见的重排在细胞系中,未在亲本中检测到的子代中的CNV比例(CNV-NDP)为3.3%。我们的结果证明了可行性通过高密度SNP基因分型对CNV进行全基因组精细定位。
脚注
-
↵5通讯作者。
↵5电子邮件布坎{位于}pobox.upenn.edu; 传真:(215)573-2041。
-
[补充材料可在线获取,网址为网址:www.genome.org。PennCNV软件可从http://www.neurogenome.org/cnv/penncnv.]
-
文章在印刷前在线发布。文章和发布日期为http://www.genome.org/cgi/doi/10.1101/gr.6861907
-
6AGRE财团:Dan Geschwind,加州大学洛杉矶分校;Maja Bucan,宾夕法尼亚大学,费城,宾夕法尼亚州;W.特德Brown,N.Y.S.发育障碍基础研究所,纽约州斯塔顿岛;Rita M.Cantor,加州大学洛杉矶分校Medicine,加利福尼亚州洛杉矶;约翰·康斯坦蒂诺,密苏里州圣路易斯华盛顿大学医学院;T.Conrad Gilliam,芝加哥大学,伊利诺伊州芝加哥;玛莎·赫伯特,哈佛医学院,马萨诸塞州波士顿;Clara Lajonchere,立即治愈自闭症/自闭症演讲,加利福尼亚州洛杉矶;David H.Ledbetter,佐治亚州亚特兰大埃默里大学;Christa Lese-Martin,亚特兰大埃默里大学,GA;Janet Miller,立即治愈孤独症/孤独症演讲,加利福尼亚州洛杉矶;Stanley F.Nelson,加州大学洛杉矶分校医学院,CA;Gerard D.Schellenberg,华盛顿大学,西雅图,华盛顿州;Carol A.Samango-Sprouse,乔治华盛顿大学,华盛顿特区;Sarah Spence,加州大学洛杉矶分校,加利福尼亚州洛杉矶;马萨诸塞州纽黑文市耶鲁大学马修·斯泰尔分校;马萨诸塞州Rudolph E.Tanzi马萨诸塞州波士顿综合医院。
-
- 收到日期:2007年6月29日。
- 2007年9月5日接受。
- 版权所有©2007,冷泉港实验室出版社