普拉斯克

PLASQ:一种基于广义线性模型的从SNP阵列数据确定癌细胞等位基因剂量的方法。人类癌症在很大程度上是由基因突变引起的。这种突变的一类是拷贝数多态性,由每个细胞每个常染色体的两个拷贝与正常二倍体的偏差组成。我们描述了一种探针级等位基因特异性定量(PLASQ)程序,从单核苷酸多态性(SNP)微阵列数据确定癌细胞中每个亲本染色体的拷贝数贡献。我们的方法基于一个广义线性模型,它利用了阵列上探针的新分类。作为这种分类的结果,我们能够使用为此目的而设计的期望最大化算法将模型拟合到数据中。我们展示了一个适用于各种单元类型的数据的强大模型。在正常的二倍体样本中,PLASQ可以很高的准确率进行基因分型。此外,我们还可以提供癌症样本的广义基因型(例如,扩增SNP的CCCCT)。我们的方法在多种肺癌细胞系和肿瘤上得到了说明,并且通过独立的计算和实验手段验证了一些事件。包含这些方法的R软件包是免费提供的。