×

有效计算DNA拷贝数数据分析的区间分数。 (英语) Zbl 1119.92325号

Miyano,Satoru(编辑)等人,《计算分子生物学研究》。第九届国际年会,RECOMB 2005,美国马萨诸塞州剑桥,2005年5月14日至18日。诉讼程序。柏林:施普林格出版社(ISBN 3-540-25866-3/pbk)。计算机科学3500课堂讲稿。生物信息学讲义,83-100(2005)。
摘要:背景。DNA扩增和缺失是癌症基因组的特征,通常与疾病进化有关。用于测量这些DNA拷贝数变化的基于微阵列的技术使用阵列DNA元素(BAC、cDNA或寡核苷酸)的荧光比率来提供基因组位置方面的高分辨率信号。然后对这些数据进行进一步分析,以绘制畸变和边界,并确定具有生物学意义的结构。
方法。我们开发了一个统计框架,可以将几个DNA拷贝数数据分析问题转换为信号实值向量上的优化问题。优化问题的最简单形式是寻求在输入向量的所有子区间I上最大化\(\varphi(I)=\sum-v_I/\sqrt{|I|}\)。针对这个问题,我们提出并证明了一个线性时间近似方案。也就是说,一个具有时间复杂度的进程\(O(n(epsilon^{-2})\),它输出的间隔\(varphi(I)\)至少为\(\text{Opt}/\alpha(\epsilon)\。我们进一步开发了实际实现,将朴素二次方法的性能提高了几个数量级。我们讨论了最优区间的性质以及它们如何应用于算法性能。
示例。我们根据合成的以及公开的DNA拷贝数数据对我们的算法进行基准测试。我们展示了这些方法用于识别单个样本中的畸变以及乳腺癌样本的固定集合和子集中的常见畸变。
关于整个系列,请参见[Zbl 1073.92504号].

MSC公司:

92C40型 生物化学、分子生物学
92 C50 医疗应用(通用)
2008年9月 生物学问题的计算方法
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部