摘要

动机:全基因组表达数据的聚类分析DNA微阵列杂交研究已被证明是一种有用的工具用于识别生物相关的基因组和样品。在本论文中,我们重点讨论了几个重要问题与尚未完全实现的聚类算法相关研究。

结果:我们为基于时间序列的基因表达谱聚类模拟退火过程。通常,该算法保证最终找到基因的全局最优分布集群。我们引入了一个迭代方案,用于评估定量地确定每个特定数据的最佳聚类数量设置。该方案基于常规使用的标准方法统计测试。基本思想是组织搜索同时优化簇数基因在簇上的分布。的效率提出的算法已通过反向评估工程实验,即正确的已知基因在簇上的分布先验的. The这项统计上严格的测试表明该算法将超过90%的基因放入正确的簇中。最后,该算法在实际基因表达数据上进行了测试(酵母细胞周期中的表达变化)基因表达的基本模式和基因的分配从许多先前的研究中可以很好地理解到集群。

可用性:实现算法可根据作者的要求提供。

联系人:alex_lukashin@biogen.com

*

通信对象地址。

此内容仅以PDF格式提供。