×

使用PQ树进行比较基因组学。 (英语) Zbl 1130.92301号

Apostolico,Alberto(编辑)等,组合模式匹配。2005年6月19日至22日在韩国济州岛举行的CPM 2005第16届年度研讨会。诉讼程序。柏林:施普林格出版社(ISBN 3-540-26201-6/pbk)。计算机科学课堂讲稿3537,128-143(2005)。
摘要:代表基因组上基因簇的字符串上的排列已被频繁研究,最大排列模式的概念在年被引入[R.埃雷斯,L.帕迪亚G.M.朗道,“自动发现聚类图案的组合方法”,Lect。注释计算。科学。2812, 139–150 (2003)]. 在本文中,我们提出了一种新的工具,使用PQ树来表示和检测多基因组中的基因簇:它简洁地描述了簇的内部结构和簇之间的关系,有助于从明显无意义的簇中筛选有意义的簇,并提供了一种自然而有意义的方式来可视化复杂簇。我们确定了一个最小一致性PQ树,并证明了它等价于一个最大(pi)模式[loc.cit.],并且PQ树的每个子图对应于一个非最大置换模式。我们提出了一个处理排列中多重性的一般方案,并给出了一个线性时间算法来构造最小一致性PQ树。此外,我们在全基因组数据集上演示了结果。在我们对人类和大鼠的整个基因组的分析中,我们发现了大约150万个常见基因簇,但只有大约500个最小一致性PQ树,并且,在大约15000个基因簇中,我们仅发现了大约450个最小一致的PQ树。此外,我们展示了这两种情况下功能相关基因的具体实例。
关于整个系列,请参见[Zbl 1076.68002号].

MSC公司:

92D10型 遗传学和表观遗传学
68兰特 单词组合学
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部