用于成对全局对齐的序列内部间隙的间隙开放惩罚和间隙扩展惩罚在逐步调整阶段。
用于成对全局对齐的序列末端间隙的间隙开放惩罚和间隙扩展惩罚在逐步调整阶段。
使用RPS-BLAST查找查询序列中的保守域以指导对齐。序列与保守序列相匹配域将转换为成对对齐约束。匹配相同的输入序列的范围在最后的多重比对中,保守域将相互对齐。我们强烈建议检查这个盒子。如果希望所有序列都与相同的保守域或不匹配任何保守域。COBALT针对以下情况进行了优化:序列与同一域匹配(请参见查询聚类(见下文)。 注:在其他情况下,取消选中此框将导致校准较差。
输入序列的成对局部对齐中接受BLAST-P命中的E值阈值。已接受的匹配将转换为成对对齐约束。成对局部对齐的输入范围序列将在多重对齐中相互对齐。如果非常不同,可以增加E值使用序列。 注:更改此值可能会显著影响结果路线的质量。
在渐进对齐和重新对齐输入序列的第一次迭代后,使用这些信息。取消选中此框将减少计算时间,但也将导致较差的对齐(尤其是如果使用查询群集复选框)。我们强烈建议选中此框。
通过使用相似序列的簇来减少计算时间。使用集群背后的思想是约束不要为非常相似的序列的对齐提供信息。然后是计算密集型任务对于许多序列,可以避免识别保守域和一致约束集。集群使用基于无对齐k-mer计数的方法可以找到相似的序列。见Edgar RC,核酸研究16:380-5, 2004,PMID:14729922用于基于k-mer计数的序列相似性。仅计算集群代表的约束。集群内序列将使用组合局部和全局对齐。我们建议查找保留列并重新计算对齐方式选项(如上)是也已选中。我们建议使用此选项来对齐BLAST结果,并且当输入序列的子集期望共享保守域。对于不希望共享保守域且预计有非常短的成对局部对齐。
用于基于k-mer计数的序列相似性计算的单词(k-mer)中的字母数。较小的单词将使序列比较大的单词更相似。
集群中两个序列之间允许的最大距离。该阈值防止COBALT形成集群o无关序列。两个序列之间的距离计算为两个序列中出现的单词的分数长序列中所有单词的数量(类似于Edgar RC,核酸研究16:380-5, 2004,PMID:14729922).该距离高估了对齐序列中不同残基的指数比例(见图有关详细信息,请参阅上述文件)。此阈值的允许范围介于0和1之间。较小的值会产生更多的簇,因此会产生更多多重对齐中使用的基于域的保守约束。较大的值会导致较少的簇和因此,在多重比对中使用的域信息较少。