ClustalW基于ClustalV并包含一些改进。中使用的方法ClustalV是Feng和Doolittle(1987)方法的修改版本根据初始值中的分支顺序,在越来越大的组中的序列系统发育树。这种方法允许将计算可牵引性和灵敏度。
早期路线中产生的间隙位置将一直保留到后期阶段。这是合理的,因为在比较相关序列不应移动,因为稍后会与更远的序列对齐相关序列。在每个对齐阶段,对齐两组已经对齐的序列。这是使用动态编程算法完成的,其中允许在每个序列中每个对齐位置出现的残留物有助于校准分数。Dayhoff(1978)PAM矩阵用于蛋白质比较。
ClustalV中使用的算法的详细信息已在Higgins和夏普(1989)。这是希金斯早先发表的算法的改进版和夏普(1988)。首先,计算每对顺序。这是使用Wilbur和利普曼(1983)。然后,这些分数用于计算“导向树”或树状图,它将告诉多重对齐阶段对齐最终多重对齐的顺序。这个“导向树”是使用斯内斯和索卡尔(1973)的UPGMA方法进行计算。UPGMA是一个别致的名字Sokal和Michener发明的一种平均连锁聚类分析(1958).
计算树状图后,序列越来越大组。在每个校准阶段,我们使用Myers和Miller(1988)的算法最佳排列。这个算法是Gotoh算法的一个非常节省内存的变体算法(Gotoh,1982)。正是由于这个算法,ClustalV才能够工作微型计算机。每一条路线都由两条路线组成,使用什么我们称之为“剖面对齐”。