正则表达式计数

Regexpcount,一个用于计算正则表达式和单词问题的符号包。在以前的一部作品中[P.Nicodème,B.Salvy和P.Flajolet,Theor。计算机。科学。与规则词匹配的马尔可夫文本(或由106ZBL算法生成的规则词,由106ZBL算法生成,或与规则词匹配)。在这项工作中,这些算法被扩展到两个目的:确定不同模体同时计数的统计信息,以及在可能受约束的模型中计算与模体第一次匹配的等待时间。此扩展还处理包含错误的匹配项。该包已完全实现,并允许访问高级和低级命令。我们还考虑了一个与实际生物学问题相对应的例子:获得基因组(马尔科夫序列)中大小为8的单词匹配的统计数据,知道一个名为Chi的(过度代表的DNA保护)模式发生了给定的次数。