×

通过矩阵分解压缩正则表达式的DFA表。 (英语) 兹比尔1297.68152

Domaratzki,Michael(编辑)等人,《自动机的实现和应用》。2010年8月12日至15日,加拿大温尼伯CIAA 2010第15届国际会议。修订了选定的论文。柏林:施普林格出版社(ISBN 978-3-642-18097-2/pbk)。计算机科学课堂讲稿6482282-289(2011)。
摘要:近年来,由于许多网络安全系统对深度包检测(DPI)的迫切需求,正则表达式匹配成为了一个研究热点。确定性有限自动机(DFA)可以识别一组正则表达式,通常用于满足网络流量实时处理的需要。然而,DFA的巨大内存使用量甚至使它无法应用于中等大小的模式集。在本文中,我们提出了一种用于DFA表压缩的矩阵分解方法。该方法的基本思想是将DFA表分解为行向量、列向量和稀疏矩阵的和,所有这些都占用很少的空间。在典型规则集上的实验表明,该方法显著减少了内存使用量,并且仍然以较快的搜索速度运行。
有关整个系列,请参见[Zbl 1206.68008号].

MSC公司:

65年第68季度 形式语言和自动机
65楼30 其他矩阵算法(MSC2010)

软件:

用鼻子哼哼
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 汤普森,K.:编程技术:正则表达式搜索算法。ACM通讯11(6),419–422(1968)·Zbl 0164.46205号 ·数字对象标识代码:10.1145/363347.363387
[2] Myers,E.W.:一种用于正则表达式模式匹配的四俄罗斯人算法。ACM杂志39(2),430–448(1992)·Zbl 0799.68104号 ·数字对象标识代码:10.1145/128749.128755
[3] Baeza-Yates,R.A.,Gonnet,G.H.:快速文本搜索正则表达式或自动搜索。ACM杂志43(6),915-936(1996)·Zbl 0885.68048号 ·doi:10.1145/235809.235810
[4] Navarro,G.,Raffinot,M.:用于快速正则表达式搜索的紧凑DFA表示。收录:Brodal,G.S.,Frigioni,D.,Marchetti-Spaccamela,A.(编辑)WAE 2001。LNCS,第2141卷,第1-12页。施普林格,海德堡(2001)·Zbl 1002.68634号 ·doi:10.1007/3-540-44688-5_1
[5] Navarro,G.,Raffinot,M.:快速简单的字符类和有界间隙模式匹配,应用于蛋白质搜索。摘自:《第五届国际计算分子生物学年会论文集》,第231-240页(2001年)·数字对象标识代码:10.1145/369133.369220
[6] Champarnaud,J.-M.,Coulon,F.,Paranthoen,T.:正则表达式搜索的紧凑快速算法。实习生。计算机杂志。数学。 81(4) (2004) ·Zbl 1093.68595号
[7] Yu,F.,Chen,Z.,Diao,Y.:用于深度数据包检查的快速且高效的正则表达式匹配。摘自:2006年ACM/IEEE网络和通信系统体系结构研讨会论文集,第93-102页(2006)·doi:10.1145/1185347.1185360
[8] Kumar,S.、Dharmapurikar,S.,Yu,F.、Crowley,P.、Turner,J.:加速多个正则表达式匹配以进行深度包检查的算法。ACM SIGCOMM计算机通信评论36(4),339–350(2006)·doi:10.1145/1151659.1159952
[9] Becchi,M.,Crowley,P.:加速正则表达式计算的改进算法。摘自:第三届ACM/IEEE网络和通信系统体系结构研讨会论文集,第145-154页(2007年)·数字对象标识代码:10.1145/123548.1323573
[10] Ficara,D.、Giordano,S.、Procissi,G.、Vitucci,F.、Antichi,G.和Pietro,A.D.:用于快速正则表达式匹配的改进DFA。ACM SIGCOMM计算机通信评论38(5),29–40(2008)·Zbl 05746845号 ·doi:10.1145/1452335.1452339
[11] Smith,R.,Estan,C.,Jha,S.:XFA:使用扩展自动机进行更快的签名匹配。摘自:IEEE安全与隐私研讨会,奥克兰,第187-201页(2008年5月)·doi:10.1109/SP.2008.14
[12] Kumar,S.、Chandrasekaran,B.、Turner,J.、Varghese,G.:治疗失眠症、失忆症和失算症的正则表达式匹配算法。摘自:第三届ACM/IEEE网络和通信系统体系结构研讨会论文集,第155-164页(2007年)·数字对象标识代码:10.1145/123548.1323574
[13] Becchi,M.,Cadambi,S.:使用状态合并的高效内存正则表达式搜索。在:第26届IEEE国际计算机通信会议,第1064–1072页(2007年)·doi:10.1109/INFCOM.2007.128
[14] Majumder,A.,Rastogi,R.,Vanama,S.:数据流上的可伸缩正则表达式匹配。摘自:加拿大温哥华2008年ACM SIGMOD国际数据管理会议记录,第161-172页(2008)·doi:10.1145/1376616.1376635
[15] Bloom,B.H.:哈希编码中允许错误的时空权衡。ACM通信13(7),422–426(1970)·Zbl 0195.47003号 ·数字对象标识代码:10.1145/362686.3692
[16] http://l7-filter.sourceforge.net/
[17] http://www.snort.org/
[18] 网址:http://www.bro-ids.org/
[19] http://regex.wustl.edu/
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。