×

寻求更有效的方法来解决正则表达式重字符串约束。 (英语) Zbl 1512.68308号

摘要:字符串解算器在字符串繁重程序的形式分析中的广泛使用导致了对更高效、更可靠的技术的日益增长的需求,这些技术可以在这种情况下应用。为字符串约束系统的(通常不可判定的)可满足性问题设计实用算法需要深入了解目标情况下的约束结构。本文首先研究了包含正则表达式成员谓词的相关基准,提取了一系列一阶逻辑理论,并证明了它们的可满足性问题的可判定性和不可判定性。此外,在理论结果的基础上,我们提出了一种针对正则表达式成员谓词上的无量词一阶理论和字符串长度上的线性算法的新的长度软件求解算法。我们在Z3定理证明器中实现并评估了该算法和相关的启发式算法。除了导致此算法的理论方面之外,支持此算法的一个关键见解是,真实世界的正则表达式和字符串公式包含大量关于字符串长度上下限的信息,并且可以非常有效地使用这些信息来简化表示正则表达式的自动机上的操作。此外,我们还提出了一些新的通用启发式算法,例如前缀/后缀方法,可以用于使各种正则表达式求解算法在实践中更加高效。我们通过对57256个正则重实例的大型和多样化基准进行广泛的经验评估,展示了我们的算法和启发式的威力,其中近75%来自工业应用程序或由其他求解器开发人员贡献。在这个基准上,我们的解算器优于其他五个最先进的字符串解算器。

理学硕士:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 比约纳,N。;蒂尔曼,N。;Voronkov,A.,字符串操作程序的路径可行性分析,(国际系统构建和分析工具和算法会议(2009),施普林格),307-321·Zbl 1234.68070号
[2] Redelinghuys,G。;维瑟,W。;Geldenhuys,J.,带字符串程序的符号执行,(《南非计算机科学家和信息技术学家学会会议论文集》,南非计算机科学家与信息技术学家协会会议论文集,SAICSIT’12(2012)),139-148
[3] Saxena,P.公司。;Akhawe,D。;Hanna,S。;毛,F。;McCamant,S。;Song,D.,JavaScript的符号执行框架,(2010年IEEE安全与隐私研讨会(2010),IEEE),513-528
[4] Cve,常见漏洞和风险(2021年)
[5] 布尔坦,T。;Yu,F。;Alkhalaf,M。;Aydin,A.,软件验证与安全的字符串分析(2017),施普林格
[6] 巴尔扎罗蒂,D。;科瓦,M。;Felmetsger,V。;Jovanovic,N。;柯达,E。;克鲁格尔,C。;Vigna Saner,G.,《撰写静态和动态分析以验证web应用程序中的卫生处理》,(2008年IEEE安全与隐私研讨会(2008年)(2008),IEEE),387-401
[7] Makanin,G.S.,自由半群中方程的可解性问题,Sbornik:数学,32,2,129-198(1977)·Zbl 0396.20037号
[8] Jeż,A.,《非确定性线性空间中的字方程》(Proc.ICALP 2017)。程序。ICALP 2017,LIPIcs,第80卷(2017),Dagstuhl-Leibniz Zentrum für Informatik),95:1-95:13·Zbl 1442.68094号
[9] Abdulla,宾夕法尼亚州。;阿提格,M.F。;Chen,Y.-F。;霍利克,L。;Rezine,A。;吕默,P。;Stenman Norn,J.,《字符串约束的smt求解器》(计算机辅助验证国际会议(2015),施普林格),462-469
[10] Diekert,V.,Makanin的算法,(Lothaire,Monsieur,单词代数组合学,第90卷。单词代数组合学,第90卷,数学及其应用百科全书,第90(2002)卷,剑桥大学出版社,387-442·Zbl 1001.68093号
[11] 戴,J.D。;加内什,V。;何,P。;Manea,F。;Nowotka,D.,《单词方程的可满足性:可判定和不可判定理论》,(Potapov,I.;Reynier,P.,《可达性问题——第十二届国际会议》,可达性问题-第十二届世界会议,RP 2018。可达性问题-第12届国际会议。可达性问题——第十二届国际会议,RP 2018,会议记录,第11123卷(2018),Springer),15-29·Zbl 1515.68256号
[12] Amadini,R.,《字符串约束求解调查》,ACM Compute。调查。,55,1(2021年11月)
[13] Liang,T。;北齐斯卡里泽。;雷诺兹,A。;Tinelli,C。;Barrett,C.,《无界弦上规则成员和长度约束的决策程序》,(组合系统的边界——第十届国际研讨会。组合系统的边境——第十次国际研讨会,FroCoS 2015,波兰弗罗茨瓦夫,2015年9月21日至24日。组合系统的前沿——第十届国际研讨会。联合系统的前沿——第十届国际研讨会,FroCoS 2015,波兰弗罗茨瓦夫,2015年9月21日至24日,会议记录(2015),135-150·Zbl 1471.68119号
[14] M.Berzish。;加内什,V。;Zheng,Y.,Z3str3:具有理论感知启发式的字符串解算器,(2017计算机辅助设计(FMCAD)形式化方法(2017),IEEE),55-59
[15] 特里恩,M.-T。;朱德华。;Jaffar,J.,S3:web应用程序漏洞检测的符号字符串解算器,(2014年ACM SIGSAC计算机和通信安全会议论文集(2014)),1232-1243
[16] 基辅,A。;加内什,V。;郭培杰。;Hooimeijer,P。;Ernst,M.D.,Hampi:字符串约束求解器,(第十八届软件测试与分析国际研讨会论文集(2009),ACM),105-116
[17] Aydin,A。;Bang,L。;Bultan,T.,基于自动机的字符串约束模型计数,(计算机辅助验证:第27届国际会议。计算机辅助验证,第27届世界会议,2015年7月18日至24日,美国加利福尼亚州旧金山,CAV 2015。计算机辅助验证:第27届国际会议。计算机辅助验证:第27届国际会议,CAV 2015,美国加利福尼亚州旧金山,2015年7月18日至24日,会议记录,第一部分(2015),Springer International Publishing:Springer国际出版社Cham),255-272·兹比尔1496.68254
[18] Chen,T。;M.海牙。;Lin,A.W。;吕默,P。;Wu,Z.,具有复杂操作的字符串操作程序的路径可行性决策程序,ACM编程语言会议录。《美国计算机学会程序设计语言会议录》,POPL,3,第49条pp.(2019)
[19] Chen,T。;M.海牙。;He,J。;胡,D。;Lin,A.W。;吕默,P。;Wu,Z.,整数数据类型字符串操作程序路径可行性的决策程序,(Hung,D.V.;Sokolsky,O.,《验证与分析自动化技术——第18届国际研讨会》,《验证和分析自动化技术》,第18届国际研讨会,2020年10月19-23日,越南河内,ATVA 2020。验证和分析自动化技术——第18届国际研讨会。验证和分析自动化技术——第18届国际研讨会,ATVA 2020,越南河内,2020年10月19-23日,计算机科学论文集,第12302卷(2020),施普林格),325-342·Zbl 1517.68074号
[20] 库尔钦斯基,M。;Manea,F。;诺沃特卡,D。;Poulsen,D.B.,ZaligVinder:字符串解算器的通用测试框架,J.Softw。进化。流程,第2400条,第(2021)页
[21] Lin,A.W。;Barceló,P.,《用词方程和变换器解决字符串:走向分析突变XSS的逻辑》(Bodík,R。;Majumdar,R.,第43届ACM SIGPLAN-SIGACT编程语言原理研讨会论文集。第43届ACM SIGPLAN-SIGCT编程语言原理年度研讨会论文集,POPL 2016,美国佛罗里达州圣彼得堡,2016年1月20日至22日(2016),ACM),123-136·Zbl 1347.03060号
[22] Lin,A.W。;Majumdar,R.,《带长度约束的二次字方程、计数器系统和带可除性的presburger算法》(Lahiri,S.K。;Wang,C.,验证和分析自动化技术——第16届国际研讨会。验证和分析自动化技术第16届国际研讨会,2018年10月7日至10日,美国加利福尼亚州洛杉矶,ATVA 2018。验证和分析自动化技术——第16届国际研讨会。用于验证和分析的自动化技术——第16届国际研讨会,2018年10月7日至10日,美国加利福尼亚州洛杉矶市,ATVA 2018,计算机科学会议记录,第11138卷(2018),Springer),352-369·Zbl 1517.68320号
[23] De Moura,L。;Bjørner,N.,Z3:一个高效的SMT求解器,(TACAS(2008),Springer),337-340
[24] 巴雷特,C。;康威,C.L。;威特斯,M。;哈达伦,L。;Jovanović,D。;King,T。;雷诺兹,A。;Tinelli,C.,CVC4(计算机辅助验证国际会议(2011年),施普林格),171-177
[25] 郑毅。;加内什,V。;Subramanian,S。;跳闸,O。;杜比,J。;Zhang,X.,字符串方程、正则表达式和长度约束求解器的有效搜索空间修剪,(计算机辅助验证-第27届国际会议。计算机辅助验证-27届国际会议,CAV 2015,美国加利福尼亚州旧金山,2015年7月18-24日。计算机辅助验证——第27届国际会议。计算机辅助验证-第27届国际会议,CAV 2015,美国加利福尼亚州旧金山,2015年7月18日至24日,会议记录,第一部分(2015),235-254
[26] Abdulla,宾夕法尼亚州。;阿提格,M.F。;Chen,Y.-F。;Diep,B.P。;杜比,J。;Janků,P。;林,H.-H。;霍利克,L。;Wu,W.-C.,字符串数转换的有效处理,(第41届ACM SIGPLAN编程语言设计与实现会议论文集(2020)),943-957
[27] D'Antoni,L.,Automatark automata基准(2018年)
[28] M.Berzish。;戴,J.D。;加内什,V。;库尔钦斯基,M。;Manea,F。;莫拉·F。;Nowotka,D.,《涉及正则成员谓词的字符串理论:从实践到理论再到实践》(单词组合数学国际会议(2021年),施普林格)·Zbl 1528.68425号
[29] M.Berzish。;库尔钦斯基,M。;莫拉·F。;Manea,F。;戴,J.D。;诺沃特卡,D。;Ganesh,V.,字符串长度上正则表达式和线性算法的SMT求解器,(计算机辅助验证(2021),Springer),289-312·Zbl 1493.68182号
[30] Kulczynski,M.,《轻量级字符串求解:高效正确求解字符串约束的方法》(2022),计算机科学系自出版:计算机科学系基尔自出版,博士论文
[31] 埃宾豪斯,H.-D。;Flum,J.,有限模型理论(2005),Springer Science&Business Media
[32] 布洛茨基,D。;莫拉·F。;M.Berzish。;郑毅。;卡比尔,I。;Ganesh,V.,Stringfuzz:字符串求解器的模糊器,(国际计算机辅助验证会议(2018),施普林格),45-51
[33] 郑毅。;加内什,V。;Subramanian,S。;跳闸,O。;M.Berzish。;杜比,J。;Zhang,X.,Z3str2:字符串、正则表达式和长度约束的高效求解器,Form.Methods Syst。设计。,1-40 (2016)
[34] 托姆,J。;Shar,L.K。;Bianculli,D。;Briand,L.,《通过安全切片和混合约束求解对web应用程序进行有效注入漏洞分析的集成方法》,IEEE Trans。柔和。工程师,46,2,163-195(2018)
[35] 霍利克,L。;Janků,P。;Lin,A.W。;吕默,P。;Vojnar,T.,高效解决串联和转换器的字符串约束,美国计算机学会编程语言论文集。《美国计算机学会程序设计语言会议录》,POPL,2,第4条pp.(2017)
[36] Yu,F。;Alkhalaf,M。;Bultan,T.,STRANGER:一种用于PHP的基于自动机的字符串分析工具,(《第16届系统构建和分析工具和算法国际会议论文集》,第16届国际系统构建与分析工具与算法会议论文集,TACAS’10(2010),斯普林格·弗拉格:斯普林格尔·弗拉格柏林,海德堡),154-157
[37] Kozen,D.,自然证明系统的下限,(FOCS(1977),IEEE计算机学会),254-266
[38] Garey,M.R。;Johnson,D.S.,《计算机与不可纠正性:NP-完备性理论指南》(1979),W.H.Freeman·Zbl 0411.68039号
[39] Abdulla,宾夕法尼亚州。;阿提格,M.F。;陈,Y。;霍利克,L。;Rezine,A。;吕默,P。;Stenman,J.,Norn:字符串约束的SMT解算器,(Kroening,D.;Pasareanu,C.S.,Proc.CAV,第9206卷(2015),Springer),462-469
[40] Chrobak,M.,有限自动机和一元语言,Theor。计算。科学。,47, 3, 149-158 (1986) ·兹伯利0638.68096
[41] Gawrychowski,P.,《Chrobak范式重访及其应用》(CIAA.CIAA,计算机科学讲义,第6807卷(2011),Springer),142-153·Zbl 1297.68130号
[42] Hospodár,M。;吉尔拉斯科娃,G。;Mlynárcik,P.,《关于愚弄集作为非确定性复杂性下限有效工具的调查》,(《下限与更高海拔之间的冒险》,《下限与高海拔之间冒险》,计算机科学讲义,第11011卷(2018),斯普林格),17-32·Zbl 1514.68103号
[43] Stockmeyer,L.J.,《自动机理论和逻辑中决策问题的复杂性》(1974年),麻省理工学院博士。论文
[44] 加内什,V。;Berezin,S。;Dill,D.L.,通过模型检查和与其他方法的比较来决定预汉堡算法,(计算机辅助设计中的形式化方法,第四届国际会议。计算机辅助设计中的形式化方法,第四届国际会议,FMCAD 2002,美国俄勒冈州波特兰,2002年11月6-8日。计算机辅助设计的形式方法,第四届国际会议。计算机辅助设计中的形式方法,第四届国际会议,FMCAD 2002,波特兰,俄勒冈州,美国,2002年11月6-8日,会议记录(2002),171-186·Zbl 1019.68591号
[45] 斯坦福,C。;韦恩斯,M。;Björner,N.,有效求解扩展正则表达式约束的符号布尔导数(2020),微软技术代表MSR-TR-2020-25
[46] Abdulla,宾夕法尼亚州。;阿提格,M.F。;Chen,Y.-F。;Diep,B.P。;霍利克,L。;Rezine,A。;Rümmer,P.,Flatten and conquer:a framework for efficient analysis of string constraints,(第38届ACM SIGPLAN Conference on Programming Language Design and Implementation会议论文集。第38届美国计算机学会SIGPLAN会议论文集编程语言设计与实现,PLDI 2017(2017),美国计算机学会:美国纽约ACM),602-617
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。