×

关于SAT实例类和使用SAT解算器进行可靠性能实验的方法。 (英语) Zbl 1100.68575号

摘要:最近一系列由一组最先进的SAT解题器和几类定义明确的问题实例组成的实验表明,解题器的性能存在显著的统计差异。对观测到的性能数据进行系统分析,所有这些数据都公开保存在Web上,揭示了我们将分布分为三大类:(1)以简单的测试为特征,(2)需要统计学家进行更深入的分析,(3)由于特定解算器达到超时限制而不完整。第一类包括两种众所周知的分布:正态分布和指数分布;我们使用简单的一阶准则来确定第二类,并将分布标记为近正态分布、近指数分布和重尾分布。我们预计,对于其中一些(如果不是大多数)的良好模型,可以找到符合广义伽马分布、威布尔分布或帕累托分布的参数。
我们的实验表明,大多数SAT求解器在许多等价类的问题实例上的执行时间(运行时)呈现正态或指数分布。这一发现表明,这些实验的基本数学框架可能与用于测试灯泡、空调机组等硬件组件的可靠性或寿命的框架完全相同。一批复制的硬件组件代表了SAT、,受控操作环境(a)代表SAT解算器(a),生存函数(mathcal R^a(x))(其中,(x)代表寿命)是可解性函数的补充,其中,(x\)可能代表运行时、含义、回溯等。如本文所示,目前可用的一组无关基准或随机生成的SAT实例无法可靠地测量SAT解算器的性能,无法控制它们的“硬度”。然而,本文中定义的等价类实例实际上是特定引用实例的复制实例。该方法不仅为确定性和随机SAT求解器的系统研究和可靠改进提供了一个通用平台,还支持引入和验证新的问题实例类。

MSC公司:

65年第68季度 算法和问题复杂性分析
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
62号05 可靠性和寿命测试
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] S.Baase和A.Van Gelder,《计算机算法》,第三版(Addison-Wesley,Reading,MA,2000)。
[2] G.E.P.Box、W.G.Hunter和J.S.Hunter.,《实验者统计:设计、数据分析和模型构建导论》(Wiley,1978)·Zbl 0394.62003号
[3] F.Brglez,评估CAD算法的实验设计:哪些改进是由于改进的启发式,哪些仅仅是由于偶然?,技术报告1998-TR@CBL-04-Brglez1998年4月,北卡罗来纳州罗利市,北卡罗莱纳州州立大学计算机科学系,CBL。也可在http://www.cbl.ncsu.edu/publications/#1998-TR@CBL-04-Brglez。
[4] F.Brglez和R.Drechsler,《CAD实验设计:ISCAS’99的上下文和新数据集》,收录于:Proc。IEEE 1999年电路与系统国际研讨会-ISCAS’99(1999年5月)。可以从访问重印http://www.cbl.ncsu.edu/publications/#I999-ISCAS Brglez公司。
[5] F.Brglez、X.Y.Li和M.Stallmann,《怀疑论者在SAT算法测试和基准测试中的作用》,摘自:Proc。第五届满意度测试理论与应用国际研讨会,http://www.cbl.ncsu.edu/publications网站/(2002年5月)。
[6] F.Brglez,M.F.Stallmann和X.Y.Li,SATbed——SAT实例类和算法的可靠性能实验环境,见:Proc。2003年SAT第六届国际可满足性测试理论与应用研讨会,意大利波托菲诺,S.M.Ligure编辑(2003年5月5日至8日)。修订版可在http://www.cbl.ncsu.edu/publications/。
[7] F.Brglez、M.Stallmann和X.Y.Li,SATbed主页:教程、用户指南、软件档案、SAT实例类档案和实验结果,http://www.cbl.ncsu.edu/OpenExperiments/SAT/ (2003).
[8] C.Coarfa、D.D.Demopoulos、A.S.M.Aguirre、D.Subramanian和M.Y.Vardi,《随机3-SAT:情节增厚》,载于《约束编程原理与实践》(2000)第143-159页·Zbl 1044.68746号
[9] S.Cook和D.Mitchell,《寻找可满足性问题的困难实例:一项调查》,http://dream.dai.ed.ac.uk/group/tw/sat/sat-survey3.ps (1997). ·Zbl 0889.68073号
[10] E.L.Crow、F.A.Davis和M.W.Maxfield,《统计手册》(纽约多佛,1960年)·Zbl 0092.35602号
[11] M.Davis、G.Logemann和D.Loveland,理论证明的机器程序,ACM通信5(7)(1962)394-397·Zbl 0217.54002号 ·数字对象标识代码:10.1145/368273.368557
[12] S.Davis和M.Putnam,《量化理论的计算程序》,《计算机协会杂志》7(3)(1960)201-215·Zbl 0212.34203号 ·数字对象标识代码:10.1145/321033.321034
[13] I.P.Gent和T.Walsh,《寻找满足感》,http://dream.dai.ed.ac.uk/group/tw/sat/sat-survey2.ps。 ·Zbl 0900.68178号
[14] D.Ghosh,为基于图形的NP-hard问题的启发式实验设计生成严格控制的等价类,博士论文,电气与计算机工程,北卡罗来纳州立大学,罗利,NC(2000年5月)。也可在http://www.cbl.ncsu.edu/publications/#2000-论文-PhD-Ghosh。
[15] D.Ghosh和F.Brglez,《实验设计电路突变体的等效类》,载《国际交响乐汇编》。电路与系统(ISCAS)(1999年5月至6月)。也可在http://www.cbl.ncsu.edu/publications/#1999-ISCAS-Ghosh。
[16] S.W.Golomb,《关于布尔函数的分类》,IRE Transactions On Information Theory 5(1959)176-186·doi:10.1109/TIT.1959.1057543
[17] C.P.Gomes、B.Selman和N.Crato,组合搜索中的重尾分布,收录于:约束编程的原理与实践(1997),第121-135页。
[18] J.Gu、P.Purdom、J.Franco和B.Wah,《可满足性(SAT)问题的算法:一项调查》,载于:《离散数学和理论计算机科学中的DIMACS系列》,第35卷(1997),第19-152页,http://dream.dai.ed.ac.uk/group/tw/sat/sat-survey.ps。 ·Zbl 0945.03040号
[19] N.C.Gupta和D.S,Nau,《论区块的复杂性——世界规划》,《人工智能》56(2-3)(1992)223-254·Zbl 0785.68046号 ·doi:10.1016/0004-3702(92)90028-V
[20] J.E.Harlow和F.Brglez,使用受控电路突变评估BDD封装的实验设计,收录于:Proc。计算机辅助设计形式方法国际会议(FMCAD’98),计算机科学讲稿,第1522卷(Springer,1998),第64-81页。也可从http://www.cbl.ncsu.edu/publications/#1998-FMCAD-哈洛·Zbl 0785.68046号
[21] J.E.Harlow和F.Brglez,BDD排序启发式的实验设计和评估,技术转让软件工具国际期刊:BDD专刊(2001年)·Zbl 1002.68584号
[22] E.Hirsch和A.Kojevnikov,《UnitWalk:使用单位子句消除指导的局部搜索的新SAT解算器》,2001年,PDMI预印本9/2001,圣彼得堡Steklov数学研究所(2001)·Zbl 1100.68621号
[23] J.胡克,《测试启发式:我们都错了》,《启发式杂志》1(1996)33-42·Zbl 0853.68155号 ·doi:10.1007/BF02430364
[24] J.N.Hooker,《Needed:算法的经验科学》,《运筹学》42(2)(1994)201-212·Zbl 0805.90119 ·doi:10.1287/opre.42.201
[25] H.H.Hoos和T.Stützle,《评估拉斯维加斯算法-陷阱和补救措施》,摘自:Proc。UAI-98(Morgan Kaufmann,San Mateo,CA,1998)第238-245页·Zbl 0217.54002号
[26] H.H.Hoos和T.Stützle,SAT的局部搜索算法:经验评估,《自动推理杂志》24(2000)·Zbl 0979.68030号
[27] H.H.Hoos和T.Stützle,SATLIB:SAT研究的在线资源,摘自:Proc。《SAT’2000》(IOS出版社,2000年)第283-292页,http://www.satlib.org。 ·Zbl 0979.68128号
[28] F.Jense,《电子元件可靠性:基础、建模、评估和保证》(Wiley,纽约,1996年)。
[29] N.Kapur、D.Ghosh和F.Brglez,《走向EDA中的新基准范式:等效类突变电路分布分析》,摘自:Proc。ACM国际物理设计研讨会(1997年4月)。
[30] H.Kautz、D.McAllester和B.Selman,命题逻辑中的编码计划,收录于:KR’96:知识表示和推理原理(1996),第374-384页。SATPLAN基准测试集可从http://sat.inesc.pt/benchmarks/cnf/satplan/。 ·Zbl 0805.90119
[31] X.Y.Li,M.F.Stallmann和F.Brglez,QingTing:使用有效切换策略和有效单位传播的本地搜索SAT解算器,in:Proc。《2003年SAT可满足性测试》,计算机科学讲义,第2919卷(2003),第53-68页。对Proc。第六届满意度测试理论与应用国际研讨会,意大利波托菲诺,S.M.Ligure编辑(2003年5月5日至8日)。可在http://www.cbl.ncsu.edu/publications/。 ·Zbl 1204.68205号
[32] H.Lilliefors,《关于均值未知指数分布的Kolmogorov-Smirnov检验》,《美国统计协会杂志》64(1969)387-389·doi:10.1080/01621459.1969.10500983
[33] J.P.Marques-Silva,《关于选择问题实例以评估可满足性算法》,in:Proc。ECAI人工智能经验方法研讨会(ECAI-EMAI),2000年·Zbl 0212.34203号
[34] D.A.McAllester、B.Selman和H.A.Kautz,局部搜索中不变量的证据,摘自:Proc。AAAI/IAAI(1997)第321-326页。
[35] D.Mitchell,关于基准和分析的评论,摘自:Proc。IJCAI-99实证人工智能研讨会(1999年)。
[36] M.Mitzenmacher,《幂律和对数正态分布生成模型简史》(Allerton,2001)·Zbl 1063.68526号
[37] M.Moskewicz、C.Madigan、Y.Zhao、L.Zhang和S.Malik,Chaff:设计一个高效的SAT求解器,收录于:IEEE/ACM设计自动化会议(DAC)(2001)。Chaff 1.0版可从以下网址获得http://www.ee.princeton.edu/chaff/zchaff/zcharff.2001.2.17.src.tar.gz。
[38] I.Olkin、L.J.Gleser和C.Derman,《概率、模型和应用》(纽约麦克米伦出版社,1960年)·Zbl 0428.60001号
[39] J.A.Osborne和T.A.Severini,基于综合似然函数的指数顺序统计模型推断,美国统计协会杂志95(2000)1220-1228·Zbl 1008.62052号 ·doi:10.1080/01621459.2000.10474322
[40] J.A.Osborne和T.A.Severini,指数顺序统计模型中模型评估的Lorenz曲线,《统计计算与模拟杂志》72(2002)87-97·doi:10.1080/00949650211423
[41] F.Prochan,观察到的故障率下降的理论解释,Technometrics 5(1963)375·doi:10.1080/00401706.1963.10490105
[42] Sat-Ex:围绕可满足性的实验网站,网址:http://www.lri.fr/simon/satex/satex.php3。
[43] SATLIB-可满足性库,网址:http://www.satlib.org (2003).
[44] SAT直播!SATisability问题的最新链接,网址:http://www.satlive.org。
[45] B.Selman、D.G.Mitchell和H.J.Levesque,《生成难满足性问题》,《人工智能》81(1-2)(1996)17-29·Zbl 1508.68347号 ·doi:10.1016/0004-3702(95)00045-3
[46] M.Stallmann,F.Brglez和D.Ghosh,最大图交叉数最小化的启发式和实验设计,in:Proc。第一届算法工程与实验研讨会(ALENEX 99)(1999年1月)。也可在http://www.cbl.ncsu.edu/publications/。 ·Zbl 1365.68360号
[47] M.Stallmann、F.Brglez和D.Ghosh,启发式,最大化二元图交叉中的实验对象和治疗评估,实验算法杂志(2001)。也可在http://www.cbl.ncsu.edu/publications/#2001-杰阿·斯塔尔曼·Zbl 1365.68360号
[48] M.A.Trick,《第二个DIMACS挑战测试问题》,摘自:《离散数学和理论计算机科学中的DIMACS系列》,第26卷(1993年),第653-657页。SAT基准测试集位于ftp://dimacs.rutgers.edu/pub/challenge/satisfailability。 ·Zbl 0875.68677号
[49] D.B.West,《图论导论》(Prentice-Hall,Englewood Cliffs,NJ,1996)·Zbl 0845.05001号
[50] J.Whittemore、J.Kim和K.Sakalah,SATIRE:一种新的增量可满足性引擎,发表于:IEEE/ACM设计自动化会议(DAC)(2001)。SATIRE 1.0.0版可从以下网址获得:http://andante.eecs.umich.edu/satire/satire.tgz。
[51] 张浩,SATO:一个有效的命题证明,载于:自动扣除会议(1997)第272-275页。SATO 3.2版可从以下网址获得ftp:/cs.uiowa.edu/pub/hzhang/sato/sato.tar.gz。 ·Zbl 1430.68427号
[52] H.Zhang和M.E.Stickel,《实施戴维斯·普特南方法》(Kluwer Academic,Dordrecht,2000年)·Zbl 0979.03012号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。