×

SAT求解器的基于学习率的分支启发式算法。 (英语) Zbl 1475.68348号

Creignou,Nadia(编辑)等人,《满意度测试的理论和应用——2016年SAT》。第19届国际会议,法国波尔多,2016年7月5-8日。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。9710, 123-140 (2016).
摘要:在本文中,我们提出了一个框架,将求解器分支启发式视为优化算法,其目标是最大化学习速率,定义为变量生成学习子句的倾向。通过将SAT求解器中的在线变量选择视为一个优化问题,我们可以利用各种优化算法,特别是机器学习中的算法,来设计有效的分支启发式。特别地,我们将变量选择优化问题建模为一个在线多臂盗贼,这是强化学习的特例,以学习分支变量,从而使求解器的学习速度达到最大。我们开发了一种分支启发式算法,我们称之为学习率分支或LRB,它基于一种著名的称为指数近因加权平均的多臂盗贼算法,并将其作为MiniSat和CryptoMiniSat.的一部分实现。我们将LRB技术升级为另外两种新的思想,通过考虑理性边速率和利用局部性来提高学习率。结果表明,在1975年应用程序和2009年至2014年SAT竞赛的硬组合实例上,LRB分支启发式比VSIDS和基于冲突历史(CHB)的分支启发式更快。我们还表明,使用LRB的CryptoMiniSat解决的实例比使用VSIDS的要多。这些实验表明,LRB在最新技术上有所改进。
关于整个系列,请参见[Zbl 1337.68009号].

理学硕士:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ansótegui,C.,Giráldez-Cru,J.,Levy,J.:SAT公式的社区结构。收录:Cimatti,A.,Sebastiani,R.(编辑)SAT 2012。LNCS,第7317卷,第410–423页。斯普林格,海德堡(2012)·Zbl 1273.68331号
[2] Audemard,G.,Simon,L.:预测现代SAT解题者的习得子句质量。摘自:《第21届人工智能国际Jont会议论文集》,2009年国际人工智能学会,第399-404页。Morgan Kaufmann Publishers Inc.,旧金山(2009)
[3] Audemard,G.,Simon,L.:精炼重启SAT和UNSAT战略。收录:Milano,M.(编辑)CP 2012。LNCS,第7514卷,第118-126页。斯普林格,海德堡(2012)·Zbl 06122834号
[4] Audemard,G.,Simon,L.:2013年SAT竞赛中的葡萄糖2.3。收录于:2013年SAT竞赛论文集,第42-43页(2013)
[5] Biere,A.:冲突驱动SAT解决程序的自适应重启策略。收录:Kleine Büning,H.,Zhao,X.(编辑)SAT 2008。LNCS,第4996卷,第28-33页。施普林格,海德堡(2008)·Zbl 1138.68533号
[6] Biere,A.:2010年SAT竞赛中的玲玲、普林格林、PicoSAT和PrecoSAT。FMV报告系列技术报告10(1)(2010)
[7] Biere,A.,Fröhlich,A.:评估CDCL变量评分方案。摘自:Heule,M.,Weaver,S.(编辑)SAT 2015。LNCS,第9340卷,第405-422页。斯普林格,海德堡(2015)。doi:10.1007/978-3-319-24318-4_29·Zbl 1471.68238号
[8] Brown,R.G.:预测需求的指数平滑法。操作。第5号决议,145-145(1957年)·Zbl 0173.47804号
[9] Cadar,C.,Ganesh,V.,Pawlowski,P.M.,Dill,D.L.,Engler,D.R.:EXE:自动生成死亡输入。摘自:《第13届ACM计算机和通信安全会议论文集》,CCS 2006,第322-335页。ACM,纽约(2006)
[10] Carvalho,E.,Marques-Silva,J.P.:使用奖励机制改进分支启发式。收录于:第七届满意度测试理论与应用国际会议论文集(2004年)
[11] Clarke,E.,Biere,A.,Raimi,R.,Zhu,Y.:使用可满足性解决的有界模型检查。形式方法系统。设计。19(1), 7–34 (2001) ·Zbl 0985.68038号
[12] Eén,n.,Sörensson,n.:可扩展SAT解决方案。收录:Giunchiglia,E.,Tacchella,A.(编辑)SAT 2003。LNCS,第2919卷,第502-518页。斯普林格,海德堡(2004)·Zbl 1204.68191号
[13] Erev,I.,Roth,A.E.:预测人们如何玩游戏:在具有独特混合策略均衡的实验游戏中强化学习。《美国经济》。修订版88(4),848–881(1998)
[14] Fröhlich,A.,Biere,A.,Wintersteiger,C.,Hamadi,Y.:可满足模理论的随机局部搜索。摘自:《第二十届AAAI人工智能会议论文集》,AAAI 2015,第1136–1143页。AAAI出版社(2015)
[15] Gershman,R.,Strichman,O.:HaifaSat:一种新的稳健SAT解算器。In:Ur,S.,Bin,E.,Wolfsthal,Y.(编辑)HVC 2005。LNCS,第3875卷,第76-89页。斯普林格,海德堡(2006)·兹比尔1176.68120
[16] Goldberg,E.,Novikov,Y.:BerkMin:一种快速而强大的卫星解算器。离散应用程序。数学。155(12), 1549–1561 (2007) ·Zbl 1121.68106号
[17] Jeroslow,R.G.,Wang,J.:解决命题可满足性问题。安。数学。Artif公司。因特尔。1(1–4), 167–187 (1990) ·兹比尔0878.68107
[18] Lagoudakis,M.G.,Littman,M.L.:学习在DPLL过程中选择分支规则以实现可满足性。电子。注释离散数学。9, 344–359 (2001) ·Zbl 0990.90543号
[19] Liang,J.H.,Ganesh,V.,Poupart,P.,Czarnecki,K.:SAT求解器的指数近因加权平均分支启发式。致:2016年AAAI会议记录(2016)·Zbl 1475.68348号
[20] Liang,J.H.,Ganesh,V.,Zulkoski,E.,Zaman,A.,Czarnecki,K.:理解冲突驱动的子句学习SAT解题器中的VSIDS分支启发法。收录人:Liang,J.H.,Ganesh,V.,Zulkoski,E.,Zaman,A.,Czarnecki,K.(编辑)HVC 2015。LNCS,第9434卷,第225-241页。斯普林格,海德堡(2015)。数字对象标识代码:10.1007/978-3-319-26287-1_14·Zbl 06507611号
[21] Loth,M.、Sebag,M.,Hamadi,Y.、Schoenauer,M.:基于Bandit的约束编程搜索。收录:Schulte,C.(编辑)CP 2013。LNCS,第8124卷,第464-480页。斯普林格,海德堡(2013)·Zbl 06294295号
[22] Marques-Silva,J.:分支启发式在命题可满足性算法中的影响。收录:Barahona,P.,Alferes,J.J.(编辑)EPIA 1999。LNCS(LNAI),第1695卷,第62-74页。斯普林格,海德堡(1999)
[23] Marques Silva,J.P.,Sakalah,K.A.:GRASP——一种新的可满足性搜索算法。摘自:《1996年IEEE/ACM计算机辅助设计国际会议论文集》,ICCAD 1996,第220-227页。IEEE计算机学会,华盛顿特区(1996)
[24] Moskewicz,M.W.,Madigan,C.F.,Zhao,Y.,Zhang,L.,Malik,S.:Chaff:设计一个高效的SAT求解器。摘自:第38届设计自动化年会论文集,DAC 2001,第530-535页。ACM,纽约(2001)
[25] Newsham,Z.,Ganesh,V.,Fischmeister,S.,Audemard,G.,Simon,L.:社区结构对SAT求解器性能的影响。In:Sinz,C.,Egly,U.(编辑)SAT 2014。LNCS,第8561卷,第252-268页。斯普林格,海德堡(2014)·兹比尔1423.68465
[26] Pipatsrisawat,K.,Darwiche,A.:用于可满足性求解器的轻量级组件缓存方案。收录:Marques-Silva,J.,Sakallah,K.A.(编辑)SAT 2007。LNCS,第4501卷,第294–299页。施普林格,海德堡(2007)·Zbl 05527216号
[27] Rintanen,J.:《规划与SAT》。摘自:Biere,A.,Heule,M.,van Maaren,H.,Walsh,T.(编辑)《可满足性手册》,第185卷,第483–504页。IOS出版社,阿姆斯特丹(2009)
[28] Ryan,L.:子句学习SAT求解器的高效算法。西蒙·弗雷泽大学硕士论文(2004)
[29] Soos,M.:CryptoMiniSat v4。摘自:SAT竞赛,第23页(2014年)
[30] Stump,A.,Sutcliffe,G.,Tinelli,C.:StarExec:用于逻辑求解的跨社区基础设施。收录人:Demri,S.、Kapur,D.、Weidenbach,C.(编辑)IJCAR 2014。LNCS,第8562卷,第367-373页。斯普林格,海德堡(2014)·Zbl 06348250号
[31] Sutton,R.S.,Barto,A.G.:强化学习:导论,第1卷。麻省理工学院出版社,马萨诸塞州剑桥(1998)
[32] Yechiam,E.,Busemeyer,J.R.:基于经验的决策学习模型中嵌入的基本假设的比较。精神病患者。牛市。第12版(3),387–402(2005)
[33] Zhang,L.,Madigan,C.F.,Moskewicz,M.H.,Malik,S.:布尔可满足性求解器中的高效冲突驱动学习。摘自:2001年IEEE/ACM计算机辅助设计国际会议论文集,ICCAD 2001,第279-285页。IEEE出版社,皮斯卡塔韦(2001)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。