×

测试启发式:我们都错了。 (英语) Zbl 0853.68155号

摘要:大多数算法实验的竞争性质是研究社区非常熟悉的问题的根源。很难在算法之间进行公平的比较,也很难组合实际的测试问题。竞争测试告诉我们哪种算法更快,但不是为什么。因为它需要发布代码,所以它需要花费时间和精力,而这些时间和精力本可以更好地用于做更多的实验。本文认为,一种更科学的控制实验方法,类似于其他经验科学中使用的方法,可以避免或缓解这些问题。我们混淆了研发;竞争性测试只适用于后者。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)

关键词:

计算测试基准问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aspvall,B.(1980)。识别可满足性问题的伪装NR(1)实例。算法杂志,1,97–103·Zbl 0451.68037号 ·doi:10.1016/0196-6774(80)90007-3
[2] Böhm,H.(1992)。SAT竞赛报告。德国帕德博恩大学第110号技术报告。
[3] Chandru,V.、Coullard,C.R.、Hammer,P.L.、Montanez,M.和Sun,X.(1990)。关于可重命名的Horn函数和通用的Horn函数。《数学和人工智能年鉴》,巴塞尔:Baltzer AG·Zbl 0878.68106号
[4] Chandru,V.和Hooker,J.N.(1992年)。检测命题逻辑中的扩展Horn结构。信息处理快报,42,109–111·Zbl 0780.68055号 ·doi:10.1016/0020-0190(92)90098-G
[5] Cheeseman,P.、Kanefsky,B.和Taylor,W.M.(1991)。真正困难的问题在哪里。《国际人工智能联合会议论文集》,ICAI91,悉尼,斯普林格·弗拉格(第331-337页)·Zbl 0747.68064号
[6] Crawford,J.M.和Auton,L.D.(1993年)。关于可满足性问题中交叉点的实验结果。《第十一届全国人工智能会议论文集》,AAAI93,华盛顿特区,麻省理工学院出版社(第21-27页)。
[7] Gent,I.P.和Walsh,T.(1994年)。SAT相变。A.G.Cohn(编辑),《第十一届欧洲人工智能会议论文集》,ECAI94(第105-109页)。
[8] Harche,F.、Hooker,J.N.和Thompson,G.L.(1994年)。命题逻辑可满足性算法的计算研究。ORSA计算机杂志26,423–435·Zbl 0811.03004号
[9] 胡克,J.N.(1994)。需要:算法的经验科学。运营研究,42,201–212·Zbl 0805.90119 ·doi:10.1287/opre.42.201
[10] Hooker,J.N.和Fedjki,C.(1990年)。命题逻辑中推理问题的分支解法。数学与人工智能年鉴,1123-139·Zbl 0878.68065号 ·doi:10.1007/BF01531074
[11] 胡克,J.N.和维奈,V.(即将出版)。可满足性的分支规则。自动推理杂志·Zbl 0838.68098号
[12] Larrabee,T.和Tsujii,Y.(1993年)。随机3cnf公式的可满足性阈值的证据。H.Hirsch等人(编辑),《人工智能和NP-Hard问题春季研讨会论文集》(第112-118页)。加利福尼亚州斯坦福。
[13] Lustig,I.J.、Marsten,R.E.和Shanno,D.F.(1994年)。线性规划的内点方法:最新的计算状态。ORSA计算杂志,6,第1-14页)·兹比尔0798.90100
[14] McGeoch,C.C.(即将推出)。算法仿真的实验方法。ORSA计算机杂志·Zbl 0854.68038号
[15] Mitchell,D.、Selman,B.和Levesque,H.(1992年)。SAT问题的难易分布。第十届全国人工智能会议论文集,AAAI92(第459-465页)。马萨诸塞州剑桥:麻省理工学院出版社。
[16] Trick,J.和Johnson,D.S.(编辑)。(1995).第二个DIMACS挑战:团、着色和可满足性。离散数学和理论计算机科学系列。普罗维登斯,RI:美国数学学会。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。