×

APPSSAT:使用随机可满足性的近似概率规划。 (英语) Zbl 1119.68441号

摘要:我们描述了{APPSSAT},一种基于ZANDER的随时随地概率应急计划器,一种通过将计划问题转换为随机可满足性(SSAT)问题并解决该问题来运行的概率应急计划程序[S.M.Majercik先生M.L.利特曼,“通过随机可满足性实现不确定性下的应急计划”,Artif。智力。147,第1-2号,119-162(2003年;兹比尔1082.68807)]. SSAT实例中一些变量的值是概率确定的;APPSSAT考虑了这些变量的最可能的实例化(代理面临的最可能情况),并试图构建在这些情况下成功的最佳计划的近似值,并在时间允许时改进该计划。如果有更多的时间,则不太可能考虑实例化/情况,并根据需要修改计划。在某些情况下,为解决相对较低比例的可能情况而制定的计划将在未明确考虑的情况下取得成功,并可能返回最佳或接近最佳的计划。我们描述了实验结果,表明在zander无法找到最优(或任何)方案的情况下,APPSSAT可以找到次优方案。尽管测试问题很小,但appssat的随时随地质量意味着它有潜力在更大的、时间紧迫的领域中高效地导出次优计划,在这些领域中,ZANDER可能没有足够的时间计算任何计划。我们还建议进一步开展工作,使APPSSAT更接近于解决实际问题。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68层37 人工智能背景下的不确定性推理

软件:

PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Majercik,S.M。;Littman,M.L.,《通过随机可满足性实现不确定性条件下的应急计划》,人工智能,147119-162(2003)·Zbl 1082.68807号
[2] 利特曼,M.L。;马杰尔西克,S.M。;Pitassi,T.,随机布尔可满足性,自动推理杂志,27251-296(2001)·Zbl 0988.68189号
[3] Drummond,M。;Bresina,J.,Anytime synthetic projection:maximization the probability of goal satisfaction,(《第八届全国人工智能会议论文集》(1990),摩根·考夫曼),138-144
[4] N.Onder,M.E.Pollack,《计划生成中的应急选择》,载《第四届欧洲规划会议论文集》,1997年,第364-376页。;N.Onder,M.E.Pollack,《计划生成中的应急选择》,载《第四届欧洲规划会议论文集》,1997年,第364-376页。
[5] 科勒,D。;Parr,R.,《结构化MDP中政策的计算因子价值函数》,(第十六届国际人工智能联合会议论文集(1999年),AAAI出版社/麻省理工学院出版社),1332-1339
[6] D.Koller,R.Parr,《因子化MDP的政策迭代》,载《第十六届人工智能不确定性年会论文集》(UAI 2000),2000年,第326-334页。;D.Koller,R.Parr,《因子化MDP的政策迭代》,载于《第十六届人工智能不确定性年会论文集》(UAI 2000),2000年,第326-334页。
[7] C.Guestrin、D.Koller、R.Parr,因子化MDP的最大形式预测,摘自:《第十七届国际人工智能联合会议论文集》,2001年,第673-682页。;C.Guestrin、D.Koller、R.Parr,因子化MDP的最大形式预测,载《第十七届国际人工智能联合会议论文集》,2001年,第673-682页。
[8] P.Poupart,C.Boutiler,D.Schuurmans,R.Patrascu,分解MDP的分段线性值函数近似,载于《第十八届全国人工智能会议论文集》(AAAI-2002),2002年,第292-299页。;P.Poupart,C.Boutiler,D.Schuurmans,R.Patrascu,分解MDP的分段线性值函数近似,载于《第十八届全国人工智能会议论文集》(AAAI-2002),2002年,第292-299页。
[9] C.Boutiler,R.Dearden,《结构化动态规划中的近似值树》,载《第十三届国际机器学习会议论文集》,1996年,第56-62页。;C.Boutiler,R.Dearden,《结构化动态规划中的近似值树》,载《第十三届国际机器学习会议论文集》,1996年,第56-62页。
[10] R.St-Aubin,J.Hoey,C.Boutiler,APRICODD:使用决策图进行近似政策构建,见《神经信息处理系统的进展》13(NIPS-2000),2000年,第1089-1095页。;R.St-Aubin,J.Hoey,C.Boutiler,APRICODD:使用决策图进行近似政策构建,见《神经信息处理系统的进展》13(NIPS-2000),2000年,第1089-1095页。
[11] Z.Feng,E.Hansen,系数化POMDP的近似规划,载于:第六届欧洲规划会议(ECP-01),2001年。;Z.Feng,E.Hansen,系数化POMDP的近似规划,载于:第六届欧洲规划会议(ECP-01),2001年。
[12] P.Poupart,C.Boutilier,VDCBPI:大规模POMDP的近似可扩展算法,载于:神经信息处理系统进展17(NIPS-2004),2004年,第1081-1088页。;P.Poupart,C.Boutiler,《VDCBPI:大规模POMDP的近似可伸缩算法》,载于《神经信息处理系统的进展》17(NIPS-2004),2004年,第1081-1088页。
[13] S.Sanner,C.Boutiler,《一阶MDP的近似线性规划》,载于《第二十届人工智能不确定性会议论文集》(UAI-05),2005年,第509-517页。;S.Sanner,C.Boutiler,《一阶MDP的近似线性规划》,载于《第二十届人工智能不确定性会议论文集》(UAI-05),2005年,第509-517页·Zbl 1341.90144号
[14] M.J.卡恩斯。;Mansour,Y。;Ng,A.Y.,大型马尔可夫决策过程中近最优规划的稀疏采样算法,机器学习,49,193-208(2002)·Zbl 1014.68150号
[15] 卡恩斯,M。;Mansour,Y。;Ng,A.,通过可重用轨迹在大型POMDP中进行近似规划,(神经信息处理系统进展12(1999年会议论文集)(2000年),麻省理工学院出版社)
[16] D.A.McAllester,S.Singh,《使用信度状态简化的因子化POMDP近似规划》,载于《第十五届人工智能不确定性年会论文集》(UAI-99),1999年,第409-416页。;D.A.McAllester,S.Singh,使用信念状态简化对因子POMDP进行近似规划,载于:《第十五届人工智能不确定性年会论文集》(UAI-99),1999年,第409-416页。
[17] Zhang,N.L。;Lin,W.,部分可观测随机域规划的模型近似方案,人工智能研究杂志,7199-230(1997)
[18] G.Theocharous,L.Pack Kaelbling,《POMDP与宏观行动的近似规划》,载于《神经信息处理系统的进展》第16期(NIPS-2003),2003年。;G.Theocharous,L.Pack Kaelbling,《POMDP与宏观行动的近似规划》,载于《神经信息处理系统的进展》第16期(NIPS-2003),2003年。
[19] A.Fern,S.Yoon,R.Givan,《带有政策语言偏差的近似政策迭代》,载《神经信息处理系统的进展》第16期(NIPS-2003),2003年。;A.Fern,S.Yoon,R.Givan,《带有政策语言偏差的近似政策迭代》,载于《神经信息处理系统的进展》第16期(NIPS-2003),2003年·Zbl 1182.68237号
[20] D.Blatt,S.Murphy,J.Zhu,近似规划A-learning for approximate planning,技术报告04-63,宾夕法尼亚州立大学方法中心,2004年。;D.Blatt,S.Murphy,J.Zhu,A-learning for approximate planning,技术报告04-63,宾夕法尼亚州立大学方法中心,2004年。
[21] Papadimitriou,C.H.,《对抗自然的游戏》,《计算机系统科学杂志》,31288-301(1985)·Zbl 0583.68020号
[22] M.Moskewicz,C.Madigan,Y.Zhao,L.Zhang,S.Malik,Chaff:设计一个高效的SAT求解器,第39届设计自动化会议(DAC 2001),2001年。;M.Moskewicz,C.Madigan,Y.Zhao,L.Zhang,S.Malik,Chaff:设计一个高效的SAT求解器,见:第39届设计自动化会议(DAC 2001),2001年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。