文件Zbl 1119.68441-zbMATH Open

APPSSAT：使用随机可满足性的近似概率规划。（英语） Zbl 1119.68441号

国际J近似推理 45，第2期，402-419（2007）.

摘要：我们描述了{APPSSAT}，一种基于ZANDER的随时随地概率应急计划器，一种通过将计划问题转换为随机可满足性（SSAT）问题并解决该问题来运行的概率应急计划程序[S.M.Majercik先生和M.L.利特曼，“通过随机可满足性实现不确定性下的应急计划”，Artif。智力。147，第1-2号，119-162（2003年；兹比尔1082.68807)]. SSAT实例中一些变量的值是概率确定的；APPSSAT考虑了这些变量的最可能的实例化（代理面临的最可能情况），并试图构建在这些情况下成功的最佳计划的近似值，并在时间允许时改进该计划。如果有更多的时间，则不太可能考虑实例化/情况，并根据需要修改计划。在某些情况下，为解决相对较低比例的可能情况而制定的计划将在未明确考虑的情况下取得成功，并可能返回最佳或接近最佳的计划。我们描述了实验结果，表明在zander无法找到最优（或任何）方案的情况下，APPSSAT可以找到次优方案。尽管测试问题很小，但appssat的随时随地质量意味着它有潜力在更大的、时间紧迫的领域中高效地导出次优计划，在这些领域中，ZANDER可能没有足够的时间计算任何计划。我们还建议进一步开展工作，使APPSSAT更接近于解决实际问题。

引用于5文件

MSC公司：

68T20型	人工智能背景下的问题解决（启发式、搜索策略等）
68层37	人工智能背景下的不确定性推理

引文：

兹比尔1082.68807

软件：

糠

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序

参考文献：

[1]	Majercik，S.M。；Littman，M.L.，《通过随机可满足性实现不确定性条件下的应急计划》，人工智能，147119-162（2003）·Zbl 1082.68807号
[2]	利特曼，M.L。；马杰尔西克，S.M。；Pitassi，T.，随机布尔可满足性，自动推理杂志，27251-296（2001）·Zbl 0988.68189号
[3]	Drummond，M。；Bresina，J.，Anytime synthetic projection:maximization the probability of goal satisfaction，（《第八届全国人工智能会议论文集》（1990），摩根·考夫曼），138-144
[4]	N.Onder，M.E.Pollack，《计划生成中的应急选择》，载《第四届欧洲规划会议论文集》，1997年，第364-376页。；N.Onder，M.E.Pollack，《计划生成中的应急选择》，载《第四届欧洲规划会议论文集》，1997年，第364-376页。
[5]	科勒，D。；Parr，R.，《结构化MDP中政策的计算因子价值函数》，（第十六届国际人工智能联合会议论文集（1999年），AAAI出版社/麻省理工学院出版社），1332-1339
[6]	D.Koller，R.Parr，《因子化MDP的政策迭代》，载《第十六届人工智能不确定性年会论文集》（UAI 2000），2000年，第326-334页。；D.Koller，R.Parr，《因子化MDP的政策迭代》，载于《第十六届人工智能不确定性年会论文集》（UAI 2000），2000年，第326-334页。
[7]	C.Guestrin、D.Koller、R.Parr，因子化MDP的最大形式预测，摘自：《第十七届国际人工智能联合会议论文集》，2001年，第673-682页。；C.Guestrin、D.Koller、R.Parr，因子化MDP的最大形式预测，载《第十七届国际人工智能联合会议论文集》，2001年，第673-682页。
[8]	P.Poupart，C.Boutiler，D.Schuurmans，R.Patrascu，分解MDP的分段线性值函数近似，载于《第十八届全国人工智能会议论文集》（AAAI-2002），2002年，第292-299页。；P.Poupart，C.Boutiler，D.Schuurmans，R.Patrascu，分解MDP的分段线性值函数近似，载于《第十八届全国人工智能会议论文集》（AAAI-2002），2002年，第292-299页。
[9]	C.Boutiler，R.Dearden，《结构化动态规划中的近似值树》，载《第十三届国际机器学习会议论文集》，1996年，第56-62页。；C.Boutiler，R.Dearden，《结构化动态规划中的近似值树》，载《第十三届国际机器学习会议论文集》，1996年，第56-62页。
[10]	R.St-Aubin，J.Hoey，C.Boutiler，APRICODD：使用决策图进行近似政策构建，见《神经信息处理系统的进展》13（NIPS-2000），2000年，第1089-1095页。；R.St-Aubin，J.Hoey，C.Boutiler，APRICODD：使用决策图进行近似政策构建，见《神经信息处理系统的进展》13（NIPS-2000），2000年，第1089-1095页。
[11]	Z.Feng，E.Hansen，系数化POMDP的近似规划，载于：第六届欧洲规划会议（ECP-01），2001年。；Z.Feng，E.Hansen，系数化POMDP的近似规划，载于：第六届欧洲规划会议（ECP-01），2001年。
[12]	P.Poupart，C.Boutilier，VDCBPI：大规模POMDP的近似可扩展算法，载于：神经信息处理系统进展17（NIPS-2004），2004年，第1081-1088页。；P.Poupart，C.Boutiler，《VDCBPI：大规模POMDP的近似可伸缩算法》，载于《神经信息处理系统的进展》17（NIPS-2004），2004年，第1081-1088页。
[13]	S.Sanner，C.Boutiler，《一阶MDP的近似线性规划》，载于《第二十届人工智能不确定性会议论文集》（UAI-05），2005年，第509-517页。；S.Sanner，C.Boutiler，《一阶MDP的近似线性规划》，载于《第二十届人工智能不确定性会议论文集》（UAI-05），2005年，第509-517页·Zbl 1341.90144号
[14]	M.J.卡恩斯。；Mansour，Y。；Ng，A.Y.，大型马尔可夫决策过程中近最优规划的稀疏采样算法，机器学习，49，193-208（2002）·Zbl 1014.68150号
[15]	卡恩斯，M。；Mansour，Y。；Ng，A.，通过可重用轨迹在大型POMDP中进行近似规划，（神经信息处理系统进展12（1999年会议论文集）（2000年），麻省理工学院出版社）
[16]	D.A.McAllester，S.Singh，《使用信度状态简化的因子化POMDP近似规划》，载于《第十五届人工智能不确定性年会论文集》（UAI-99），1999年，第409-416页。；D.A.McAllester，S.Singh，使用信念状态简化对因子POMDP进行近似规划，载于：《第十五届人工智能不确定性年会论文集》（UAI-99），1999年，第409-416页。
[17]	Zhang，N.L。；Lin，W.，部分可观测随机域规划的模型近似方案，人工智能研究杂志，7199-230（1997）
[18]	G.Theocharous，L.Pack Kaelbling，《POMDP与宏观行动的近似规划》，载于《神经信息处理系统的进展》第16期（NIPS-2003），2003年。；G.Theocharous，L.Pack Kaelbling，《POMDP与宏观行动的近似规划》，载于《神经信息处理系统的进展》第16期（NIPS-2003），2003年。
[19]	A.Fern，S.Yoon，R.Givan，《带有政策语言偏差的近似政策迭代》，载《神经信息处理系统的进展》第16期（NIPS-2003），2003年。；A.Fern，S.Yoon，R.Givan，《带有政策语言偏差的近似政策迭代》，载于《神经信息处理系统的进展》第16期（NIPS-2003），2003年·Zbl 1182.68237号
[20]	D.Blatt，S.Murphy，J.Zhu，近似规划A-learning for approximate planning，技术报告04-63，宾夕法尼亚州立大学方法中心，2004年。；D.Blatt，S.Murphy，J.Zhu，A-learning for approximate planning，技术报告04-63，宾夕法尼亚州立大学方法中心，2004年。
[21]	Papadimitriou，C.H.，《对抗自然的游戏》，《计算机系统科学杂志》，31288-301（1985）·Zbl 0583.68020号
[22]	M.Moskewicz，C.Madigan，Y.Zhao，L.Zhang，S.Malik，Chaff：设计一个高效的SAT求解器，第39届设计自动化会议（DAC 2001），2001年。；M.Moskewicz，C.Madigan，Y.Zhao，L.Zhang，S.Malik，Chaff：设计一个高效的SAT求解器，见：第39届设计自动化会议（DAC 2001），2001年。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文件类型(j：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

APPSSAT：使用随机可满足性的近似概率规划。（英语） Zbl 1119.68441号

MSC公司：

引文：

软件：

参考文献：

示例

领域

操作员

APPSSAT：使用随机可满足性的近似概率规划。 （英语） Zbl 1119.68441号

MSC公司：

引文：

软件：

参考文献：

APPSSAT：使用随机可满足性的近似概率规划。（英语） Zbl 1119.68441号