×

不确定性优化的概率决策图。 (英语) Zbl 1217.68212号

摘要:本文综述了概率决策图在不确定性决策问题建模和求解中的应用。我们介绍了影响图,它是一个流行的框架,用于用单个决策者表示和解决顺序决策问题。由于求解影响图的方法在决策序列的长度上的伸缩性很差,我们提出了两种计算近似解的方法。影响图的建模范围仅限于所谓的对称决策问题。这种局限性促使了替代表示语言的发展,从而扩大了可以有效建模的决策问题的类别。我们介绍了其中一些替代框架,并使用几个示例演示了它们的表达能力。最后,我们提供了实现本文所述框架的软件系统列表。

MSC公司:

68层37 人工智能背景下的不确定性推理
90B50型 管理决策,包括多个目标
91B06型 决策理论
91A35型 博弈决策理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Ahlmann-Ohlsen KS,Jensen FV,Nielsen TD,Pedersen O,Vomlelova M(2009)求解无约束影响图的两种方法的比较。国际J近似原因50:153–173·Zbl 1191.68669号 ·doi:10.1016/j.ijar.2008.08.001
[2] Bhattacharjya D,Shachter RD(2007)用决策电路评估影响图。收录:第二十三届人工智能不确定性会议论文集。第9-16页
[3] Bhattacharjya D,Shachter RD(2008),决策电路中的灵敏度分析。收录:第二十四届人工智能不确定性会议论文集。第34-42页
[4] Bielza C,Ríos-Insua S,Gómez M,del Pozo JAF(2000)《ictneo敏感性分析》。收录:统计学课堂讲稿,稳健贝叶斯分析,第152卷。柏林施普林格,第317–334页
[5] Cano A,Gómez M,Moral S(2006)一种求解影响图的前向-后向蒙特卡罗方法。国际J近似原因42(1–2):119–135·Zbl 1186.91063号 ·doi:10.1016/j.ijar.2005.10.009
[6] Charnes JM,Shenoy PP(2004)使用局部计算求解影响图的多级蒙特卡罗方法。管理科学50:405–418·Zbl 1232.91122号 ·doi:10.1287/mnsc.1030.138
[7] Cobb B(2006)《持续决策MTE影响图》。在:第三届欧洲概率图形模型研讨会论文集。第67–74页
[8] Cobb BR、Shenoy PP(2004)使用截尾指数混合的混合影响图。收录:第二十届人工智能不确定性会议论文集。第85-93页
[9] Cobb BR,Shenoy PP(2008),使用截尾指数混合的混合影响图进行决策。欧洲运营研究杂志186(1):261–275·Zbl 1138.91372号 ·doi:10.1016/j.ejor.2007.01.036
[10] Cooper GF(1988)使用信念网络作为影响图的方法。摘自:第四届人工智能不确定性会议论文集。第55–63页
[11] Cooper GF(1990)使用贝叶斯信念网络进行概率推理的计算复杂性。Artif Intell 42(2–3):393–405·Zbl 0717.68080号 ·doi:10.1016/0004-3702(90)90060-D
[12] Darwiche A(2003)贝叶斯网络中推理的微分方法。美国临床医学杂志50(3):280–305·Zbl 1325.68226号 ·doi:10.1145/765568.765570
[13] 达尔文A(2009)贝叶斯网络建模与推理。剑桥大学出版社·Zbl 1231.68003号
[14] Dechter R(2000)在不确定条件下优化政策的任意近似值。参加:第五届人工智能规划系统国际会议(AIPS-2000)决策理论规划研讨会
[15] Dittmer SL,Jensen FV(1997)影响图中信息的短视值。收录:Geiger D,Shenoy PP(编辑)第十三届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第142-149页
[16] Felli JC,Hazen GB(1999),敏感性分析和完美信息的期望值。Med Decis Mak 18:95–109·doi:10.1177/0272989X9801800117
[17] Gal Y,Pfeffer A(2003)一种在游戏中建模代理决策过程的语言。收录:第二届自主智能体和多智能体系统国际联合会议论文集。纽约ACM出版社,第265-272页
[18] Gal Y,Pfeffer A(2008)《影响图网络:代表代理人信念和决策过程的形式主义》。《Artif Intell Res杂志》33:109–147·Zbl 1183.68574号
[19] Garcia-Sanchez D,Druzdzel M(2007)影响图的高效穷举任何时间采样算法。发表于:Lucas P、Gmez J、Salmern A(eds)《概率图形模型的进展,模糊性和软计算研究》,第214卷。柏林施普林格,第255-273页·兹比尔1117.90018
[20] Gmytrasiewicz PJ,Durfee EH,Wehe DK(1991)协调多智能体交互的决策理论方法。摘自:第十二届国际人工智能联合会议记录。第62-68页·Zbl 0747.68069号
[21] Horsch MC,Poole D(1998)不确定性下决策的任意算法。摘自:Cooper GF,《第十四届人工智能不确定性会议道德汇编》。Morgan Kaufmann Publishers,Los Altos,第246-255页
[22] Howard RA、Matheson JE(1981)《影响图》。摘自:Howard RA、Matheson JE(eds)《决策分析的原理和应用》第2卷第37章。Menlo Park战略决策小组,第721-762页
[23] Jensen F、Jensen FV、Dittmer SL(1994)《从影响图到连接树》。摘自:Mantaras RL,Poole D(eds)第十届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第367–373页
[24] Jensen FV,Gatti E(2010)影响图最佳策略近似表示的信息增强。摘自:第五届欧洲概率图形模型研讨会论文集。第102–9页
[25] Jensen FV,Nielsen TD(2007),贝叶斯网络和决策图,第2版。纽约施普林格ISBN:0-387-68281-3
[26] Jensen FV,Vomlelova M(2002),无约束影响图。摘自:达尔文A,弗里德曼N(编辑)第十八届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第234-241页
[27] Jensen FV、Nielsen TD、Shenoy PP(2006)《顺序影响图:统一框架》。国际期刊近似原因42:101–118·Zbl 1186.91067号 ·doi:10.1016/j.ijar.2005.10.007
[28] Kjaerulff UB,Madsen AL(2008),贝叶斯网络和影响图,第1版。纽约施普林格ISBN:978-0-387-74100-0
[29] Koller D,Friedman N(2009)概率图形模型:原理和技术。麻省理工学院出版社,剑桥·兹比尔1183.68483
[30] Koller D,Milch B(2001)用于表示和解决游戏的多代理影响图。收录于:第十七届人工智能国际联合会议论文集。第1027–1036页·Zbl 1054.91007号
[31] Koller D,Milch B(2003),用于表示和解决游戏的多代理影响图。游戏Econ Behav 45(1):181–221·Zbl 1054.91007号 ·doi:10.1016/S0899-8256(02)00544-4
[32] Korb KB,Nicholson AE(2004)《贝叶斯人工智能》,第1版。查普曼和霍尔,伦敦ISBN:1-58488-387-1
[33] Lauritzen SL,Nilsson D(2001)代表和解决信息有限的决策问题。管理科学47(9):1235–1251·Zbl 1232.90343号 ·doi:10.1287/mnsc.47.9.1235.9779
[34] Li Y,Shenoy PP(2010)用确定性变量求解混合影响图。收录:第二十六届人工智能不确定性会议论文集。第322–331页
[35] 廖伟,季庆(2008)影响图的有效非近视信息值计算。国际J近似原因49:436–450·Zbl 1191.68688号 ·doi:10.1016/j.ijar.2008.04.003
[36] Luque M,Díez FJ(2010)具有超值节点的影响图的变量消除。国际J近似原因51:615–631·Zbl 1213.68625号 ·doi:10.1016/j.ijar.2009.11.004
[37] Madsen AL(2008)惰性传播边缘化的新方法。摘自:Jaeger M,Nielsen TD(eds)第四届概率图形模型欧洲研讨会论文集。第193-200页
[38] Madsen AL,Jensen F(2005)求解线性二次条件高斯影响图。国际J近似原因38:263–282·Zbl 1090.68107号 ·doi:10.1016/j.ijar.2004.05.006
[39] Madsen AL,Jensen FV(1999)对称贝叶斯决策问题的惰性评估。收录:Laskey KB,Prade H(eds)第十五届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第382–390页
[40] Madsen AL、Nilsson D(2001)使用HUGIN、Shafer-Shenoy和惰性传播求解影响图。收录:第十七届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第337–345页
[41] Moral S,RumíR,Salmerón A(2001)混合贝叶斯网络中截断指数的混合。摘自:《第六届欧洲不确定性推理的符号和定量方法会议记录》,人工智能课堂讲稿,第2143卷。施普林格,柏林,第145–167页·Zbl 1001.68544号
[42] 尼尔森TD(2001)影响图分解。摘自:Benferhat S,Besnard P(eds)《第六届欧洲不确定性推理符号和定量方法会议论文集》。Springer,《人工智能课堂讲稿》第2143页,第144-155页
[43] Nielsen TD,Jensen FV(1999)定义良好的决策场景。收录:Laskey KB,Prade H(eds)《第十五届人工智能不确定性会议论文集》。Morgan Kaufmann Publishers,Los Altos,第502-511页
[44] Nielsen TD,Jensen FV(2003),影响图中的敏感性分析。IEEE Trans Syst Man Cybern第A部分Syst Hum 33(2):223–234·doi:10.1109/TSMCA.2003.811116
[45] Nilsson D,Lauritzen SL(2000)使用LIMID评估影响图。收录:Boutiler C,Goldszmidt M(编辑)第十六届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第436–445页
[46] Pearl J(1988)智能系统中的概率推理。表示和推理。Morgan Kaufmann Publishers,圣马特奥。国际标准图书编号0-934613-73-7
[47] Raiffa H,Schlaifer R(1961)应用统计决策理论。麻省理工学院出版社,剑桥·Zbl 0952.62008号
[48] Shachter RD(1986)评估影响图。运营研究34(6):871–882·doi:10.1287/opre.34.6.871
[49] Shachter RD(1999)信息计算的有效价值。收录:Laskey KB,Prade H(eds)第十五届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第594-601页
[50] Shachter RD,Bhattacharjya D(2010)《带有决策电路的影响图中的动态规划》。收录:第二十六届人工智能不确定性会议论文集。第509–516页
[51] Shachter RD、Kenley CR(1989)高斯影响图。管理科学35(5):527–550·doi:10.1287/mnsc.35.527
[52] Shachter RD,Peot MA(1992),使用概率推理方法进行决策。摘自:Dubois D、Wellman MP、D'Ambrosio B、Smets P(eds)第八届人工智能不确定性会议论文集。Morgan Kaufmann Publishers,Los Altos,第276-283页
[53] Shafer GR,Shenoy PP(1990)《概率传播》。数学艺术智能安2:327–352·兹伯利0875.68676 ·doi:10.1007/BF01531015
[54] Shenoy PP(1992)贝叶斯决策分析的基于估值的系统。运营研究40(3):463–484·Zbl 0850.62131号 ·doi:10.1287/opre.403.463
[55] Shenoy PP(2000)非对称决策问题的估值网络表示和解决方案。欧洲运营研究杂志121(3):579–608·Zbl 0968.90012号 ·doi:10.1016/S0377-2217(99)00055-7
[56] Shenoy PP,West JC(2009),具有确定性变量的混合贝叶斯网络中多项式的混合。摘自:第八届不确定性处理研讨会论文集。第202-212页
[57] Virto MA、Martín J、Insua DR、Moreno-Díaz A(2002)通过mcmc方法获得复杂影响图的近似解。In:概率图形模型第一次欧洲研讨会会议记录
[58] Von Neumann J,Morgenstern O(1944)《博弈论与经济行为》,第1版。威利,纽约·Zbl 0063.05930号
[59] 袁C,吴X(2010)用启发式搜索求解影响图。附:第十一届人工智能与数学国际研讨会论文集
[60] 袁C,吴X,汉森E(2010)使用分枝定界搜索求解多级影响图。收录:第二十六届人工智能不确定性会议论文集。加利福尼亚州卡塔利纳岛
[61] Zhang NL(1998)影响图中的概率推理。摘自:Cooper GF,《第十四届人工智能不确定性会议道德汇编》。Morgan Kaufmann Publishers,Los Altos,第514-522页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。