×

偏好部分有序的顺序决策。 (英语) Zbl 1231.91073号

摘要:本文提出了偏序偏好序列决策中策略选择的新见解和新算法;也就是说,某些策略可能与预期效用不可比较。我们假设策略之间的不可比性是由概率值的不确定性/不精确性引起的。我们研究了后果主义策略选择的六个标准:\(\varGamma\)-最大值、\(\varGamma\)-最大值、\(\varGamma\)-最大值、区间优势、最大值和E容许性。我们关注流行的决策树和影响图表示。算法采用线性/多线性规划;我们描述了实现和实验。

MSC公司:

91B06型 决策理论
06年06月06日 部分订单,通用
90 C90 数学规划的应用

软件:

CP网络
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Allais,M。;Hagen,O.,《预期效用假设和阿拉斯悖论》(1979年),D.Reidel出版公司:D.Reider出版公司,荷兰多德雷赫特·Zbl 0468.90002号
[2] Aumann,R.J.,《没有完备性公理的效用理论》,《计量经济学》,第30、3、445-461页(1962年7月)·Zbl 0121.5202号
[3] Berger,J.O.,《统计决策理论和贝叶斯分析》(1985),Springer:Springer New York·Zbl 0572.62008号
[4] Bertsimas博士。;Tsitsiklis,J.N.,《线性优化导论》(1997),雅典娜科学出版社:马萨诸塞州贝尔蒙特市雅典娜科学出版社
[5] 布鲁姆,L。;Brandeburger,A。;Dekel,E.,《不确定性下的词汇概率和选择》,《计量经济学》,59,1,61-79(1991年1月)·Zbl 0732.90005号
[6] B.Bonet,R.Givan,摘自:《第五届国际规划竞赛:非确定性轨道,呼吁参与》,2005年。;B.Bonet,R.Givan,摘自:《第五届国际规划竞赛:非确定性轨道,呼吁参与》,2005年。
[7] Boutiler,C。;R.I.布拉夫曼。;胡斯,H.H。;Poole,D.,《CP-nets:用条件对等偏好语句表示和推理的工具》,《人工智能研究杂志》,21135-191(2004)·Zbl 1080.68685号
[8] Breese,J。;Fertig,K.,《利用区间影响图进行决策》,(第六届人工智能不确定性会议(1990年),爱思唯尔科学:爱思唯尔科学纽约),122-129
[9] Bykvist,K.,《时间-部分道德与动态选择》,(Rabinowicz,W.,《价值与选择——决策理论和道德哲学中的一些常见主题》,《隆德哲学报告》(2000)),53-64
[10] G.F.Cooper,《使用信念网络作为影响图的方法》,载于:《第四届人工智能不确定性会议论文集》,明尼阿波利斯,1988年,第55-63页。;G.F.Cooper,《使用信念网络作为影响图的方法》,载于:《第四届人工智能不确定性会议论文集》,明尼阿波利斯,1988年,第55-63页。
[11] 库索,I。;道德,S。;Walley,P.,《不精确概率独立性概念的调查,风险,决策和政策》,5,2,165-181(2000)
[12] Cozman,F.G.,概率集的分离性质,(Boutilier,C.;Goldszmidt,M.,第16届人工智能不确定性会议论文集(2000年7月),Morgan Kaufmann:Morgan Kaufmann旧金山),107-115
[13] Cozman,F.G.,不精确概率的图形模型,国际近似推理杂志,39,2-3,167-184(2005年6月)·Zbl 1099.68111号
[14] 丹尼尔森,M。;Ekenberg,L.,计算区间决策树的上下限,欧洲运筹学杂志,181,2808-816(2007年9月)·Zbl 1131.91016号
[15] 丹尼尔森,M。;埃肯伯格,L。;Johansson,J。;Larsson,A.,The DecideIT decision tool,(Bernard,J.-M.;Seidenfeld,T.;Zaffalon,M.,《第三届不精确概率及其应用国际研讨会论文集》(2003年7月),Carleton Scientific:Carleton Scientific Lugano,Switzerland),204-217
[16] de Campos,C.P。;Cozman,F.G.,《使用多线性编程进行信用网络推断》,(第二届欧洲启动人工智能研究者研讨会论文集(2004年8月),IOS出版社:西班牙巴伦西亚IOS出版社),50-61
[17] de Campos,C.P。;Cozman,F.G.,贝叶斯网络和可信度网络的推理复杂性,(第九届国际人工智能联合会议论文集(2005年7月至8月),爱丁堡:爱丁堡苏格兰,英国),1313-1318
[18] C.P.de Campos,F.G.Cozman,《通过整数规划进行信用网络推断》,载于:《不精确概率:理论与应用国际研讨会》,布拉格,2007年,第145-154页。;C.P.de Campos,F.G.Cozman,《通过整数规划进行信用网络推断》,载于:《不精确概率:理论与应用国际研讨会》,布拉格,2007年,第145-154页。
[19] C.P.de Campos,Q.Ji,《使用不精确概率的影响图中的策略选择》,摘自:《第24届人工智能不确定性会议论文集》,芬兰赫尔辛基,2008年7月,第121-128页。;C.P.de Campos,Q.Ji,《使用不精确概率的影响图中的策略选择》,摘自:《第24届人工智能不确定性会议论文集》,芬兰赫尔辛基,2008年7月,第121-128页。
[20] Ellsberg,D.,风险、歧义和萨维奇公理,《经济学季刊》,75,4,643-669(1961)·Zbl 1280.91045号
[21] Etchart,N.,《序贯框架下非欧盟决策的充分情绪》,《理论与决策》,52,1-28(2002年2月)·Zbl 1032.91586号
[22] Fertig,K。;Breese,J.,影响图的概率区间,IEEE模式分析和机器智能汇刊,15,3,280-286(1993)
[23] Fishburn,P.C.,《决策的效用理论》(1970),Kriefer出版公司:Kriefer-出版公司,纽约·兹比尔0213.46202
[24] Georgakopoulos,G。;卡夫瓦迪亚,D。;Papadimitriou,C.H.,概率可满足性,复杂性杂志,4,1,1-11(1988年3月)·Zbl 0647.68049号
[25] 吉尔博亚,I。;Schmeidler,D.,具有非唯一先验的Maxmin期望效用,《数学经济学杂志》,18,2,141-153(1989)·Zbl 0675.90012号
[26] Giron,F.J。;Rios,S.,《准贝叶斯行为:一种更现实的决策方法?(1980),大学出版社:瓦伦西亚大学出版社·Zbl 0459.62006年
[27] Hailperin,T.,事件逻辑函数概率的最佳可能不等式,《美国数学月刊》,72343-359(1965)·Zbl 0132.13706号
[28] Hammond,P.J.,《改变口味和连贯的动态选择》,《经济研究评论》,第43、1、159-173页(1976年)·Zbl 0367.90011号
[29] P.J.Hammond,后果主义和独立公理,载于:B.R.Munier(编辑),风险、决策和理性(第三届效用、风险和决策理论基础与应用国际会议论文集),荷兰多德雷赫特,1988年,第503-516页。;P.J.Hammond,后果主义和独立公理,收录于:B.R.Munier(编辑),风险、决策和理性(第三届效用、风险和决策理论基础和应用国际会议论文集),荷兰多德雷赫特,1988年,第503-516页·Zbl 0667.90006号
[30] Hammond,P.J.,有序决策理论:评塞登菲尔德教授,经济学与哲学,4272-297(1988)
[31] P.Hansen,B.Jaumard,《概率满意度》,技术代表G-96-31,GERAD研究所,蒙特勒理工学院,1996年。;P.Hansen,B.Jaumard,《概率满意度》,技术代表G-96-31,《GERAD研究所》,蒙特勒理工学院,1996年·Zbl 1015.68198号
[32] Hansen,P。;Perron,S.,《概率可满足性的局部和全局方法的合并》,《国际近似推理杂志》,47,2,125-140(2008)·Zbl 1343.68220号
[33] Harmanec,D.,将马尔可夫决策过程推广到不精确概率,统计规划与推断杂志,105,1,199-213(2002年6月)·Zbl 1019.90048号
[34] 霍华德·R·A。;Matheson,J.E.,影响图,决策分析,2,3,127-143(2005)
[35] N.Huntley,M.Troffaes,《低预知决策树的有效范式解》,载于:《概率统计软方法国际研讨会》,2008年,第419-426页。;N.Huntley,M.Troffaes,《低预知决策树的有效范式解》,载于:《概率统计软方法国际研讨会》,2008年,第419-426页。
[36] L.Hurwicz,无知下决策的一类标准,Cowles委员会论文3561951。;L.Hurwicz,《无知下决策的一类标准》,Cowles委员会文件3561951年。
[37] 伊藤·H。;Nakamura,K.,参数不精确的部分可观测马尔可夫决策过程,人工智能,171,8-9,453-490(2007)·Zbl 1168.68578号
[38] J.-Y.Jaffray,《概率不精确的理性决策》,载于:G.D.Cooman,F.G.Cozman,S.Moral,P.Walley(编辑),《第一届不精确概率及其应用国际研讨会论文集》,比利时根特,1999年6月,第183-188页。;J.-Y.Jaffray,《概率不精确的理性决策》,载于:G.D.Cooman,F.G.Cozman,S.Moral,P.Walley(编辑),《第一届不精确概率及其应用国际研讨会论文集》,比利时根特,1999年6月,第183-188页。
[39] Jaumard,B。;Hansen,P。;de Aragáo,M.P.,概率逻辑的列生成方法,ORSA计算杂志,3,2,135-148(1991)·兹比尔0800.68864
[40] Kahneman,D。;Tversky,A.,《前景理论:风险下的决策分析》,《计量经济学》,第47期,第262-291页(1979年)·Zbl 0411.90012号
[41] D.Kikuti,F.G.Cozman,部分有序偏好的影响图,收录于:第三届偏好处理进展多学科研讨会,2007年。;D.Kikuti,F.G.Cozman,部分有序偏好的影响图,收录于:第三届偏好处理进展多学科研讨会,2007年。
[42] 基库蒂,D。;Cozman,F.G。;de Campos,C.P.,《决策树中的部分有序偏好:概率不精确的计算策略》,(偏好处理进展研讨会(2005年7月),爱丁堡:英国爱丁堡),118-123
[43] Kyburg,H.E。;Pittarelli,M.,基于集合的贝叶斯主义,IEEE系统汇刊,人与控制论,A部分,26,3,324-339(1996)
[44] Lauritzen,S.L。;Nilsson,D.,用有限信息表示和解决决策问题,《管理科学》,47,9,1235-1251(2001)·Zbl 1232.90343号
[45] 列维,I.,《论不确定性概率》,《哲学杂志》,71,391-418(1974)
[46] 列维,I.,《知识的企业》(1980),麻省理工学院出版社:麻省理学学院出版社
[47] 卢斯·R·D。;Raiffa,H.,《游戏与决策》(1957),威利:威利纽约·兹伯利0084.15704
[48] 罗,C。;Yu,C。;Lobo,J。;王,G。;Pham,T.,从不确定数据计算概率的最佳界,计算智能,12,4,541-566(1996)
[49] Machina,M.J.,《不确定性下的动态一致性和选择的非预期效用模型》,《经济文献杂志》,27,41622-1688(1989年12月)
[50] McClennen,E.F.,《理性与动态选择:基础探索》(1990),剑桥大学出版社:剑桥大学出版社
[51] McClennen,E.F.,《实用理性与规则》,《哲学与公共事务》,第26、3、210-258页(1997年)
[52] T.D.Nielsen,J.-Y.Jaffray,基于秩相关效用的理性决策操作方法,2001年,未出版手稿网址:http://www.cs.aau.dk/tdn/papers/nielsen-jaffray-01.pdf;T.D.Nielsen,J.-Y.Jaffray,基于秩相关效用的理性决策操作方法,2001年,未出版手稿网址:http://www.cs.aau.dk/tdn/papers/nielsen-jaffray-01.pdf
[53] 尼尔森,T.D。;Jensen,F.V.,定义良好的决策场景,(第十五届人工智能不确定性会议论文集(1999年7月),Morgan Kaufmann:Morgan Kaufmann斯德哥尔摩,瑞典),502-511
[54] Pearl,J.,《智能系统中的概率推理:似然推理网络》(1988),摩根考夫曼出版社:摩根考夫文出版社,加利福尼亚州洛斯阿尔托斯
[55] Quiggin,J.C.,预期效用理论,《经济行为与组织杂志》,3,4,323-343(1982年12月)
[56] Raiffa,H.,《决策分析:不确定性下的选择入门讲座》(1968),Addison-Wesley:Addison-Whesley Massachusetts·Zbl 0181.21802号
[57] 萨缪尔森,P.A.,《显示偏好的消费理论》,《计量经济学》,第15期,第243-253页(1948年)
[58] Satia,J.K。;Lave,R.E.,转移概率不确定的马尔科夫决策过程,运筹学,21,3728-740(1973年5月-6月)·Zbl 0286.60038号
[59] M.J.Schervish,T.Seidenfeld,J.B.Kadane,I.Levi,预期效用理论的扩展和两两比较的一些局限性,摘自:第三届不精确概率及其应用国际研讨会论文集,瑞士卢加诺,2003年7月,第496-510页。;M.J.Schervish,T.Seidenfeld,J.B.Kadane,I.Levi,预期效用理论的扩展和两两比较的一些局限性,载于《第三届不精确概率及其应用国际研讨会论文集》,瑞士卢加诺,2003年7月,第496-510页。
[60] Seidenfeld,T.,与(凸)概率集一起使用的两个决策规则之间的对比:\(Γ\)-最大化与E-可容许性,Synthese,140,1-269-88(2004年5月)
[61] 塞登菲尔德,T。;Schervish,M.J。;Kadane,J.B.,《无需命令的决定》(Sieg,W.,《行动与反思》(1990),Kluwer学术出版社:Kluwer-学术出版社Dordrecht),143-170
[62] 塞登菲尔德,T。;Schervish,M.J。;Kadane,J.B.,《部分有序偏好的表示》,《统计年鉴》,23,62168-2217(1995年12月)·Zbl 0871.62008号
[63] Shachter,R.,Bayes-Ball:理性消遣(用于确定信念网络和影响图中的无关性和必要信息),(第十四届人工智能不确定性年会论文集(UAI-98)(1998年),Morgan Kaufmann:Morgan Koufmann San Francisco,CA),480-487
[64] Shachter,R.,《信息计算的有效价值》,(第十五届人工智能不确定性年会论文集(UAI-99)(1999),摩根考夫曼:摩根考夫曼旧金山,加利福尼亚州),594-601
[65] Sherali,H.D。;Tuncbilek,C.H.,《使用重新格式化线性化技术解决多项式规划问题的全局优化算法》,《全局优化杂志》,2,1,101-112(1992年3月)·Zbl 0787.90088号
[66] Simon,H.A.,理性选择的行为模型,《经济学季刊》,69,1,99-118(1955)
[67] Strotz,R.,动态效用最大化中的近视和不一致,《经济研究评论》,23,3,165-180(1956)
[68] Tatman,J.A。;Shachter,R.D.,动态规划和影响图,IEEE系统、人与控制论汇刊,20,2,365-379(1990)·Zbl 0715.90094号
[69] F.W.Trevizan,F.G.Cozman,L.L.de Barros,《风险下的规划和奈特氏不确定性》,载于:国际人工智能联合会议,2007年,第2023-2028页。;F.W.Trevizan,F.G.Cozman,de Barros法律公告,《风险下的规划和骑士式的不确定性》,载于:2007年国际人工智能联合会议,第2023-2028页。
[70] M.C.M.Troffaes,《概率不精确的决策:简短回顾》,载于:F.Cozman(Ed.),《概率理论与应用不精确学会通讯》,瑞士曼诺,2004年12月,第4-7页。;M.C.M.Troffaes,《概率不精确的决策:简短回顾》,载于:F.Cozman(Ed.),《概率理论与应用不精确学会通讯》,瑞士曼诺,2004年12月,第4-7页。
[71] Troffaes,M.C.M.,《使用不精确概率进行不确定性决策》,《国际近似推理杂志》,45,1,17-29(2007)·Zbl 1119.91028号
[72] L.V.Utkin,T.Augustin,《部分先验信息和一般模糊态度下决策的强大算法》,载于《第四届不精确概率及其应用国际研讨会论文集》,宾夕法尼亚州匹兹堡,2005年7月,第349-358页。;L.V.Utkin,T.Augustin,《部分先验信息和一般模糊态度下决策的强大算法》,载于《第四届不精确概率及其应用国际研讨会论文集》,宾夕法尼亚州匹兹堡,2005年7月,第349-358页。
[73] Walley,P.,《概率不精确的统计推理》(1991),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0732.62004号
[74] 白色,C.C。;El-Deib,香港,转移概率不精确的马尔可夫决策过程,运筹学,42,4,739-749(1994年7月-8月)·兹比尔083790121
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。