文件Zbl 1231.91073-zbMATH Open

偏好部分有序的顺序决策。（英语） Zbl 1231.91073号

Artif公司。智力。 175，编号7-8，1346-1365（2011）.

摘要：本文提出了偏序偏好序列决策中策略选择的新见解和新算法；也就是说，某些策略可能与预期效用不可比较。我们假设策略之间的不可比性是由概率值的不确定性/不精确性引起的。我们研究了后果主义策略选择的六个标准：\（\varGamma\）-最大值、\（\varGamma\）-最大值、\（\varGamma\）-最大值、区间优势、最大值和E容许性。我们关注流行的决策树和影响图表示。算法采用线性/多线性规划；我们描述了实现和实验。

引用于14文件

MSC公司：

91B06型	决策理论
06年06月06日	部分订单，通用
90 C90	数学规划的应用

关键词：

不确定性下的序贯决策；部分排序首选项；概率测度集；选择标准；结果主义和坚定的规范；线性和多线性规划

软件：

CP网络

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Allais，M。；Hagen，O.，《预期效用假设和阿拉斯悖论》（1979年），D.Reidel出版公司：D.Reider出版公司，荷兰多德雷赫特·Zbl 0468.90002号
[2]	Aumann，R.J.，《没有完备性公理的效用理论》，《计量经济学》，第30、3、445-461页（1962年7月）·Zbl 0121.5202号
[3]	Berger，J.O.，《统计决策理论和贝叶斯分析》（1985），Springer:Springer New York·Zbl 0572.62008号
[4]	Bertsimas博士。；Tsitsiklis，J.N.，《线性优化导论》（1997），雅典娜科学出版社：马萨诸塞州贝尔蒙特市雅典娜科学出版社
[5]	布鲁姆，L。；Brandeburger，A。；Dekel，E.，《不确定性下的词汇概率和选择》，《计量经济学》，59，1，61-79（1991年1月）·Zbl 0732.90005号
[6]	B.Bonet，R.Givan，摘自：《第五届国际规划竞赛：非确定性轨道，呼吁参与》，2005年。；B.Bonet，R.Givan，摘自：《第五届国际规划竞赛：非确定性轨道，呼吁参与》，2005年。
[7]	Boutiler，C。；R.I.布拉夫曼。；胡斯，H.H。；Poole，D.，《CP-nets:用条件对等偏好语句表示和推理的工具》，《人工智能研究杂志》，21135-191（2004）·Zbl 1080.68685号
[8]	Breese，J。；Fertig，K.，《利用区间影响图进行决策》，（第六届人工智能不确定性会议（1990年），爱思唯尔科学：爱思唯尔科学纽约），122-129
[9]	Bykvist，K.，《时间-部分道德与动态选择》，（Rabinowicz，W.，《价值与选择——决策理论和道德哲学中的一些常见主题》，《隆德哲学报告》（2000）），53-64
[10]	G.F.Cooper，《使用信念网络作为影响图的方法》，载于：《第四届人工智能不确定性会议论文集》，明尼阿波利斯，1988年，第55-63页。；G.F.Cooper，《使用信念网络作为影响图的方法》，载于：《第四届人工智能不确定性会议论文集》，明尼阿波利斯，1988年，第55-63页。
[11]	库索，I。；道德，S。；Walley，P.，《不精确概率独立性概念的调查，风险，决策和政策》，5，2，165-181（2000）
[12]	Cozman，F.G.，概率集的分离性质，（Boutilier，C.；Goldszmidt，M.，第16届人工智能不确定性会议论文集（2000年7月），Morgan Kaufmann：Morgan Kaufmann旧金山），107-115
[13]	Cozman，F.G.，不精确概率的图形模型，国际近似推理杂志，39，2-3，167-184（2005年6月）·Zbl 1099.68111号
[14]	丹尼尔森，M。；Ekenberg，L.，计算区间决策树的上下限，欧洲运筹学杂志，181,2808-816（2007年9月）·Zbl 1131.91016号
[15]	丹尼尔森，M。；埃肯伯格，L。；Johansson，J。；Larsson，A.，The DecideIT decision tool，（Bernard，J.-M.；Seidenfeld，T.；Zaffalon，M.，《第三届不精确概率及其应用国际研讨会论文集》（2003年7月），Carleton Scientific:Carleton Scientific Lugano，Switzerland），204-217
[16]	de Campos，C.P。；Cozman，F.G.，《使用多线性编程进行信用网络推断》，（第二届欧洲启动人工智能研究者研讨会论文集（2004年8月），IOS出版社：西班牙巴伦西亚IOS出版社），50-61
[17]	de Campos，C.P。；Cozman，F.G.，贝叶斯网络和可信度网络的推理复杂性，（第九届国际人工智能联合会议论文集（2005年7月至8月），爱丁堡：爱丁堡苏格兰，英国），1313-1318
[18]	C.P.de Campos，F.G.Cozman，《通过整数规划进行信用网络推断》，载于：《不精确概率：理论与应用国际研讨会》，布拉格，2007年，第145-154页。；C.P.de Campos，F.G.Cozman，《通过整数规划进行信用网络推断》，载于：《不精确概率：理论与应用国际研讨会》，布拉格，2007年，第145-154页。
[19]	C.P.de Campos，Q.Ji，《使用不精确概率的影响图中的策略选择》，摘自：《第24届人工智能不确定性会议论文集》，芬兰赫尔辛基，2008年7月，第121-128页。；C.P.de Campos，Q.Ji，《使用不精确概率的影响图中的策略选择》，摘自：《第24届人工智能不确定性会议论文集》，芬兰赫尔辛基，2008年7月，第121-128页。
[20]	Ellsberg，D.，风险、歧义和萨维奇公理，《经济学季刊》，75，4，643-669（1961）·Zbl 1280.91045号
[21]	Etchart，N.，《序贯框架下非欧盟决策的充分情绪》，《理论与决策》，52，1-28（2002年2月）·Zbl 1032.91586号
[22]	Fertig，K。；Breese，J.，影响图的概率区间，IEEE模式分析和机器智能汇刊，15，3，280-286（1993）
[23]	Fishburn，P.C.，《决策的效用理论》（1970），Kriefer出版公司：Kriefer-出版公司，纽约·兹比尔0213.46202
[24]	Georgakopoulos，G。；卡夫瓦迪亚，D。；Papadimitriou，C.H.，概率可满足性，复杂性杂志，4，1，1-11（1988年3月）·Zbl 0647.68049号
[25]	吉尔博亚，I。；Schmeidler，D.，具有非唯一先验的Maxmin期望效用，《数学经济学杂志》，18，2，141-153（1989）·Zbl 0675.90012号
[26]	Giron，F.J。；Rios，S.，《准贝叶斯行为：一种更现实的决策方法？（1980），大学出版社：瓦伦西亚大学出版社·Zbl 0459.62006年
[27]	Hailperin，T.，事件逻辑函数概率的最佳可能不等式，《美国数学月刊》，72343-359（1965）·Zbl 0132.13706号
[28]	Hammond，P.J.，《改变口味和连贯的动态选择》，《经济研究评论》，第43、1、159-173页（1976年）·Zbl 0367.90011号
[29]	P.J.Hammond，后果主义和独立公理，载于：B.R.Munier（编辑），风险、决策和理性（第三届效用、风险和决策理论基础与应用国际会议论文集），荷兰多德雷赫特，1988年，第503-516页。；P.J.Hammond，后果主义和独立公理，收录于：B.R.Munier（编辑），风险、决策和理性（第三届效用、风险和决策理论基础和应用国际会议论文集），荷兰多德雷赫特，1988年，第503-516页·Zbl 0667.90006号
[30]	Hammond，P.J.，有序决策理论：评塞登菲尔德教授，经济学与哲学，4272-297（1988）
[31]	P.Hansen，B.Jaumard，《概率满意度》，技术代表G-96-31，GERAD研究所，蒙特勒理工学院，1996年。；P.Hansen，B.Jaumard，《概率满意度》，技术代表G-96-31，《GERAD研究所》，蒙特勒理工学院，1996年·Zbl 1015.68198号
[32]	Hansen，P。；Perron，S.，《概率可满足性的局部和全局方法的合并》，《国际近似推理杂志》，47，2，125-140（2008）·Zbl 1343.68220号
[33]	Harmanec，D.，将马尔可夫决策过程推广到不精确概率，统计规划与推断杂志，105，1，199-213（2002年6月）·Zbl 1019.90048号
[34]	霍华德·R·A。；Matheson，J.E.，影响图，决策分析，2，3，127-143（2005）
[35]	N.Huntley，M.Troffaes，《低预知决策树的有效范式解》，载于：《概率统计软方法国际研讨会》，2008年，第419-426页。；N.Huntley，M.Troffaes，《低预知决策树的有效范式解》，载于：《概率统计软方法国际研讨会》，2008年，第419-426页。
[36]	L.Hurwicz，无知下决策的一类标准，Cowles委员会论文3561951。；L.Hurwicz，《无知下决策的一类标准》，Cowles委员会文件3561951年。
[37]	伊藤·H。；Nakamura，K.，参数不精确的部分可观测马尔可夫决策过程，人工智能，171，8-9，453-490（2007）·Zbl 1168.68578号
[38]	J.-Y.Jaffray，《概率不精确的理性决策》，载于：G.D.Cooman，F.G.Cozman，S.Moral，P.Walley（编辑），《第一届不精确概率及其应用国际研讨会论文集》，比利时根特，1999年6月，第183-188页。；J.-Y.Jaffray，《概率不精确的理性决策》，载于：G.D.Cooman，F.G.Cozman，S.Moral，P.Walley（编辑），《第一届不精确概率及其应用国际研讨会论文集》，比利时根特，1999年6月，第183-188页。
[39]	Jaumard，B。；Hansen，P。；de Aragáo，M.P.，概率逻辑的列生成方法，ORSA计算杂志，3，2，135-148（1991）·兹比尔0800.68864
[40]	Kahneman，D。；Tversky，A.，《前景理论：风险下的决策分析》，《计量经济学》，第47期，第262-291页（1979年）·Zbl 0411.90012号
[41]	D.Kikuti，F.G.Cozman，部分有序偏好的影响图，收录于：第三届偏好处理进展多学科研讨会，2007年。；D.Kikuti，F.G.Cozman，部分有序偏好的影响图，收录于：第三届偏好处理进展多学科研讨会，2007年。
[42]	基库蒂，D。；Cozman，F.G。；de Campos，C.P.，《决策树中的部分有序偏好：概率不精确的计算策略》，（偏好处理进展研讨会（2005年7月），爱丁堡：英国爱丁堡），118-123
[43]	Kyburg，H.E。；Pittarelli，M.，基于集合的贝叶斯主义，IEEE系统汇刊，人与控制论，A部分，26，3，324-339（1996）
[44]	Lauritzen，S.L。；Nilsson，D.，用有限信息表示和解决决策问题，《管理科学》，47，9，1235-1251（2001）·Zbl 1232.90343号
[45]	列维，I.，《论不确定性概率》，《哲学杂志》，71，391-418（1974）
[46]	列维，I.，《知识的企业》（1980），麻省理工学院出版社：麻省理学学院出版社
[47]	卢斯·R·D。；Raiffa，H.，《游戏与决策》（1957），威利：威利纽约·兹伯利0084.15704
[48]	罗，C。；Yu，C。；Lobo，J。；王，G。；Pham，T.，从不确定数据计算概率的最佳界，计算智能，12，4，541-566（1996）
[49]	Machina，M.J.，《不确定性下的动态一致性和选择的非预期效用模型》，《经济文献杂志》，27,41622-1688（1989年12月）
[50]	McClennen，E.F.，《理性与动态选择：基础探索》（1990），剑桥大学出版社：剑桥大学出版社
[51]	McClennen，E.F.，《实用理性与规则》，《哲学与公共事务》，第26、3、210-258页（1997年）
[52]	T.D.Nielsen，J.-Y.Jaffray，基于秩相关效用的理性决策操作方法，2001年，未出版手稿网址：http://www.cs.aau.dk/tdn/papers/nielsen-jaffray-01.pdf；T.D.Nielsen，J.-Y.Jaffray，基于秩相关效用的理性决策操作方法，2001年，未出版手稿网址：http://www.cs.aau.dk/tdn/papers/nielsen-jaffray-01.pdf
[53]	尼尔森，T.D。；Jensen，F.V.，定义良好的决策场景，（第十五届人工智能不确定性会议论文集（1999年7月），Morgan Kaufmann：Morgan Kaufmann斯德哥尔摩，瑞典），502-511
[54]	Pearl，J.，《智能系统中的概率推理：似然推理网络》（1988），摩根考夫曼出版社：摩根考夫文出版社，加利福尼亚州洛斯阿尔托斯
[55]	Quiggin，J.C.，预期效用理论，《经济行为与组织杂志》，3，4，323-343（1982年12月）
[56]	Raiffa，H.，《决策分析：不确定性下的选择入门讲座》（1968），Addison-Wesley:Addison-Whesley Massachusetts·Zbl 0181.21802号
[57]	萨缪尔森，P.A.，《显示偏好的消费理论》，《计量经济学》，第15期，第243-253页（1948年）
[58]	Satia，J.K。；Lave，R.E.，转移概率不确定的马尔科夫决策过程，运筹学，21,3728-740（1973年5月-6月）·Zbl 0286.60038号
[59]	M.J.Schervish，T.Seidenfeld，J.B.Kadane，I.Levi，预期效用理论的扩展和两两比较的一些局限性，摘自：第三届不精确概率及其应用国际研讨会论文集，瑞士卢加诺，2003年7月，第496-510页。；M.J.Schervish，T.Seidenfeld，J.B.Kadane，I.Levi，预期效用理论的扩展和两两比较的一些局限性，载于《第三届不精确概率及其应用国际研讨会论文集》，瑞士卢加诺，2003年7月，第496-510页。
[60]	Seidenfeld，T.，与（凸）概率集一起使用的两个决策规则之间的对比：\（Γ\）-最大化与E-可容许性，Synthese，140，1-269-88（2004年5月）
[61]	塞登菲尔德，T。；Schervish，M.J。；Kadane，J.B.，《无需命令的决定》（Sieg，W.，《行动与反思》（1990），Kluwer学术出版社：Kluwer-学术出版社Dordrecht），143-170
[62]	塞登菲尔德，T。；Schervish，M.J。；Kadane，J.B.，《部分有序偏好的表示》，《统计年鉴》，23，62168-2217（1995年12月）·Zbl 0871.62008号
[63]	Shachter，R.，Bayes-Ball:理性消遣（用于确定信念网络和影响图中的无关性和必要信息），（第十四届人工智能不确定性年会论文集（UAI-98）（1998年），Morgan Kaufmann:Morgan Koufmann San Francisco，CA），480-487
[64]	Shachter，R.，《信息计算的有效价值》，（第十五届人工智能不确定性年会论文集（UAI-99）（1999），摩根考夫曼：摩根考夫曼旧金山，加利福尼亚州），594-601
[65]	Sherali，H.D。；Tuncbilek，C.H.，《使用重新格式化线性化技术解决多项式规划问题的全局优化算法》，《全局优化杂志》，2，1，101-112（1992年3月）·Zbl 0787.90088号
[66]	Simon，H.A.，理性选择的行为模型，《经济学季刊》，69，1，99-118（1955）
[67]	Strotz，R.，动态效用最大化中的近视和不一致，《经济研究评论》，23，3，165-180（1956）
[68]	Tatman，J.A。；Shachter，R.D.，动态规划和影响图，IEEE系统、人与控制论汇刊，20，2，365-379（1990）·Zbl 0715.90094号
[69]	F.W.Trevizan，F.G.Cozman，L.L.de Barros，《风险下的规划和奈特氏不确定性》，载于：国际人工智能联合会议，2007年，第2023-2028页。；F.W.Trevizan，F.G.Cozman，de Barros法律公告，《风险下的规划和骑士式的不确定性》，载于：2007年国际人工智能联合会议，第2023-2028页。
[70]	M.C.M.Troffaes，《概率不精确的决策：简短回顾》，载于：F.Cozman（Ed.），《概率理论与应用不精确学会通讯》，瑞士曼诺，2004年12月，第4-7页。；M.C.M.Troffaes，《概率不精确的决策：简短回顾》，载于：F.Cozman（Ed.），《概率理论与应用不精确学会通讯》，瑞士曼诺，2004年12月，第4-7页。
[71]	Troffaes，M.C.M.，《使用不精确概率进行不确定性决策》，《国际近似推理杂志》，45，1，17-29（2007）·Zbl 1119.91028号
[72]	L.V.Utkin，T.Augustin，《部分先验信息和一般模糊态度下决策的强大算法》，载于《第四届不精确概率及其应用国际研讨会论文集》，宾夕法尼亚州匹兹堡，2005年7月，第349-358页。；L.V.Utkin，T.Augustin，《部分先验信息和一般模糊态度下决策的强大算法》，载于《第四届不精确概率及其应用国际研讨会论文集》，宾夕法尼亚州匹兹堡，2005年7月，第349-358页。
[73]	Walley，P.，《概率不精确的统计推理》（1991），查普曼和霍尔：查普曼与霍尔伦敦·Zbl 0732.62004号
[74]	白色，C.C。；El-Deib，香港，转移概率不精确的马尔可夫决策过程，运筹学，42，4，739-749（1994年7月-8月）·兹比尔083790121

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

偏好部分有序的顺序决策。（英语） Zbl 1231.91073号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

偏好部分有序的顺序决策。 （英语） Zbl 1231.91073号

MSC公司：

关键词：

软件：

参考文献：

偏好部分有序的顺序决策。（英语） Zbl 1231.91073号