标志 标志
希尔夫
希尔夫
将语言切换为英语

D.尼尔森。und(单位)迈克尔·Höhle(2005): 有限信息决策问题的评价方法。 Sonderforschungsbereich 386,讨论文件421[PDF,379kB]

摘要

有限内存影响图(LIMID)是用于表示有限内存策略的决策问题的通用模型(Lauritzen和Nilsson(2001))。LIMID的评估可以通过单一策略更新来完成,该更新产生本地最大策略,在该策略中,任何单一策略修改都不能增加预期效用。本文检验了获得的局部最大值策略的质量,并提出了三种不同的LIMID评估方法。第一个算法,时态策略更新,类似于单一策略更新。第二种算法贪婪搜索(Greedy Search)不断更新策略,以获得预期效用最大的改进。最后一种算法是模拟退火,它与前面的两种算法不同,它允许搜索采取一些下坡步骤以避开局部最大值。从所获得策略的质量和算法的实现(包括计算复杂性的一些考虑)两方面对算法进行了仔细的比较。

Dokument轴承Dokument轴承