×

连续时间红色和黑色:如何控制向目标的扩散。 (英语) Zbl 0596.93052号

作者考虑了红-黑游戏的连续时间版本,其中玩家从(0,1)中的一点开始,并试图通过控制扩散过程({X_t,t\geq0})的参数(\(mu\),\(sigma)\)来达到他的最终目标1。根据当前位置,在每个时刻从集合中选择这些参数值,以最大化达到1的概率。本文表明,这相当于最大化(mu/sigma^2),至少当最大值是由有界的、可测量的函数实现时,因此粗体(胆小的)播放对于子空气(超空气)连续时间红黑也是最佳的。进一步证明了,如果游戏是超空中的,那么最大化log漂移系数(X_t})的策略可以最小化达到目标的预期时间。
审核人:T.巴萨

MSC公司:

91A60型 概率博弈;赌博
60克40 停车时间;最优停车问题;赌博理论
60J60型 扩散过程
91A15型 随机对策,随机微分对策
93C99号 控制理论中的模型系统
93年20日 最优随机控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接