具有Dirichlet边界条件的广义Hamilton-Jacobi-Bellman方程和随机退出时间最优控制问题

@第{Buckdahn2014GeneralizedHE条,title={带Dirichlet边界条件的广义Hamilton-Jacobi-Bellman方程和随机退出时间最优控制问题},author={Rainer Buckdahn和Tianyang Nie},日志={SIAM J.控制优化},年份={2014},体积={54},pages={602-631},url={https://api.semanticscholar.org/CorpusID:42516577}}
给出了动态规划原理,证明了该值函数是具有Dirichlet边界的广义Hamilton-Jacobi-Bellman方程的粘性解。

带状态约束的随机微分对策和带非线性Neumann问题的Isaacs方程

我们研究了一个两层零和随机微分对策问题,状态过程被约束在一个连通的有界闭域中,代价函数由

随机递归最优控制问题的MP和DPP之间的连接:一般情况下的粘度解框架

本文研究了一个随机递归最优控制问题,其中扩散系数依赖于控制变量,控制域不一定是凸的。我们专注于

带Ef-期望的最优停车/随机组合控制的弱动态规划原理

证明了u*(resp.,u*)是非线性Hamilton–Jacobi–Bellman变分不等式的粘性子(resp..,super-)解。

次线性期望框架下带障碍约束的随机最优控制问题

证明了该值函数是相关Hamilton–Jacobi–Bellman–Isaac方程的唯一粘性解。

N A]5 J un 2 01 9基于神经网络的区域随机博弈全局H2超线性收敛策略迭代算法

通过将该算法解释为HJBI方程的不精确牛顿迭代,证明了数值解在H2范数下全局收敛,并证明了这种收敛是超线性的。

反馈松弛控制的正则性和稳定性

证明了探索参数为零的松弛控制问题的值函数的一阶单调收敛性,从而使得基于反馈松弛控制的原控制问题的纯开发策略成为可能。

G-Brown运动驱动的无限时域随机最优控制问题

本文考虑了一个随机最优控制问题,其中成本函数是通过G-Brownian驱动的无限时域倒向随机微分方程定义的

基于张量序列格式的随机微分方程驱动的退出时间反馈控制问题的近似策略迭代

我们考虑一个随机最优退出时间反馈控制问题。Bellman方程通过策略迭代算法在多项式变换空间上由以下序列近似求解

Bellman方程的最优随机切换和Dirichlet问题

防抱死制动系统。设L'是有界n维域Q中的二阶椭圆算子序列,f'是给定的函数。考虑一下为行李员找到解决方案的问题

广义动态规划原理与hamilton-jacobi-bellman方程

我们将以下完全非线性二阶偏微分方程解释为某个最优控制扩散问题的值函数,其中是一个二阶椭圆偏微分

随机微分对策与Hamilton—Jacobi—Bellman—Isaacs方程的粘性解

将P Peng的BSDE方法从随机控制理论的框架推广到随机微分对策的框架中,并证明了对策的上下值函数的动态规划原理。

f条件期望最优停止与随机控制组合的动态规划原理

在马尔科夫框架下,我们研究了由带跳的BSDE诱导的非线性期望${\cal E}^f$下的组合最优控制/停止问题

扩散过程和hamilton–jacobi–bellman方程的最优控制第2部分:粘性解和唯一性

我们考虑一般最优随机控制问题和相关的Hamilton–Jacobi–Bellman方程。我们发展了一个关于周溶液的一般概念,称为粘度溶液

一类新型抛物型变分不等式的随机解法

我们研究了具有两个次微分算子的拟线性偏微分方程:其中for和the operator(resp.)是凸下半连续的次微分

多维随机控制问题的动态规划

本文研究了一般多维扩散型随机控制问题。我们的模型包含常规控制问题、奇异控制问题和脉冲控制问题

连续时间随机控制问题的数值方法

讨论了一类有效的方法,用于数值逼近扩散、反射扩散或跳跃扩散模型的最优随机控制问题的解。

带次微分算子的前向倒向随机微分方程及其变分不等式

研究了一类具有次微分算子的倒向随机微分方程解的存在唯一性。这类方程包括:,