摘要:
针对完全未知非线性系统的事件触发最优控制,提出了一种在线辨识-关键学习框架。与经典的基于actor-critic神经网络的自适应动态规划(ADP)方法不同,本文提出了一种基于滤波-回归的方法来重构未知系统动力学,从而避免了控制设计回路中对精确系统模型的依赖。同时,仅利用测量的系统状态和输入数据,设计了神经网络自适应律用于参数估计,方便了辨识器-临界神经网络的设计。分析了自适应律的收敛性。此外,为了降低状态采样频率,在所提出的最优控制设计中嵌入了两种非周期采样方案,即静态和动态事件触发器。最后,通过仿真验证了所提出的事件触发最优控制策略的有效性。