\`x^2+y_1+z_12^34\`
高级搜索
文章内容
文章内容

基于乐观值的不确定非因果系统零和博弈鞍点解

  • *通讯作者:辛晨

    *通讯作者:辛晨

第一作者得到了中国江苏省高等学校自然科学基金(编号:23KJB110013)和江苏省高等学校引进人才启动基金(编号:163101179)的资助

摘要 全文(HTML) (5)/表(4) 相关论文 引用人
  • 不确定非因果系统(UNSS)是一类被认为是规则的不确定奇异系统。本研究利用乐观值准则研究了UNSS的两层零和对策(TPZSG)。第一步是介绍一种将考虑线性控制项的线性不确定非因果系统(UNCS)转换为包含两类不确定差分方程的子系统的方法。推导了求解线性UNSS下TPZSG的递推方程。利用递推方程,我们给出了求解线性UNCS下TPZSG的算法,并通过一个数值例子说明了如何应用该算法求解此类博弈的鞍点解和均衡值。为了扩展这些结果,我们提供了求解非线性UNCS下TPZSG的相应方程。此外,通过求解方程组,给出了考虑二次控制项的非线性UNCS的鞍点解和TPZSG的平衡值。

    数学学科分类:一次:49L20;次要:91A05。

    引用:

    \开始{方程式}\\结束{方程式{
  • 加载中
  • 图1。 关于控件${\mathbf w}^*(q)=({w}_1^*(k),{w}_2^*(g),{w}_3^*(j))^{\mathrm{T}}的轨迹$

    图2。 关于控件${\mathbf v}^*(q)=({v}_1^*(q),{v}_2^*$

    图3。 关于子状态$\tilde{{mathbfy}}_1(q)=(\tilede{{y}}_{1,1}(q 2,2}(q))^{\mathrm{T}}$

    图4。 关于状态${{mathbfy}}(q)=({{y}}_1(q$

    图5。 关于最优值${J}^{{gamma}}(\tilde{{mathbfy}}_1}(q),\tilde}{mathbf y}}_2}(7),q)$的轨迹$

    表1。 的计算结果${\mathbf l}^{w,q},{\mathbf u}^{w,q,l},}$

    阶段 ${\mathbf l}^{w,q}$ ${\mathbf u}^{w,q,l}$ ${\mathbf l}^{v,q}$ ${\mathbf u}^{v,q,l}$ ${\mathbf r}_{q}$ ${\mathbf s}_{q}$
    0 $ (3, -8, -8) $ $ (3, 29, 1, 9) $ $ (1, 2) $ $ (0, 3) $
    1 $ (-1, 2, 3) $ $ (-3, 3, 0) $ $(-1、-15、-2、-6)$ $(0,3,0,3)$ $ (-6, 4) $ $ (0, 2) $
    2 $ (8, -5, 2) $ $ (2, -2, 0) $ $ (1, -2, 5, -4) $ $ (0, -2, 0, -2) $ $ (3, 2) $ $ (0, 1) $
    $ (-3, 7, 6) $ $ (-1, 1, 0) $ $ (4, -1, 6, 1) $ $(0,1,0,1)$ $ (-2, -8) $ $ (0, 2) $
    4 $ (-2, 6, 7) $ $ (2, -2, 0) $ $ (5, -5, 6, -2) $ $ (0, -2, 0, -2) $ $ (-2, -4) $ $ (0, -3) $
    5 $ (5, -6, -2) $ $ (3, -3, 0) $ $ (-7, -19, -7, -9) $ $ (0, -3, 0, -3) $ $ (-2, -2) $ $ (0, -1) $
    6 $ (14, -18, -8) $ $ (-1, 1, 0) $ $ (-9, -13, -9, -11) $ $ (0, 1, 0, 1) $ $ (6, 0) $ $ (2, 9) $
    7 $ (5, 0) $ $ (0, 7) $
    |显示表格
    下载:CSV公司

    表2。 TPZSG的鞍点解(31)

    阶段 ${\mathbf w}^*(q)$ ${\mathbf v}^*(q)$
    0 $(1,-1,-1)^{\mathrm{T}}$ $(-1、-1、-1和-1)^{\mathrm{T}}$
    1 $(-1,1,1)^{\mathrm{T}}$ $(1,1,1)^{\mathrm{T}}$
    2 $(1,-1,1)^{\mathrm{T}}$ $(-1,1,-1,1)^{\mathrm{T}}$
    $(-1,1,1)^{\mathrm{T}}$ $(-1,1,-1,-1)^{\mathrm{T}}$
    4 $(-1,1,1)^{\mathrm{T}}$ $(-1,1,-1,1)^{\mathrm{T}}$
    5 $(1,-1,-1)^{\mathrm{T}}$ $(1,1,1,1)^{\mathrm{T}}$
    6 $(1,-1,-1)^{\mathrm{T}}$ $(1,1,1)^{\mathrm{T}}$
    |显示表格
    下载:CSV公司

    表3。 TPZSG的平衡子状态(31)

    阶段 $\波浪线{\mathbf\eta}(q)$ $\波浪线{{\mathbf y}}_1(q)$ $\波浪线{{\mathbf y}}_2(q)^{\mathrm{T}}$
    0 美元(-0.9126,0.5958,0.9724,-0.1265)^{\mathrm{T}}$ $(1.1500,1.2500)^{\mathrm{T}}$ $ (15, 4) $
    1 $(-0.3105,-0.9024,-0.54959,0.1620)^{\mathrm{T}}$ $(6.1776,3.3117)^{\mathrm{T}}$ $ (-15, -4) $
    2 $(0.2028,-0.4950,0.3087,-0.8798)^{\mathrm{T}}$ $(0.7272,5.4470)^{\mathrm{T}}$ $ (7, 0) $
    $(0.8810,-0.8149,-0.3320,0.3021)^{\mathrm{T}}$ $(-1.581511.4922)^{\mathrm{T}}$ $ (-7, -2) $
    4 $(0.0078,0.0619,-0.2418,0.5378)^{\mathrm{T}}$ $(-1.2495,22.7430)^{\mathrm{T}}$ 美元(-11,-4)$
    5 美元(-0.4350,0.2985,0.8444,-0.3387)^{\mathrm{T}}$ $(-3.0077,45.6378)^{\mathrm{T}}$ 美元(7,0)$
    6 $(0.6269,0.5753,-0.7514,-0.6852)^{\mathrm{T}}$ $(-9.8521,92.0029)^{\mathrm{T}}$ $ (4.7500, 0) $
    7 $ (-15.1007, 185.6689) $ $ (1.0500, 2.2500) $
    |显示表格
    下载:CSV公司

    表4。 最佳值${J}^{{gamma}}(波浪形{{mathbfy}}_1}(q),波浪形{波浪形y}}_2}(7),q)$具有${\gamma}=0.1、0.3、0.5、0.7、0.9$

    阶段 ${\gamma}=0.1$ ${\gamma}=0.3$ ${\gamma}=0.5$ ${\gamma}=0.7$ ${\gamma}=0.9$
    0 $ 328.8000 $ $ 333.6000 $ $ 338.4000 $ 343.2000 348
    1 $ 195.4766 $ $ 213.3778 $ $ 235.6814 $ 249.3001 273.6221
    2 $ 217.9950 $ $ 232.1063 $ $ 242.3256 $ 253.8126 265.0681
    $ 51.8373 $ $ 72.4275 $ $ 105.7251 $ 118.7497 131.0201
    4 $ 10.7047 $ 41.2590美元$ 74.7768美元$ 87.8639 110.8795
    5 $ -25.0128 $ $ 11.7457 $ $ 49.4897 $ 70.0677 96.7305
    6 $ 27.1780 $ $ 35.5346 $ $ 45.2375 $ 57.3470 67.3636
    7 $ -57.3423 $ $ -58.0937 $ $ -59.7536 $ $ -65.3281 $ $ -69.5909 $
    |显示表格
    下载:CSV公司
  • [1] V.阿亚拉P.Jouan先生李群上的奇异线性系统;等效性,系统和控制信件,120(2018), 1-8. 数字对象标识:2016年10月10日/j.sysconle.2018.07.010。
    [2] P.巴贾里H.Hong(香港)S.P.瑞恩,完全信息离散博弈的识别和估计,计量经济学,78(2010), 1529-1568. 数字对象标识:10.3982/ECTA5434。
    [3] P.卡达利亚奎特C.希梅内兹奎恩波霉,不完全信息微分对策中的纯策略和随机策略,动力学与游戏杂志,1(2014), 363-375. 数字对象标识:10.3934/jdg.2014.1.363。
    [4] X.陈Y.Zhu先生,具有多个时间延迟的不确定随机奇异系统的最优控制,混沌、孤子和分形,152(2021), 111371. 数字对象标识:2016年10月10日/j.chaos.2021.111371。
    [5] X.陈Y.Zhu先生B.李,不确定随机连续系统的最优控制,优化,72(2023), 1385-1428. 数字对象标识:10.1080/02331934.2021.2017429.
    [6] X.陈Y.Zhu先生J.H.公园,不确定随机奇异动力系统的两人博弈,IET控制理论与应用,17(2023), 542-558. 数字对象标识:1049年10月10日/12400年10月2日。
    [7] X.陈Y.Zhu先生J·沈、最优环境污染控制的投入产出动态模型,应用数学建模,83(2020), 301-321. 数字对象标识:2016年10月10日/j.apm.2020.02.029。
    [8] W.Chen先生F.高S.Xu先生Y.Li(李彦宏)Y.Chu(朱棣文),通过动态输出反馈控制实现不确定奇异马尔可夫跳跃系统的鲁棒镇定,系统和控制信件,171(2023), 105433. 数字对象标识:2016年10月10日/j.sysconle.2022.105433。
    [9] Z.Chen(陈)薛伟(W.Xue)N.李B.廉F.L.刘易斯,一种新的基于Z函数的非线性系统有限时域零和博弈的完全无模型强化学习方法,非线性动力学,107(2022), 2563-2582. 
    [10] D.科布奇异系统中的能控性、能观性和对偶性,IEEE自动控制汇刊,29(1984), 1076-1082. 数字对象标识:10.1109/TAC.1984.1103451。
    [11] D.达赫马尼M.谢里夫S.拉拉比,分割皮肤区域的零和博弈模型,图像和视觉计算,99(2020), 103925. 
    [12] 戴立群,奇异控制系统1989年,柏林,施普林格-弗拉格出版社。数字对象标识:2007年10月10日/BFb0002475。
    [13] L.邓Z.你Y.Chen先生,具有跳跃的多维不确定最优控制的最优值模型,欧洲控制杂志,39(2018),1-7数字对象标识:2016年10月10日/j.ejcon.2017.09.002。
    [14] 丁毅(Y.Ding)F.翁F.耿,不确定半状态系统的状态能量约束控制器设计及其在机械系统控制中的应用,机械工程师学会会刊,C辑:机械工程科学杂志,233(2019), 4850-4862. 
    [15] N.El-Karoui公司S.哈马德随机泛函微分方程的零和和非零和博弈问题,随机过程及其应用,107(2003), 145-169. 数字对象标识:10.1016/S0304-4149(03)00059-0。
    [16] A.埃马迪使用广义状态空间平均方法对多变换器直流电力电子系统进行建模和分析,IEEE工业电子学报,51(2004), 661-668. 
    [17] J·冯Z.Cheng先生S.马,一类多时滞离散广义系统的奇异线性二次最优控制问题,国际系统科学杂志,34(2003), 293-301. 数字对象标识:10.1080/0020772031000158528.
    [18] D.哈拉特H.加萨拉A.El.哈贾吉M.Chaabane先生、传感器和执行器故障的Takagi-Sugeno广义非线性系统的自适应观测器和容错控制,国际控制、自动化和系统杂志,16(2018), 972-982. 
    [19] M.A.Khosravi先生H.D.Taghirad先生,弹性索并联机器人的动力学建模与控制:奇异摄动法,IEEE机器人汇刊,30(2014), 694-704. 
    [20] D.李A.基梅尔A.M.巴彦C.J.汤姆林,状态约束最优控制和零和博弈问题的Hamilton-Jacobi公式,第59届IEEE决策与控制会议,78(2020), 1078-1085. 
    [21] D.Lee和C.J.Tomlin,两类状态约束零和对策的Hamilton-Jacobi方程,预印本,2021年,arXiv:2106.15006.
    [22] F.L.刘易斯二维隐式系统综述,软计算,28(1992), 345-354. 数字对象标识:10.1016/0005-1098(92)90120-5.
    [23] B.李Y.Shu先生Y.太阳K.L.Teo先生,不同风险偏好下不确定投资组合优化问题的乐观值变分模型,软计算,25(2021), 3993-4001. 
    [24] B.李R.Zhang(张瑞敏)T·金Y.Shu先生,不确定微分对策的参数近似最优控制及其在反恐中的应用,混沌、孤子和分形,146(2021), 110940. 数字对象标识:2016年10月10日/j.chaos.2021.110940。
    [25] 十、李Q.宋刘彦(Y.Liu)F.E.阿尔萨迪,考虑跳跃不确定动力系统零和微分对策的Hurwicz模型的鞍点平衡,国际系统科学杂志,54(2023),第357-370页数字对象标识:10.1080/00207721.2022.2122903.
    [26] 十、李Q.宋Z.赵刘彦(Y.Liu)F.E.阿尔萨迪,考虑多因素和不确定性奇异系统的Hurwicz模型的最优控制和零和微分对策,国际系统科学杂志,53(2022), 1416-1435. 数字对象标识:10.1080/00207721.2021.2005175.
    [27] B.刘,不确定性理论,2$^{nd}$版,施普林格-弗拉格出版社,柏林,2004年。数字对象标识:10.1007/978-3-540-39987-2.
    [28] E.马尔蒂罗相曹先生,识别线性二次零和微分对策的逆强化学习,系统控制信件,172(2023), 105438. 数字对象标识:2016年10月10日/j.sysconle.2022.105438。
    [29] J.V.诺依曼、Zur theorie der gesellschaftsspiele、,数学年刊,100(1928), 295-320. 数字对象标识:2007年10月10日/BF01448847。
    [30] J.V.诺依曼O.摩根斯顿博弈论与经济行为普林斯顿大学出版社,普林斯顿,1994年
    [31] S.Pradhan公司,跳跃扩散的风险敏感零和随机微分对策,系统控制通知。,157(2021),105033数字对象标识:2016年10月10日/j.sysconle.20211.105033。
    [32] W.Qi先生G.宗庆后H.R.卡里姆,基于观测器的非线性不确定奇异半马尔可夫跳跃系统自适应SMC及其在直流电机中的应用,IEEE电路与系统汇刊I:常规论文,65(2018), 2951-2960. 数字对象标识:10.1109/TCSI.2018.2797257。
    [33] H.H.罗森布罗克,线性动力系统的结构特性,国际控制杂志,20(1974), 191-202. 数字对象标识:10.1080/00207177408932729.
    [34] Y.Shu先生,离散广义非因果系统的最优控制,亚洲控制杂志,23(2021), 1885-1899. 数字对象标识:2002年10月10日/第2343页。
    [35] Y.太阳C.丁Y.Zhu先生不确定环境下的鞍点平衡,应用科学中的数学方法,41(2018), 2063-2073. 数字对象标识:10.1002/mma.4733。
    [36] Y.Shu先生B.李,不确定切换系统在乐观值准则下的稳定性和吸引性分析,SIAM控制与优化杂志,60(2022), 2420-2439. 数字对象标识:10.1137/21M1450343。
    [37] Y.Shu先生B.李,离散随机广义系统的线性二次最优控制,工业与管理优化杂志,18(2022), 1583-1602. 数字对象标识:10.3934/jimo.2021034。
    [38] Y.Shu先生B.李,离散随机非因果系统基于期望值的最优控制,优化信函,16(2022), 1847-1879. 数字对象标识:10.1007/s11590-021-01807-z。
    [39] Y.太阳H.闫Y.Zhu先生,不确定离散系统的鞍点平衡模型,软计算,25(2021), 1099-1112. 
    [40] Y.Shu先生Y.Zhu先生,基于乐观值的不确定线性奇异系统最优控制及其在动态输入输出模型中的应用,ISA交易,71(2017), 235-251. 
    [41] Y.太阳Y.Zhu先生,不确定鞍点问题的Bang-Bang性质,数学年刊,28(2017), 605-613. 
    [42] Y.Shu先生Y.Zhu先生,不确定连续广义系统的稳定性和最优控制,欧洲控制杂志,34(2017), 16-23. 数字对象标识:2016年10月10日/j.ejcon.2016.12.003。
    [43] S.Xu和J.Lam,奇异系统的鲁棒控制与滤波施普林格-弗拉格出版社,柏林,2006年。
    [44] S.Xu先生P.范杜伦R.斯特凡林俊杰(J.Lam),具有状态时滞和参数不确定性的广义系统的鲁棒稳定性和镇定,IEEE自动控制汇刊,47(2002), 1122-1128. 数字对象标识:10.1109/TAC.2002.800651。
    [45] X.杨J.高,线性二次不确定微分对策及其在资源提取问题中的应用,IEEE模糊系统汇刊,24(2016), 819-826. 
    [46] Q.Zhang和S.Xing,随机奇异系统的稳定性分析和最优控制,优化信函,8(2014), 1905-1920.数字对象标识:10.1007/s11590-013-0687-5。
    [47] Y.Zhang(张)十、亩离散马尔可夫广义系统的事件触发输出量化控制,Automatica公司,135(2022), 109992. 数字对象标识:10.1016/j.自动.2021.109992。
    [48] J.赵Y.Lv先生Z.赵、基于自适应学习的CT双层零和博弈输出反馈最优控制,IEEE电路与系统汇刊II:快速简报,69(2021), 1437-1441. 
  • 加载中

数字(5)

桌子(4)

分享

文章指标

HTML视图(919) PDF下载(169) 引用人(0)

访问历史记录

作者撰写的其他文章

目录

    /

    返回
    返回