\`x^2+y_1+z_12^34\`
高级搜索
文章内容
文章内容

一种基于提升IRK积分器和精确罚函数的连续不等式约束最优控制问题的有效伴随计算方法

  • *通讯作者:江沧华

    *通讯作者:江沧华
摘要 全文(HTML) (2)/表(5) 相关论文 引用人
  • 用于求解最优控制问题(OCP)的伴随方法有一个限制,即约束的数量应小于优化变量的数量。否则,它们的效率低于正向方法。本文提出了一种求解带连续时间不等式约束的指数-1$微分代数系统OCP的有效伴随方法。连续时间不等式约束不是在时间网格上离散化的,而是转化为积分,并通过精确的惩罚函数惩罚成本。因此,可以删除优化变量上除方框约束之外的所有约束。此外,采用带伴随灵敏度传播的提升隐式Runge-Kutta(IRK)积分器来加速函数和梯度计算过程。基于灵敏度更新技术,正向仿真中涉及的牛顿迭代次数可以减少到一次。此外,利用拉格朗日插值逼近非配置点上的状态,使得罚函数中的积分可以在同一网格上进行正演计算。复杂度分析表明,对于该算法,灵敏度传播所涉及的计算与正向算法相当。对Delta机器人最优机动的数值仿真表明,该伴随算法的计算速度与基于提升IRK积分器和前向灵敏度传播的前向伴随算法相当。

    数学学科分类:一次:65M70、49M15;次要:90C30。

    引用:

    \开始{方程式}\\结束{方程式{
  • 加载中
  • 图1。 角度$\boldsymbol{\vartheta}$和位置$\mathbf{p}的轨迹$

    图2。 电机转矩$\mathbf{T}$及其时间导数的轨迹$

    表1。 函数求值的计算复杂度(浮点)和内存使用量(浮点数)的比较

    算法1和2 中的方案Ⅱ[9]
    (13)(18) $2pqn_k^2[\frac{n_k}{3}+1+n_xi]$ $2pqn_k^2[\frac{n_k}{3}+1+n_xi]$
    (19)(20) $4pqrn_xn_\xi$ $4pqrn_xn_\xi$
    (21) $(n_\mathrm{cp}+1)n_\Psi$ $n_\Psi(磅/平方英寸)$
    (24) $4pq(n_x+n_\mathrm{cp}+1)(n_x+1)$ $pq[(4+2n_c)n_x+4](n_x+1)$
    (25) $2(n_mathrm{cp}+1)n_p+4pqn_x(n_u+1+n_v)$ $2n_p+(4+2n_c)pqn_x(n_u+1+n_v)$
    TP(转移定价) $2pqn_kn_\xi$ $2pqn_kn_\xi$
    内存使用情况 $n_M+(n_\mathrm{cp}+1)[2pq(n_x+1)+n_\omega+1]$ $n_M+n_c(n_x+1)+[2pq(n_x+1)+n_\omega+1]$
    |显示表格
    下载:CSV公司

    表2。 Delta机器人模型(26)中的状态

    描述
    $\boldsymbol{\vartheta}\triangleq[\vartheta_1,\varthe塔_2,\vartheta_3]^\top$ 臂的安装角度
    $\mathbf{p}\tatragleq[p_1,p_2,p_3]^\top$ 机舱位置
    $\mathbf{z}\triangleq[z_1,z_2,z_3]^\top$ 拉格朗日乘数
    $\mathbf{T}\triangleq[T_1,T_2,T_3]^\top$ 电动机转矩
    $\mathbf{q}\triangleq[\boldsymbol{\vartheta}^\top,\mathbf{p}^\top]^\top$ 机器人的位置
    |显示表格
    下载:CSV公司

    表3。 Delta机器人模型(26)中的参数

    参数 价值 参数 价值
    1美元$ 20万美元 $\字母_1$ 0美元拉德
    $1_f美元$ 60万美元 $\字母_2$ $\压裂{2\pi}{3}$rad
    百万美元$ 0.05美元千克 $\字母_3$ $\压裂{4\pi}{3}$rad
    $J_r$ 0.1\mathrm{kgm}^2美元$ $克$ 9.8美元\mathrm{ms}^{-2}$
    |显示表格
    下载:CSV公司

    表4。 问题边界(27)

    参数 价值 参数 价值
    $\vartheta_1^l,\vartheta _2^l,\ vartheta _3^l$ $-\frac{\pi}{2}$rad $\vartheta_1^u,\vartheta _2^u,\ vartheta _3^u$ 0美元拉德
    $T_1^l、T_2^l、T3^l$ $-5$Nm $T_1^u、T_2^u、T3^u$ $5$Nm
    美元\点{T} 1个^我$ $-30\mathrm{Nms}^{-1}$ 美元\点{T} 1个^u个$ $30\mathrm{Nms}^{-1}$
    美元\点{T} _2^我$ $-50\mathrm{Nms}^{-1}$ 美元\点{T} _2^u个$ $50\mathrm{Nms}^{-1}$
    美元\点{T} _3个^我$ $-50\mathrm{Nms}^{-1}$ 美元\点{T} _3个^u个$ $50\mathrm{Nms}^{-1}$
    |显示表格
    下载:CSV公司

    表5。 计算复杂性和准确性的比较

    美元$ $\theta$可调 $\theta$固定
    算法1 中的方案Ⅱ[10] 算法1 中的方案Ⅱ[10]
    5 $n_{\mathrm{iter}}$ $ 200 $ $ 750 $ $ 100 $ $ 750 $
    $t_{\mathrm{中央处理器}_1} $ $ 0.72 $ $ 0.997 $ $ 0.56 $ $ 1.30 $
    $t_{\mathrm{CPU}2} $ $ 24.3 $ $ 27.5 $ $ 22.2 $ $ 4.19 $
    $t_{\mathrm{CPU}}$ $ 25.0 $ $ 28.5 $ $ 22.8 $ $ 5.49 $
    $e_{\mathrm{cp}}$ $ 0.0470 $ $ 0 $ $ 0.0368 $ $ 0 $
    $e_{\mathrm{ct}}$ $ 0.2556 $ $ 1.7135 $ $ 0.3126 $ $ 2.0710 $
    $\epsilon美元$ 6.7679美元\次10^{-7}$ $7.2565\次10^{-7}$
    2 $n_{\mathrm{iter}}$ 230美元$ $ 750 $
    $t_{\mathrm{中央处理器}_1} $ $ 0.57 $ $ 0.405 $
    $t_{\mathrm{中央处理器}_2} $ $ 16.2 $ $ 8.69 $
    $t_{\mathrm{CPU}}$ 16.7美元$ $ 9.09 $
    $e_{\mathrm{cp}}$ $ 0.0452 $ $ 0 $
    $e_{\mathrm{ct}}$ $ 0.4839 $ $ 1.8563 $
    $\epsilon美元$ 7.4485美元\次10^{-7}$
    |显示表格
    下载:CSV公司
  • [1] L.T.Biegler,非线性规划:概念、算法和在化学过程中的应用2010年,费城SIAM。数字对象标识:10.1137/1.9780898719383.
    [2] A.科杜里、并行机器人的动态建模,以实现计算扭矩控制,国际机器人研究杂志,17(1998), 1325-1336. 数字对象标识:10.1177/027836499801701205.
    [3] Z.龚C.刘Y.王,多时滞切换系统的最优控制和改变控制的代价,工业与管理优化杂志,14(2018), 183-198. 数字对象标识:10.3934/jimo.2017042。
    [4] A.Griewank,评估导数:算法微分的原理和技术《应用数学前沿》第19名。,SIAM,费城,2000年。
    [5] E.Hairer和G.Wanner,求解常微分方程:II刚性和微分代数问题斯普林格·弗拉格,柏林,海德堡,1991年。数字对象标识:10.1007/978-3-662-09947-6.
    [6] A.C.欣德马什P.N.布朗K.E.格兰特S.L.李塞尔维亚共和国D.E.舒马克C.S.伍德沃德,SUNDIALS,非线性和微分/代数方程求解器套件,ACM数学软件汇刊,31(2005), 363-396. 数字对象标识:10.1145/1089014.1089020.
    [7] W.Huyer和A.Neumaier,一个新的精确罚函数,SIAM优化杂志,13(2003), 1141–1158.数字对象标识:10.1137/S1052623401390537。
    [8] C.江Q.林C.余K.L.Teo先生G.-R.段,具有连续不等式约束的自由终端时间最优控制问题的精确罚方法,最优化理论与应用杂志,154(2012), 30-53. 数字对象标识:2007年10月10日/10957-012-0006-9。
    [9] 蒋春江,谢克,郭志良,特国良,微分代数方程最优控制问题的伴随灵敏度传播隐式积分第36届中国控制会议记录,IEEE计算机学会,大连,2017,2489-2494。数字对象标识:10.23919/ChiCC.2017.8027734。
    [10] C.江K·谢C.余余先生H.王Y.他K.L.Teo先生,基于高效隐式Runge-Kutta积分的微分代数系统最优控制问题的序贯计算方法,应用数学建模,58(2018), 313-330. 数字对象标识:10.1016/j.apm.2017.05.015。
    [11] B.李C.徐K.L.Teo先生朱棣文,具有移动和固定障碍物的时间最优Zermelo导航问题,应用数学与计算,224(2013), 866-875. 数字对象标识:2016年10月10日/j.amc.2013.08.092。
    [12] B.李C.J.余K.L.特奥G.R.段,连续不等式约束最优控制问题的精确罚函数法,最优化理论与应用杂志,151(2011), 260-291. 数字对象标识:2007年10月10日/10957-011-9904-5。
    [13] Q.林R.洛克斯顿K.L.Teo先生,非线性最优控制的控制参数化方法:综述,工业与管理优化杂志,10(2014), 275-309. 数字对象标识:10.3934/jimo.2014.10.275。
    [14] Q.林R.洛克斯顿K.L.Teo先生吴彦宏(Y.H.Wu)C.余,半无限规划问题的一种新的精确惩罚方法,计算与应用数学杂志,261(2014), 271-286. 数字对象标识:2016年10月10日/j.cam.2013.11.010。
    [15] R.洛克斯顿Q.林K.L.Teo先生,非线性切换系统的切换时间优化:直接优化和时间尺度变换,太平洋优化杂志,10(2014), 537-560. 
    [16] C.C.Pantelides公司,微分代数系统的一致初始化,SIAM科学与统计计算杂志,9(1988),第213-231页数字对象标识:10.1137/0909014.
    [17] R.Pytlak公司,基于Runge-Kutta的微分代数方程最优控制程序,最优化理论与应用杂志,97(1998), 675-705. 数字对象标识:10.1023/A:1022698311155。
    [18] R.Pytlak公司T.扎瓦兹基,关于用高指数DAE求解最优控制问题,优化方法和软件,29(2014), 1139-1162. 数字对象标识:10.1080/10556788.2014.892597。
    [19] R.Quirynen、S.Gros和M.Diehl,《快速自动生成ACADO积分器及其在MHE多速率测量中的应用》2013年欧洲控制会议记录瑞士苏黎世,2013年,3077–3082。数字对象标识:10.23919/ECC.2013.6669636。
    [20] R.Quirynen、S.Gros和M.Diehl,基于非精确牛顿的快速非线性MPC提升隐式积分器,年第五届IFAC非线性模型预测控制会议记录,48(2015), 32–38.
    [21] R.Quirynen、S.Gros和M.Diehl,直接最优控制的提升隐式积分器,in2015年IEEE第54届决策与控制年会会议记录, 2015, 3212–3217.数字对象标识:10.1109/CDC.2015.7402701。
    [22] A.Rao,最优控制数值方法综述,inAAS/AIAA天体动力学专家会议记录美国宾夕法尼亚州匹兹堡,2009年1月至32日。
    [23] I.M.罗斯F.法鲁,最优控制实时计算中的问题,数学和计算机建模,43(2006), 1172-1188. 数字对象标识:2016年10月10日/j.mcm.2005.05.021。
    [24] J.M.桑兹·塞尔纳、辛Runge-Kutta格式用于伴随方程、自动微分、最优控制等,SIAM审查,58(2016), 3-33. 数字对象标识:10.1137/151002769.
    [25] A.瓦赫特L.T.比格勒,关于大规模非线性规划的点内滤波线性搜索算法的实现,数学编程,Ser。A类,106(2006), 25-57. 数字对象标识:10.1007/s10107-004-0559年。
    [26] A.Walther和A.Griewank,组合科学计算《ADOL-C入门》,第181-202章,查普曼-霍尔CRC计算科学,2012年。
    [27] C.余K.L.Teo先生L.张Y.Bai先生连续不等式约束优化问题的一种新的精确罚函数方法,工业与管理优化杂志,6(2010), 895-910. 数字对象标识:10.3934/jimo.2010.6895。
    [28] C.余K.L.Teo先生L.Zhang先生Y.Bai先生,关于连续不等式约束优化问题新的精确罚函数法的收敛性分析的改进,工业与管理优化杂志,8(2012), 485-491. 数字对象标识:10.3934/jimo.2012.8.485。
  • 加载中

数字(2)

桌子(5)

分享

文章指标

HTML视图(1675) PDF下载(245) 引用人(0)

访问历史记录

目录

    /

    返回
    返回