MSC 93E35中最近的zbMATH文章 https://zbmath.org/atom/cc/93E35 2024-04-15T15:10:58.286558Z Werkzeug公司 分布局部随机逼近的有限时间收敛速度 https://zbmath.org/1530.93444 2024-04-15T15:10:58.286558Z “Doan,Thinh T.” https://zbmath.org/authors/?q=ai:doan.thinh-t吨 摘要:我们考虑一个分布式学习框架,其中有一组代理与集中式协调器通信。代理的目标是找到由代理的本地操作符组成的操作符的根。这种框架模拟了不同领域的许多实际问题,包括联合学习和强化学习中的问题。为了解决这个问题,我们研究了流行的分布式随机逼近。在一系列时间周期内,每个代理基于自己的数据运行多个局部随机近似步骤,然后在集中式协调器中聚合这些步骤的结果。研究了局部随机逼近有限时间性能的现有理论保证,一般假设是每个代理的局部数据都是即时采样的。这种假设在许多应用中可能不成立,其中数据是时间相关的,例如,它们是从一些动力系统中采样的。在本文中,我们研究了马尔可夫随机过程生成数据的设置,该过程通常用于随机控制和强化学习中的系统建模。我们的主要贡献是在这种情况下刻画局部随机近似的有限时间性能。当局部算子强单调时,我们给出了定步长和时变步长下该方法的速率的显式公式。我们的结果表明,在独立数据下,这些速率在可比界限的对数因子范围内。我们还提供了一些数值模拟,通过将局部SA应用于解决多智能体系统的鲁棒识别和强化学习问题来说明我们的理论结果。 具有二值观测值的IIR系统的估计 https://zbmath.org/1530.93498 2024-04-15T15:10:58.286558Z “戴,瑞芬” https://zbmath.org/authors/?q=ai:dai.ruifen “郭雷” https://zbmath.org/authors/?q=ai:guo.lei.2|郭雷|郭雷.1 摘要:二值观测的估计和控制问题在实际系统中广泛存在。然而,大多数相关工作都致力于有限脉冲响应(FIR)系统,而无限脉冲响应(IIR)系统的理论问题研究较少。为了研究具有二值观测值的IIR系统的估计问题,利用随机李亚普诺夫函数方法和双数组鞅的极限理论,介绍了一种投影递推估计算法,并分析了其全局收敛性。结果表明,该估计算法在最弱可能的非持久激励条件下具有与FIR系统相似的收敛结果。此外,在不依赖任何激励条件的情况下,还建立了自适应预测累积遗憾的上界。 基于卡尔曼滤波的增材制造过程熔敷建模热状态估计 https://zbmath.org/1530.93516 2024-04-15T15:10:58.286558Z “Kim,Youngkyu” https://zbmath.org/authors/?q=ai:kim.youngkyu “阿尔坎塔拉,大卫” https://zbmath.org/authors/?q=ai:meza-阿尔坎塔拉.david “佐迪,塔里克一世。” https://zbmath.org/authors/?q=ai:zohdi.tarek-我 总结:本文提出了一种使用线性卡尔曼滤波器的数据同化方法,用于在熔融沉积建模过程中监测零件的热状态。采用有限差分法离散热传导方程,建立了系统模型。然后通过线性卡尔曼滤波器将红外(IR)相机测量值与系统模型相结合。通过数据同化,提高了热场监测的准确性,这对评定层间结合强度至关重要。此外,使用线性卡尔曼滤波器可以实现闭环监测系统,因为红外摄像机可以被引导到估计不确定性较高的位置。闭环监测系统将被用作反馈系统,在印刷过程中自适应控制系统参数,以提高零件质量。{{版权所有}2020 John Wiley&Sons,Ltd.}