×

弱耦合更新系统的异步优化。 (英语) Zbl 1446.60060号

摘要:本文考虑了带有时间平均约束的多更新系统的优化问题。这些系统在可变长度的帧上异步运行。当特定系统启动新的续订框架时,它会从该框架的一组选项中选择操作。该操作确定帧的持续时间、帧期间发生的惩罚(例如能量消耗)以及性能指标的向量(例如作业服务的瞬时数量)。目标是根据相应指标的时间平均总体约束,最小化时间平均惩罚。该问题在任务处理网络和耦合马尔可夫决策过程中有应用。我们提出了一种新的算法,以便每个系统在观察到每个时隙更新的全局乘法器后都可以做出自己的决定。我们证明了该算法满足期望的约束条件,并在收敛时间为(O(1/varepsilon^2)的情况下达到了(O(varepsilen))近似最优性。

MSC公司:

60 K15 马尔可夫更新过程,半马尔可夫过程
90立方厘米 马尔可夫和半马尔可夫决策过程

软件:

A锁定
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 奥尔特曼E(1999)约束马尔可夫决策过程(查普曼和霍尔/CRC出版社,佛罗里达州博卡拉顿)。谷歌学者·Zbl 0963.90068号
[2] Bertsekas D(2009)凸优化理论(Athena Scientific,新罕布什尔州纳舒亚)。谷歌学者·Zbl 1242.90001号
[3] Bertsekas DP(2001)动态规划与最优控制第2版,第1卷(Athena Scientific,Nashua,NH)。谷歌学者·Zbl 1083.90044号
[4] Bertsekas DP,Tsitsiklis JN(1997年)并行和分布式计算:数值方法(Athena Scientific,新罕布什尔州纳舒亚)。谷歌学者
[5] Boyd S、Vandenberghe L(2004)凸优化(英国剑桥大学出版社)。谷歌学者·Zbl 1058.90049号
[6] Boyd S、Ghosh A、Prabhakar B、Shah D(2006)《随机八卦算法》。IEEE/ACM传输。通知。理论52(6):2508-2530.谷歌学者·Zbl 1283.94005号
[7] 杜勒特R(2013)概率:理论与实例,第4版(剑桥大学出版社,纽约)。谷歌学者
[8] Fox B(1966)线性分式规划的马尔可夫更新规划。SIAM J.应用。数学。14(6):1418-1432.谷歌学者·Zbl 0154.45003号
[9] Gandhi A、Doroudi S、Harchol-Balter M、Scheller-Wolf A(2013)通过递归更新报酬对马尔可夫链的M/M/k/设置类进行精确分析。程序。2013年ACM SIGMETRICS(ACM,纽约),153-166。谷歌学者
[10] Li C,Neely MJ(2014)用自适应Cμ求解多类队列中带边约束的凸优化问题。排队系统77(3):331-372谷歌学者·Zbl 1299.90103号
[11] Neely MJ(2010)随机网络优化及其在通信和排队系统中的应用(Morgan&Claypool,加利福尼亚州圣拉斐尔)。谷歌学者·1270.90002赞比亚比索
[12] Neely MJ(2012a)耦合马尔可夫决策系统的异步控制。程序。2102 IEEE通知。理论研讨会(ITW)(新泽西州皮斯卡塔韦IEEE),287-291,谷歌学者
[13] Neely MJ(2012b)多服务器系统中能源优化的异步调度。程序。第46届年度会议通知。科学。系统(CISS)(IEEE,新泽西州皮斯卡塔韦),1-6.谷歌学者
[14] Neely MJ(2013)更新系统的动态优化和学习。IEEE传输。自动控制58(1):32-46谷歌学者·Zbl 1369.90188号
[15] Peng Z,Xu Y,Yan M,Yin W(2016)ARock:异步并行坐标更新的算法框架。SIAM J.科学。计算。38(5):A2851-A2879.谷歌学者·Zbl 1350.49041号
[16] Rockafellar RT(2015)凸分析(普林斯顿大学出版社,新泽西州普林斯顿)。谷歌学者
[17] 罗斯·S(2002)概率模型简介第8版(学术出版社,马萨诸塞州伯灵顿)。谷歌学者
[18] Schaible S(1983)分数规划。Zeitschrift Oper公司。物件。27(1):39-54.谷歌学者·Zbl 0527.90094号
[19] Srivastava K,Nedic A(2011)分布式异步约束随机优化。IEEE J.信号处理选择主题5(4):772-790.谷歌学者
[20] Wei X,Neely MJ(2017)《数据中心服务器规定:耦合更新系统的分布式异步控制》。IEEE/ACM传输。网络25(4):2180-2194.谷歌学者
[21] Yao DD(2002)《基于多拟阵优化的动态调度》。卡尔扎罗萨MC·Zbl 1017.68506号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。