×

一类广义随机Petri网的性能优化。 (英语) Zbl 1328.93245号

摘要:基于复杂资源分配系统当前的调度需求,本文介绍了一种新的DES应用程序性能优化方法,该应用程序在超大复杂状态空间中演化,主要目标表示为某些回报率的长期最大化。所提出的方法利用了广义随机Petri网(GSPN)建模框架,以实现上述应用程序的逻辑和面向性能的控制的无缝集成,定义相关的策略空间,以及将性能优化问题转化为一个数学规划公式,并通过马尔可夫报酬过程的灵敏度分析和随机近似算法最终求解。该方法的一个重要特点是,它有助于明确控制所用公式的计算可处理性和派生策略。此外,通过将最终定义的问题设定为约束非线性规划公式,所提出的方法继承了优化理论这一广阔领域提供的所有分析工具和见解。在当前的手稿中,所有这些可能性都是通过应用所提出的方法来证明的,该方法用于将自动化制造单元的操作抽象为一条有容量限制的再入生产线的吞吐量最大化。

MSC公司:

93E03型 控制理论中的随机系统(一般)
93元65角 离散事件控制/观测系统
93E25型 随机控制中的计算方法(MSC2010)

软件:

UMDES公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ajmone MM,Balbo G,Conte G,Donatelli S,Franceschinis G(1994),广义随机petri网建模。威利·Zbl 0843.68080号
[2] Ajmone Marsan M,Conte G,Balbo G(1984)一类用于多处理器系统性能评估的广义随机Petri网。ACM传输计算系统2:93-122·doi:10.1145/190.191
[3] de Alfaro L(1997)概率系统的形式验证。弗吉尼亚州帕洛阿尔托斯坦福大学博士论文
[4] Beccuti M,Franceschinis G,Haddad S(2007),马尔可夫决策Petri网和马尔可夫决定Well-Formed网形式。In:ICATPN 2007-LNCS 4546。第43-62页·Zbl 1226.68049号
[5] Bellman R(1957)应用动态规划。普林斯顿大学·Zbl 0077.13605号
[6] Bertsekas DP(2005)《动态规划和最优控制》,第3版。雅典娜科技公司,贝尔蒙特·邮编1125.90056
[7] Bertsekas DP,Tsitsiklis JN(1996),神经动力学编程。雅典娜科技公司,贝尔蒙特·Zbl 0924.68163号
[8] Cao X-R(1994)实现概率:排队系统的动力学。纽约施普林格-弗拉格·Zbl 0798.60079号 ·doi:10.1007/BFb0035250
[9] Cao X-R(2007)随机学习与优化。纽约州施普林格·Zbl 1130.93057号 ·doi:10.1007/978-0-387-69082-7
[10] Cassandras CG,Lafortune S(2008)《离散事件系统导论》,第2版。纽约州施普林格·Zbl 1165.93001号 ·doi:10.1007/978-0-387-68612-7
[11] Choi JY,Reveliotis SA(2003)一种用于容量受限再入线性能分析和控制的广义随机Petri网模型。IEEE Trans机器人自动19:474-480·doi:10.1109/TRA.2003.810577
[12] Ciardo G、Muppala JK、Trivedi KS(1991)关于GSPN奖励模型的解决方案。执行评估12:237-253·Zbl 0754.60097号 ·doi:10.1016/0166-5316(91)90003-L
[13] Cordone R,Nazeem A,Piroddi L,Reveliotis S(2013)通过分类理论为顺序资源分配系统设计最佳死锁避免策略:存在结果和定制算法。IEEE自动变速器控制58:2772-2787·Zbl 1369.68050号 ·doi:10.1109/TAC.2013.2266952
[14] Giua A,DiCesare F,Silva M(1992)具有不可控转移的网络上的广义互斥约束。收录:1992年IEEE国际系统、人与控制论会议记录。IEEE,第974-979页
[15] Gosavi A(2003)《基于仿真的优化:参数优化技术和强化学习》。诺维尔Kluwer学术出版社·兹比尔1030.90147 ·doi:10.1007/978-1-4757-3766-0
[16] Ho YC,Cao X-R(1991)离散事件系统的扰动分析。Kluwer学术出版社,波士顿·Zbl 0744.90036号 ·doi:10.1007/978-1-4615-4024-3
[17] Iordache MV,Antsaklis PJ(2006),并发系统的监督控制:Petri网结构方法。波士顿Birkhäuser·Zbl 1129.93034号
[18] Konda VR,Tsitsiklis JN(2003)关于actor-critic算法。SIAM J控制优化42:1143-1166·Zbl 1049.93095号 ·doi:10.1137/S0363012901385691
[19] Kumar PR(1994)《再入生产线的调度制造系统》。Yao,DD(ed)制造系统的随机建模和分析。Springer-Verlag,第325-360页·Zbl 0874.60101号
[20] Kumar PR(1994)半导体制造厂调度。IEEE控制系统杂志14-6:33-40·doi:10.1109/37.334413
[21] Kushner HJ,Yin GG(2003)《随机近似和递归算法及应用》。纽约州施普林格·Zbl 1026.62084号
[22] Li R优化了复杂资源分配系统的调度。佐治亚州亚特兰大乔治亚理工学院ISyE博士论文(准备中)
[23] Li R,Reveliotis S(2013),一类广义随机Petri网的性能优化。CDC 2013年会议记录。电气与电子工程师协会·Zbl 1328.93245号
[24] Li Z,Zhou M,Wu N(2008)基于Petri网的柔性制造系统死锁预防策略的调查与比较。IEEE Trans-Syst Man Cybern第C部分应用程序版本38:173-188·Zbl 1199.15081号 ·doi:10.1109/TSMCC.2007.913920
[25] Luenberger DG(1984)线性和非线性规划,第2版。Addison Wesley,雷丁·Zbl 0571.90051号
[26] Marbach P,Tsitsiklis JN(2001)基于模拟的马尔可夫报酬过程优化。IEEE变速器自动控制46:191-209·Zbl 0992.93088号 ·数字对象标识代码:10.1109/9.905687
[27] Moazzez E R,Li K,Paschalidis I Ch(2012)最小二乘时差actor-critic算法及其在仓库管理中的应用。导航Res Logist 59:197-211·Zbl 1407.90334号 ·doi:10.1002/nav.21481
[28] Moody JO,Antsaklis PJ(1998)使用Petri网对离散事件系统进行监督控制。Kluwer学术出版社,波士顿·Zbl 0944.93001号 ·doi:10.1007/978-1-4615-5711-1
[29] Murata T(1989)Petri网:属性、分析和应用。程序IEEE 77:541-580·数字对象标识代码:10.1109/5.24143
[30] Papadimitriou CH,Tsitsiklis JN(1999)最优排队网络控制的复杂性。数学。或24:293-305·Zbl 0977.90008号 ·doi:10.1287/门24.2.293
[31] Powell WB(2007)近似动态编程:解决维度的诅咒。纽约威利·Zbl 1156.90021号 ·数字对象标识代码:10.1002/9780470182963
[32] Puterman ML(1994)Markov决策过程:离散随机动态规划。威利·Zbl 0829.90134号
[33] Ramadge PJG,Wonham WM(1989)离散事件系统的控制。美国电气与电子工程师协会规程77:81-98·数字对象标识代码:10.1109/5.21072
[34] Reveliotis S(2007)序列资源分配系统的代数死锁避免策略。摘自:Lahmar M(ed)《设施物流:应对下一代挑战的方法和解决方案》。奥尔巴赫出版物,第235-289页·Zbl 1368.68268号
[35] Reveliotis S,Nazeem A(2014)使用有限状态自动机的自动化制造系统的死锁避免政策。作者:Campos J、Seatzu C、Xie X(编辑)《制造业的形式方法》,CRC出版社/泰勒和弗朗西斯出版社·Zbl 1369.68055号
[36] Reveliotis SA(2000)多类排队网络中由于缓冲能力有限而导致的阻塞不稳定效应。IEEE Trans Autom控制45:585-588·兹比尔0988.90009 ·数字对象标识代码:10.1109/9.847750
[37] Reveliotis SA(2005)《资源分配系统的实时管理:离散事件系统方法》。纽约州施普林格·兹比尔1069.93002
[38] Ross SM(1983)随机过程。纽约威利·Zbl 0555.60002号
[39] Rubinstein RY,Shapiro A(1993)《离散事件系统:用得分函数法进行敏感性分析和随机优化》。纽约威利·Zbl 0805.93002号
[40] Singer P(1995)集群工具开发的驱动力。半导体国际。1995年7月。第113-118页
[41] Weiss M(1996)半导体工厂自动化。固态技术:89-96
[42] Wonham WM(2006)离散事件系统的监督控制。技术报告ECE 1636F/1637S 2006-07,多伦多大学电气与计算机工程·Zbl 0679.68042号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。