×

通过无休止的强盗边际生产率指数进行动态优先级分配。 (英语) Zbl 1142.90015号

摘要:本文综述了作者最近在不安土匪指数化的理论和算法方面的工作,以及其在涉及多个随机项目动态分配优先级的各种问题中的应用。其主要目的是以一种易于理解的形式提出想法和方法,以便研究人员解决此类问题。除了建立在有关盗贼问题的丰富文献基础上,我们的方法还借鉴了线性规划、经济学和多目标优化的思想。特别是,它被激励来解决在P.惠特尔【不安分的强盗:变化世界中的活动分配。应用概率的庆祝,J.Appl.Probab.,Spec.Vol.25A,287-298(1988;Zbl 0664.90043号)]在那里,他引入了不安分的强盗指数,这是这项工作的起点。这种指数,连同先前提出的指数和最近的扩展,通过直观的“边际生产率指数”(MPI)概念,被证明是统一的,它衡量每个州项目工作的边际生产率。在多项目环境中,MPI策略在经济上是合理的,因为它们会动态地为当前工作效率更高的项目分配更高的优先级。除了易于处理和广泛适用外,越来越多的计算证据表明,此类指数策略通常会达到接近最佳的性能,并大大优于传统方法得出的基准策略。

MSC公司:

90B36型 运筹学中的随机调度理论
90立方厘米 马尔可夫和半马尔可夫决策过程
90B05型 库存、储存、水库
90B22型 运筹学中的队列和服务
90B18号机组 运筹学中的通信网络
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adan IJBF,van der Wal J(1998)结合按订单生产和按库存生产。OR演讲20:73–81·Zbl 0903.90047号 ·doi:10.1007/BF01539854
[2] Altman E,Shwartz A(1989)最优优先级分配:一种分时方法。IEEE T自动控制34:1098–1102·Zbl 0694.90053号 ·doi:10.1109/9.35286
[3] Altman E,Stidham S Jr(1995)双作用马尔可夫决策过程单调策略的最优性,应用于控制具有延迟信息的队列。排队系统21:267–291·Zbl 0859.90118号 ·doi:10.1007/BF01149165
[4] Asawa M,Teneketzis D(1996)多武器匪徒与转换惩罚。IEEE T自动控制41:328–348·Zbl 0847.90137号 ·数字对象标识代码:10.1109/9.486316
[5] Bambos N,Michailidis G(2002)关于随机服务器连接和路由约束的并行排队。Probab Eng通知Sc 16:185–203·Zbl 1014.90021号
[6] Banks JS、Sundaram RK(1994),转换成本和Gittins指数。计量经济学62:687–694·Zbl 0807.90123号 ·doi:10.2307/2951664
[7] Bellman R(1956)实验顺序设计中的一个问题。桑基拉16:221–229·Zbl 0075.14801号
[8] Bertsimas D、Niño-Mora J(1996)《保护定律、扩展多拟阵和多武装匪徒问题》;可转位系统的多面体方法。数学运算研究21:257–306·Zbl 0857.90055号 ·doi:10.1287/门.21.2.257
[9] Blackwell D(1962)离散动态规划。数学统计年鉴33:719–726·Zbl 0133.12906号 ·doi:10.1214/aoms/1177704593
[10] Boxma OJ(1995)排队系统的静态优化。In:Agarwal RP(ed)优化理论和应用的最新趋势。世界科学应用杂志,第5卷。世界科学出版社,River Edge,第1-16页·Zbl 0874.90092号
[11] Bradt RN,Johnson SM,Karlin S(1956)关于最大化n个观测值之和的序列设计。数学统计年鉴27:1060–1074·兹伯利0073.14203 ·doi:10.1214/aoms/1177728073
[12] Chen H,Yao DD(1990)具有状态相关容量限制的排队系统的最优强度控制。IEEE T自动控制35:459–464·Zbl 0705.93081号 ·数字对象标识代码:10.1109/9.52303
[13] Clark JB(2005)《财富分配:工资、利息和利润理论》。Adamant媒体公司(1908年由纽约州纽约市麦克米伦公司出版的版本重新发行;首次出版时间:1899年)
[14] Coffman EG Jr,Mitrani I(1980)单服务器队列可实现的等待时间性能的表征。运营研究28:810–821·Zbl 0451.90059号 ·数字对象标识代码:10.1287/opre.28.310
[15] CombéMB,Boxma OJ(1994),静态交通分配政策的优化。计算机科学理论125:17–43·Zbl 0795.68024号
[16] Cox DR、Smith WL(1961)《队列》。伦敦Methuen
[17] De Véricourt F,Karaesmen F,Dallery Y(2000),制造库存系统中的动态调度:最优策略的部分特征。运营研究48:811–819·doi:10.1287/opre.48.5.811.12404
[18] Derman C,Lieberman GJ,Ross SM(1980)关于服务器和修理工的最优分配。应用概率杂志17:577–581·Zbl 0428.60096号 ·doi:10.2307/3213050
[19] Dongarra JJ,Eijkhout V(2000)《数值线性代数算法和软件》。计算机应用数学杂志123:489–514·Zbl 0965.65049号 ·doi:10.1016/S0377-0427(00)00400-3
[20] Dusonchet F,Hongler MO(2003a)连续时间不安土匪和库存生产的动态调度。IEEE T机器人自动19:977–990·doi:10.1109/TRA.2003.819728
[21] Dusonchet F,Hongler MO(2003b)一类具有切换费用的确定性恶化双臂盗贼问题的最优滞后性。自动化39:1947–1955·Zbl 1046.93050号 ·doi:10.1016/S0005-1098(03)00203-6
[22] Ehsan N,Liu MY(2006)延迟信道中的最佳带宽分配。IEEE J选择区通信24:1614–1626·doi:10.1109/JSAC.2006.879406
[23] Feinberg EA,Shwartz A(2002)混合标准。摘自:Feinberg-EA,Shwardz A(eds)Markov决策过程手册:方法和应用。Kluwer,波士顿,第209–230页
[24] Federgruen A,Gronevelt H(1988)一般排队系统中可实现性能的表征和优化。运营研究36:733–741·Zbl 0677.60103号 ·doi:10.1287/opre.36.5.733
[25] Gass S,Saaty T(1955)参数目标函数的计算算法。海军研究日志2:39–46·doi:10.1002/nav.3800020106
[26] Gittins JC(1979)班迪特过程和动态分配指数(含讨论)。J R Stat Soc B会议41:148–177·Zbl 0411.62055号
[27] Gittins JC(1989)多武器强盗配置指数。奇切斯特威利·Zbl 0699.90068号
[28] Gittins JC,Jones DM(1974)实验顺序设计的动态分配指数。收录:Gani J、Sarkadi K、Vincze I(编辑)《统计学进展》。欧洲统计学家会议,布达佩斯,1972年。阿姆斯特丹霍兰德北部,第241-266页
[29] Haji R,Newell GF(1971)平稳队列和等待时间分布之间的关系。应用概率杂志8:617–620·Zbl 0235.60093号 ·doi:10.2307/3212186
[30] Hernández-Lerma O,Hoyos-Reyes LF(2001)优先级队列的多目标控制方法。数学方法操作研究53:265–277·Zbl 1036.93066号 ·doi:10.1007/PL00003995
[31] Hordijk A,Koole G(1990)关于广义最短队列策略的最优性。Probab Eng Inform Sci公司4:477–487·兹比尔1134.90340 ·doi:10.1017/S0269964800001777
[32] Johri PK(1989)最短线路规程与州相关服务率的最佳性。欧洲运营研究杂志41:157–161·Zbl 0675.60084号 ·doi:10.1016/0377-2217(89)90378-0
[33] Jun T(2004)关于具有转换成本的盗贼问题的调查。《经济学人》152:513–541·doi:10.1007/s10645-004-2477-z
[34] Kallmes MH,Cassandras CG(1995)实时流量系统中最优路由和准入控制的两种方法。J Optim理论应用84:311–338·兹比尔0823.90045 ·doi:10.1007/BF02192117
[35] Kantorovich LV(1959)Ekonomicheskii raschet nailuchshego ispolzovania resursov。苏联科学院(英译:经济资源的最佳利用,哈佛大学出版社,剑桥,1965)
[36] Keilson J,Servi LD(1988)利特尔定律的一种分布形式。运营Res Lett 7:223–227·Zbl 0662.60104号 ·doi:10.1016/0167-6377(88)90035-1
[37] Kelly FP(1981)《折现系数接近1的多武器匪徒:伯努利案》。安统计9:987–1001·Zbl 0478.90073号 ·doi:10.1214/aos/1176345578
[38] Kim E,Van Oyen MP(1998)《超越c{\(\mu\)}规则:两类损失队列的动态调度》。数学方法操作研究48:17–36·Zbl 0947.90027号 ·doi:10.1007/PL00003992
[39] Kleinrock L(1965)一类广泛排队规则的守恒定律。海军研究日志12:181–192·Zbl 0142.14503号 ·doi:10.1002/nav.3800120206
[40] Kleinrock L(1975)排队系统,第一卷:理论。纽约威利·Zbl 0334.60045号
[41] Klimov GP(1974)分时服务系统。I.理论概率应用19:532–551·Zbl 0378.60102号 ·数字对象标识代码:10.1137/1119060
[42] Koopmans TC(1957)关于经济科学现状的三篇论文。McGraw–Hill,纽约,chap资源分配和价格体系
[43] Krishnan KR(1988)将工作流分配到并行工作站的状态相关分配。附:第27届决策与控制会议记录。IEEE,皮斯卡塔韦,第2332–2333页
[44] Krishnan KR(1990)加入正确的队列:依赖于国家的决策规则。IEEE T自动控制35:104–108·Zbl 0716.90100号 ·数字对象标识代码:10.1109/9.45156
[45] Lewis ME、Puterman ML(2002)《偏差优化》。摘自:Feinberg EA,Schwartz A(ed)Markov决策过程手册。Kluwer Academic,波士顿,第89-111页
[46] Lott C,Teneketzis D(2000)关于具有多个服务类别的单跳移动网络的多信道分配中索引规则的最优性。Probab Eng通知Sc 14:259–297·Zbl 0991.90026号
[47] Niño-Mora J(2001)《不安分的强盗、部分保护法和指数化》。高级应用概率33:76–98·Zbl 1039.90019号 ·doi:10.1239/aap/999187898
[48] Niño-Mora J(2002)《不安项目和排队准入控制的动态分配指数:多面体方法》。数学课程93:361–413·Zbl 1023.90034号 ·doi:10.1007/s10107-002-0362-6
[49] Niño-Mora J(2003)《焦躁不安的强盗边际生产率指数》,收益递减,以及安排多类按订单/库存生产队列。收录:第41届Allerton通信、控制和计算年会会议记录。伊利诺伊大学蒙蒂塞洛Urbana-Champaign分校,第100-109页
[50] Niño-Mora J(2005)有限视野多武器强盗问题的边际生产率指数政策。收录:第44届IEEE决策与控制会议和ECC 2005欧洲控制会议的会议记录。IEEE,皮斯卡塔韦,第1718–1722页
[51] Niño-Mora J(2006a)《不安分的强盗边际生产率指数、收益递减和按订单/按库存M/G/1排队的最优控制》。数学运算结果31:50–84·Zbl 1278.90099号 ·doi:10.1287/门1050.0165
[52] Niño-Mora J(2006b)调度多类延迟/损失敏感队列的边际生产率指数策略。排队系统54:281–312·Zbl 1117.90035号 ·文件编号:10.1007/s11134-006-0302-x
[53] Niño-Mora J(2006c)调度多类无线传输的边际生产率指数政策。收录于:NGI 2006,第二届欧洲NGI下一代互联网网络——设计和工程会议记录。IEEE,Piscataway,第342-349页
[54] Niño-Mora J(2007a)Gittins指数的(2/3)N3快速旋转算法和马尔可夫链的最优停止。INFORMS J Comput,第19卷,DOI:10.1287/ijoc.1060-0206·Zbl 1241.90174号
[55] Niño-Mora J(2007b)允许控制的边际生产率指数策略和路由到具有退出的并行多服务器损失队列。在:网络控制和优化,第一届EuroFGI国际会议的会议记录NET-COOP 2007。Lect Notes Compute Sc,第4465卷。柏林施普林格,第138-149页·Zbl 1181.68076号
[56] Niño-Mora J(2007c)调度具有延迟状态观测的多类延迟/损失敏感流量的边际生产率指数策略。In:NGI 2007,第三届欧洲NGI下一代互联网网络会议纪要——异构设计和工程。IEEE,皮斯卡塔韦,第209-217页
[57] Niño-Mora J(2007d)针对具有转换成本的盗贼的更快索引算法和计算研究。INFORMS J Comput(出版中)·Zbl 1243.90156号
[58] Niño-Mora J(2007e)不安分强盗边际生产率指数的表征和计算。摘自:SMCtools'07,2007年解决结构化马尔可夫链工具研讨会的会议记录。ACM,纽约
[59] Niño-Mora J(2007f)计算带有转换惩罚的强盗指数政策。摘自:SMCtools'07,2007年解决结构化马尔可夫链工具研讨会的会议记录。ACM,纽约
[60] Papadimitriou CH,Tsitsiklis JN(1999)最优排队网络控制的复杂性。数学运算研究24:293–305·Zbl 0977.90008号 ·doi:10.1287/门24.2.293
[61] Peña-Pérez a,Zipkin P(1997)多产品制造到库存队列的动态调度规则。运营研究45:919–930·Zbl 0895.90078号 ·数字对象标识代码:10.1287/opre.45.6.919
[62] Puterman ML(1994)Markov决策过程:离散随机动态规划。纽约威利·Zbl 0829.90134号
[63] Rothkopf MH(1966)随机服务时间调度。管理科学12:707–713·Zbl 0199.23302号 ·doi:10.1287/mnsc.12.9707
[64] Sevcik KC(1974)使用服务时间分布制定最小总损失计划。美国临床医学杂志21:66–75·Zbl 0271.68047号 ·数字对象标识代码:10.1145/321796.321803
[65] Shanthikumar JG,Yao DD(1992)多类排队系统:多拟阵结构与最优调度控制。运营研究40:S293–S299·Zbl 0764.90036号 ·doi:10.1287/操作40.3.S293
[66] Smith WE(1956)用于单级生产的各种优化器。海军研究日志3:59–66·doi:10.1002/nav.3800030106
[67] Soman CA、Van Donk DP、Gaalman G(2004)《食品生产系统中的按订单生产和按库存生产相结合》。国际生产经济学杂志90:223–235·doi:10.1016/S0925-5273(02)00376-6
[68] Sparaggis PD,Cassandras CG,Towsley D(1993)关于缓冲空间有限的路由和调度系统之间的对偶性。IEEE T自动控制38:1440–1446·Zbl 0787.93009号 ·数字对象标识代码:10.1109/9.237664
[69] Stidham S Jr(1985)排队系统准入的最优控制。IEEE T自动控制30:705–713·Zbl 0563.90044号 ·doi:10.1109/TAC.1985.1104054
[70] Tassiulas L,Ephremides A(1993)《连接随机变化的并行队列的动态服务器分配》。IEEE T信息理论39:466–478·Zbl 0800.94059号 ·doi:10.1109/18.212277
[71] Tsoucas P(1991)克里莫夫模型中可实现性能的区域。技术代表RC16543,IBM TJ Watson Research Center,Yorktown Heights,New York,NY
[72] Varaiya PP、Walrand JC、Buyukkoc C(1985)《多武装匪徒问题的延伸:折扣案例》。IEEE T自动控制30:426–439·Zbl 0566.90096号 ·doi:10.1109/TAC.1985.1103989
[73] Veatch MH,Wein LM(1996)《安排多类制造到库存队列:指数政策和对冲点》。运营研究44:634–647·Zbl 0865.90068号 ·数字对象标识代码:10.1287/opre.44.634
[74] Wang YG(1997)计算Gittins指数的误差界。澳大利亚统计局39:225–233·Zbl 0887.90177号 ·doi:10.1111/j.1467-842X.1997.tb00538.x
[75] Wasserman KM,Bambos N(1996),具有有限容量缓冲区的并行队列的最佳服务器分配。Probab Eng通知Sc 10:279–285·Zbl 1093.90513号 ·doi:10.1017/S0269964800004332
[76] Weber RR(1992)《关于多武装匪徒的Gittins指数》。Ann Appl Probab应用程序概要2:1024–1033·兹比尔0763.60021 ·doi:10.1214/aoap/1177005588
[77] Weber RR,Weiss G(1990)《关于不安分匪徒的指数政策》。应用概率杂志27:637–648·Zbl 0735.90072号 ·doi:10.2307/3214547
[78] Weber RR,Weiss G(1991)《关于不安分强盗的指数政策》补遗。高级应用概率23:429–430·Zbl 0727.90090号 ·doi:10.2307/1427757
[79] Wein LM(1992)多类制造到库存队列的动态调度。运营商研究40:724–735·Zbl 0769.90045号 ·doi:10.1287/opre.40.4.724
[80] Whittle P(1980)《多武器匪徒和Gittins指数》。J R Stat Soc B会议42:143–149·Zbl 0439.90096号
[81] Whittle P(1988)《不安分的强盗:变化世界中的活动分配》。摘自:Gani J(ed)应用概率的庆祝。应用概率杂志,第25A卷。应用概率信托,谢菲尔德,第287-298页·Zbl 0664.90043号
[82] Whittle P(1996)《最优控制:基础与超越》。奇切斯特威利·Zbl 0880.49001号
[83] Winston W(1977)《最短路线学科的最优化》。应用概率杂志14:181–189·Zbl 0357.60023号 ·doi:10.2307/3213271
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。