×

关于预期改进方法的收敛速度。 (英语) Zbl 1359.62519号

摘要:我们考虑了一个具有独立正态观测值的排序和选择问题,并在此背景下分析了期望改进(EI)方法的渐近采样率。这种方法在实践中通常表现良好,但由于EI计算的非线性和非凸性,很难对其收敛速度进行简单分析。我们给出的新结果表明,对于已知的采样噪声,EI变量产生的渐近模拟分配与最优计算预算分配(OCBA)方法选择的分配基本相同,该方法已知在排序和选择中产生接近最优的渐近性能。这是EI和OCBA之间的第一个通用等价结果,它为EI的良好实际性能提供了见解。我们还导出了未知采样方差下EI的极限分配。

MSC公司:

62第20页 统计学在经济学中的应用
62升05 顺序统计设计
62C10个 贝叶斯问题;贝叶斯过程的特征
91B06型 决策理论

软件:

EGO公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Branke J,Chick SE,Schmidt C(2007)选择选择程序。管理科学。53(12):1916-1932. 链接·兹比尔1232.62042
[2] Bull AD(2011)高效全局优化算法的收敛速度。J.机器学习。物件。12:2879-2904. ·Zbl 1280.90094号
[3] Chau M、Fu MC、Qu H、Ryzhov IO(2014)《模拟优化:基于梯度方法的教程概述和最新发展》。Tolk A、Diallo SY、Ryzhov IO、Yilmaz L、Buckley S、Miller JA编辑。程序。2014年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),21-35。交叉参考
[4] Chen CH,Lee LH(2010年)随机模拟优化:一种最优计算预算分配(世界科学,新加坡)。交叉参考
[5] Chen CH,Fu MC,Shi L(2008a)模拟与优化。Chen ZL,Raghavan S,编辑。信息运筹学教程(INFORMS,马里兰州汉诺威),247-260。链接
[6] Chen CH,Chick SE,Lee LH,Pujowidianto NA(2015)排名与选择:高效模拟预算分配。Fu MC编辑。仿真优化手册(纽约施普林格),45-80。交叉参考
[7] Chen CH,He D,Fu MC,Lee LH(2008b)选择最优子集的有效模拟预算分配。信息J.计算。20(4):579-595. 链接
[8] Chen CH,Lin J,Yücesan E,Chick SE(2000)模拟预算分配以进一步提高顺序优化的效率。离散事件发电机。系统10(3):251-270. 交叉参考·Zbl 0970.90014号
[9] Chick SE(2006)主观概率和贝叶斯方法。Henderson SG、Nelson BL编辑。运筹学和管理科学手册,第13卷:模拟(North-Holland Publishing,阿姆斯特丹),225-258。
[10] Chick SE,Inoue K(2001)选择最佳模拟系统的新两阶段和顺序程序。操作。物件。49(5):732-743。链接
[11] Chick SE、Branke J、Schmidt C(2010)《近视患者最大化信息期望值的序贯抽样》。信息J.计算。22(1):71-80. 链接·Zbl 1243.62005年
[12] DeGroot MH(1970)最优统计决策(纽约麦格劳-希尔出版社)。
[13] Finner H,Dickhaus T,Roters M(2008)Student’s的渐近尾特性t吨-分配。通信统计–理论与方法37(2):175-179. 交叉参考·Zbl 1318.62045号
[14] Frazier PI,Powell WB(2010)学习悖论和信息的边际价值。决策分析。7(4):378-403. 链接
[15] Frazier PI,Powell WB,Dayanik S(2008)用于顺序信息收集的知识梯度策略。SIAM J.控制优化。47(5):2410-2439. 交叉参考·Zbl 1274.62155号
[16] Fu MC,Hu JQ,Chen CH,Xiong X(2007)相关抽样下确定最佳设计的模拟分配。信息J.计算。19(1):101-111. 链接·Zbl 1241.62006年
[17] Gao S,Shi L(2014)固定数量设计的最优机会成本选择程序。Tolk A、Diallo SY、Ryzhov IO、Yilmaz L、Buckley S、Miller JA编辑。程序。2014年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),2410-2439。交叉参考
[18] Glynn PW,Juneja S(2004)《有序优化的大偏差观点》。Ingalls R、Rossetti MD、Smith JS、Peters BA编辑。程序。2004年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),577-585。交叉参考
[19] Glynn PW,Juneja S(2011)《顺序优化:非参数框架》,Jain S,Creasey RR,Himmelspach J,White KP,Fu M,eds。程序。2011年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),4062-4069。交叉参考
[20] Glynn PW,Juneja S(2015)序贯优化——经验大偏差率估值器和随机多武装匪徒。arXiv预打印arXiv:1507.04564v1。
[21] Gupta S,Miescke K(1996)Bayesian前瞻性一阶段抽样分配,用于选择最佳总体。J.统计。规划和推断54(2):229-244。交叉参考·Zbl 0854.62018号
[22] Han B、Ryzhov IO、Defourny B(2013)美国红十字会捐赠者保留策略的有效学习。Pasupathy R、Kim SH、Tolk A、Hill R、Kuhl ME编辑。程序。2013年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),17-28。交叉参考
[23] He D,Chick S,Chen CH(2007)固定数量备选系统顺序优化中的机会成本和OCBA选择程序。IEEE传输。系统、人与控制论C37(5):951-961。交叉参考
[24] Hong LJ,Nelson BL(2009)《模拟优化简介》。Rosetti M、Hill R、Johansson B、Dunkin A、Ingalls R编辑。程序。2009年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),75-85。交叉参考
[25] Jones D,Schonlau M,Welch W(1998)代价高昂的黑盒函数的高效全局优化。J.全球优化。13(4):455-492. 交叉参考·Zbl 0917.90270号
[26] Kim SH,Nelson BL(2006)选择最佳系统。Henderson SG、Nelson BL编辑。运筹学和管理科学手册,第13卷:模拟(North-Holland Publishing,阿姆斯特丹),501-534。
[27] Kim SH,Nelson BL(2007)排名和选择的最新进展。Henderson SG、Biller B、Hsieh MH、Shorte J、Tew JD、Barton RR编辑。程序。2007年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),162-172。
[28] Kleinberg J,Tardosé(2006)算法设计(波士顿艾迪森·韦斯利)。
[29] Lai TL,Robbins H(1985)渐近有效自适应分配规则。高级申请。数学。6:4-22. 交叉参考·Zbl 0568.62074号
[30] Pasupathy R、Hunter SR、Pujowidianto NA、Lee LH、Chen CH(2014)《通过评分的随机约束排名和选择》。ACM事务处理。建模计算。模拟25(1):1:1-1:26. 交叉参考
[31] Powell WB,Ryzhov IO(2012年)最佳学习(约翰·威利父子公司,新泽西州霍博肯)。交叉参考
[32] Qu H,Ryzhov IO,Fu MC,Ding Z(2015)未知相关结构的序贯选择。操作。物件。63(4):931-948. 链接·Zbl 1329.62474号
[33] Russo D,Van Roy B(2014)通过后验抽样学习优化。数学。操作。物件。39(4):1221-1243。链接·Zbl 1310.93091号
[34] Ryzhov IO(2015)预计改善程度相当于OCBA。Yilmaz L、Chan WKV、Moon I、Roeder TMK、Macal C、Rossetti MD编辑。程序。2015年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),3668-3677。交叉参考
[35] Ryzhov IO,Powell WB(2011)图上的信息收集。操作。物件。59(1):188-201。链接·Zbl 1218.90202号
[36] Ryzhov IO、Powell WB、Frazier PI(2012)一般在线学习问题的知识梯度算法。操作。物件。60(1):180-195. 链接·Zbl 1241.90201号
[37] Scott WR,Powell WB,Simão HP(2010)使用具有连续参数的知识梯度校准模拟模型。Johansson B、Jain S、Montoya-Torres J、Hugan J、Yücesan E编辑。程序。2010年冬季模拟会议。(IEEE,新泽西州皮斯卡塔韦),1099-1109。交叉参考
[38] Soms AP(1976)t吨-分配。J.Amer。统计师。协会。71(355):728-730. ·Zbl 0362.62021号
[39] Soms AP(1980)t吨-尾部区域。J.Amer。统计师。协会。75(370):438-440. ·Zbl 0469.62017年
[40] SzabóB,Tran-Thanh L(2014)关于贝叶斯在线学习算法的有限时间分析。已提交发布。
[41] Wang Y,Powell WB,Schapire R(2015)《知识粒度政策的有限时间分析和优化学习的新测试环境》。已提交发布。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。