文件Zbl 1359.62519-zbMATH Open

关于预期改进方法的收敛速度。（英语） Zbl 1359.62519号

操作。物件。 64，第6期，1515-1528（2016）.

摘要：我们考虑了一个具有独立正态观测值的排序和选择问题，并在此背景下分析了期望改进（EI）方法的渐近采样率。这种方法在实践中通常表现良好，但由于EI计算的非线性和非凸性，很难对其收敛速度进行简单分析。我们给出的新结果表明，对于已知的采样噪声，EI变量产生的渐近模拟分配与最优计算预算分配（OCBA）方法选择的分配基本相同，该方法已知在排序和选择中产生接近最优的渐近性能。这是EI和OCBA之间的第一个通用等价结果，它为EI的良好实际性能提供了见解。我们还导出了未知采样方差下EI的极限分配。

引用于18文件

MSC公司：

62第20页	统计学在经济学中的应用
62升05	顺序统计设计
62C10个	贝叶斯问题；贝叶斯过程的特征
91B06型	决策理论

关键词：

最优学习;排名和选择;预期改进;最优计算预算分配

软件：

EGO公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部链接

参考文献：

[1]	Branke J，Chick SE，Schmidt C（2007）选择选择程序。管理科学。53(12):1916-1932. 链接·兹比尔1232.62042
[2]	Bull AD（2011）高效全局优化算法的收敛速度。J.机器学习。物件。12:2879-2904. ·Zbl 1280.90094号
[3]	Chau M、Fu MC、Qu H、Ryzhov IO（2014）《模拟优化：基于梯度方法的教程概述和最新发展》。Tolk A、Diallo SY、Ryzhov IO、Yilmaz L、Buckley S、Miller JA编辑。程序。2014年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），21-35。交叉参考
[4]	Chen CH，Lee LH（2010年）随机模拟优化：一种最优计算预算分配（世界科学，新加坡）。交叉参考
[5]	Chen CH，Fu MC，Shi L（2008a）模拟与优化。Chen ZL，Raghavan S，编辑。信息运筹学教程（INFORMS，马里兰州汉诺威），247-260。链接
[6]	Chen CH，Chick SE，Lee LH，Pujowidianto NA（2015）排名与选择：高效模拟预算分配。Fu MC编辑。仿真优化手册（纽约施普林格），45-80。交叉参考
[7]	Chen CH，He D，Fu MC，Lee LH（2008b）选择最优子集的有效模拟预算分配。信息J.计算。20(4):579-595. 链接
[8]	Chen CH，Lin J，Yücesan E，Chick SE（2000）模拟预算分配以进一步提高顺序优化的效率。离散事件发电机。系统10(3):251-270. 交叉参考·Zbl 0970.90014号
[9]	Chick SE（2006）主观概率和贝叶斯方法。Henderson SG、Nelson BL编辑。运筹学和管理科学手册，第13卷：模拟（North-Holland Publishing，阿姆斯特丹），225-258。
[10]	Chick SE，Inoue K（2001）选择最佳模拟系统的新两阶段和顺序程序。操作。物件。49（5）：732-743。链接
[11]	Chick SE、Branke J、Schmidt C（2010）《近视患者最大化信息期望值的序贯抽样》。信息J.计算。22(1):71-80. 链接·Zbl 1243.62005年
[12]	DeGroot MH（1970）最优统计决策（纽约麦格劳-希尔出版社）。
[13]	Finner H，Dickhaus T，Roters M（2008）Student’s的渐近尾特性t吨-分配。通信统计–理论与方法37(2):175-179. 交叉参考·Zbl 1318.62045号
[14]	Frazier PI，Powell WB（2010）学习悖论和信息的边际价值。决策分析。7(4):378-403. 链接
[15]	Frazier PI，Powell WB，Dayanik S（2008）用于顺序信息收集的知识梯度策略。SIAM J.控制优化。47(5):2410-2439. 交叉参考·Zbl 1274.62155号
[16]	Fu MC，Hu JQ，Chen CH，Xiong X（2007）相关抽样下确定最佳设计的模拟分配。信息J.计算。19(1):101-111. 链接·Zbl 1241.62006年
[17]	Gao S，Shi L（2014）固定数量设计的最优机会成本选择程序。Tolk A、Diallo SY、Ryzhov IO、Yilmaz L、Buckley S、Miller JA编辑。程序。2014年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），2410-2439。交叉参考
[18]	Glynn PW，Juneja S（2004）《有序优化的大偏差观点》。Ingalls R、Rossetti MD、Smith JS、Peters BA编辑。程序。2004年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），577-585。交叉参考
[19]	Glynn PW，Juneja S（2011）《顺序优化：非参数框架》，Jain S，Creasey RR，Himmelspach J，White KP，Fu M，eds。程序。2011年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），4062-4069。交叉参考
[20]	Glynn PW，Juneja S（2015）序贯优化——经验大偏差率估值器和随机多武装匪徒。arXiv预打印arXiv:1507.04564v1。
[21]	Gupta S，Miescke K（1996）Bayesian前瞻性一阶段抽样分配，用于选择最佳总体。J.统计。规划和推断54（2）：229-244。交叉参考·Zbl 0854.62018号
[22]	Han B、Ryzhov IO、Defourny B（2013）美国红十字会捐赠者保留策略的有效学习。Pasupathy R、Kim SH、Tolk A、Hill R、Kuhl ME编辑。程序。2013年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），17-28。交叉参考
[23]	He D，Chick S，Chen CH（2007）固定数量备选系统顺序优化中的机会成本和OCBA选择程序。IEEE传输。系统、人与控制论C37（5）：951-961。交叉参考
[24]	Hong LJ，Nelson BL（2009）《模拟优化简介》。Rosetti M、Hill R、Johansson B、Dunkin A、Ingalls R编辑。程序。2009年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），75-85。交叉参考
[25]	Jones D，Schonlau M，Welch W（1998）代价高昂的黑盒函数的高效全局优化。J.全球优化。13(4):455-492. 交叉参考·Zbl 0917.90270号
[26]	Kim SH，Nelson BL（2006）选择最佳系统。Henderson SG、Nelson BL编辑。运筹学和管理科学手册，第13卷：模拟（North-Holland Publishing，阿姆斯特丹），501-534。
[27]	Kim SH，Nelson BL（2007）排名和选择的最新进展。Henderson SG、Biller B、Hsieh MH、Shorte J、Tew JD、Barton RR编辑。程序。2007年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），162-172。
[28]	Kleinberg J，Tardosé（2006）算法设计（波士顿艾迪森·韦斯利）。
[29]	Lai TL，Robbins H（1985）渐近有效自适应分配规则。高级申请。数学。6:4-22. 交叉参考·Zbl 0568.62074号
[30]	Pasupathy R、Hunter SR、Pujowidianto NA、Lee LH、Chen CH（2014）《通过评分的随机约束排名和选择》。ACM事务处理。建模计算。模拟25(1):1:1-1:26. 交叉参考
[31]	Powell WB，Ryzhov IO（2012年）最佳学习（约翰·威利父子公司，新泽西州霍博肯）。交叉参考
[32]	Qu H，Ryzhov IO，Fu MC，Ding Z（2015）未知相关结构的序贯选择。操作。物件。63(4):931-948. 链接·Zbl 1329.62474号
[33]	Russo D，Van Roy B（2014）通过后验抽样学习优化。数学。操作。物件。39（4）：1221-1243。链接·Zbl 1310.93091号
[34]	Ryzhov IO（2015）预计改善程度相当于OCBA。Yilmaz L、Chan WKV、Moon I、Roeder TMK、Macal C、Rossetti MD编辑。程序。2015年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），3668-3677。交叉参考
[35]	Ryzhov IO，Powell WB（2011）图上的信息收集。操作。物件。59（1）：188-201。链接·Zbl 1218.90202号
[36]	Ryzhov IO、Powell WB、Frazier PI（2012）一般在线学习问题的知识梯度算法。操作。物件。60(1):180-195. 链接·Zbl 1241.90201号
[37]	Scott WR，Powell WB，Simão HP（2010）使用具有连续参数的知识梯度校准模拟模型。Johansson B、Jain S、Montoya-Torres J、Hugan J、Yücesan E编辑。程序。2010年冬季模拟会议。（IEEE，新泽西州皮斯卡塔韦），1099-1109。交叉参考
[38]	Soms AP（1976）t吨-分配。J.Amer。统计师。协会。71(355):728-730. ·Zbl 0362.62021号
[39]	Soms AP（1980）t吨-尾部区域。J.Amer。统计师。协会。75(370):438-440. ·Zbl 0469.62017年
[40]	SzabóB，Tran-Thanh L（2014）关于贝叶斯在线学习算法的有限时间分析。已提交发布。
[41]	Wang Y，Powell WB，Schapire R（2015）《知识粒度政策的有限时间分析和优化学习的新测试环境》。已提交发布。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
立方厘米	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

关于预期改进方法的收敛速度。（英语） Zbl 1359.62519号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

关于预期改进方法的收敛速度。 （英语） Zbl 1359.62519号

MSC公司：

关键词：

软件：

参考文献：

关于预期改进方法的收敛速度。（英语） Zbl 1359.62519号