×

对响应面进行排序的顺序设计。 (英语) Zbl 1365.62319号

摘要:基于随机控制应用中最优反馈策略图的估计问题,我们提出并分析了排序多个响应面的顺序设计方法。即,给定连续输入空间(mathcal X)上的(L\geq 2)响应面,目的是有效地找到整个(mathcalX)上最小响应的指数。响应面未知,必须一次对一个响应面进行噪声采样,需要在空间和响应指数维度进行联合实验设计。为了生成序列设计启发式算法,我们研究了贝叶斯逐步不确定性减少方法,以及基于后验分类复杂性的抽样。我们还将我们的连续输入公式与多武器强盗纯后悔的离散框架联系起来。为了对响应面建模,我们使用克里金元模型。提供了几个使用合成数据和流行病控制问题的数值例子,以说明我们的方法和各自自适应设计的有效性。

MSC公司:

62万 顺序统计设计
62K20型 响应面设计
60G15年 高斯过程
62F07型 统计排名和选择程序
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] R.Aid,L.Campi,N.Langreneí,and H.Pham,{\it最优多重切换问题的概率数值方法及其在发电投资中的应用},SIAM J.金融数学。,5(2014),第191-231页·Zbl 1308.93217号
[2] R.Anderson和D.Milutinovic,{目标跟踪Dubins反馈控制的随机方法},2011年IEEE/RSJ智能机器人和系统国际会议,2011年,第3917-3922页。
[3] B.Ankenman、B.L.Nelson和J.Staum,《模拟元建模的随机克里金法》,Oper。Res.,58(2010),第371-382页·兹比尔1342.62134
[4] P.Auer、N.Cesa-Bianchi和P.Fischer,《多武装匪徒问题的有限时间分析》,马赫。学习。,47(2002),第235-256页·Zbl 1012.68093号
[5] J.Azimi、A.Fern和X.Z.Fern,《神经信息处理系统进展》23,J.Lafferty、C.Williams、J.Shawe-Tylor、R.Zemel和A.Culotta编辑,Curran Associates,Red Hook,NY,2010年,第109-117页。
[6] J.Bect、D.Ginsbourger、L.Li、V.Picheny和E.Vazquez,《失效概率估算的计算机实验顺序设计》,《统计计算》。,22(2012),第773-793页·Zbl 1252.62081号
[7] S.Bubeck、R.Munos和G.Stoltz,《在有限武装和持续武装土匪中的纯粹探索》,Theor。计算。科学。,412(2011),第1832-1852页·Zbl 1214.62082号
[8] S.Bubeck、R.Munos、G.Stoltz和C.Szepesvari,《X武装匪徒》,J.Mach。学习。Res.,12(2011),第1655-1695页·Zbl 1280.91038号
[9] A.Carpentier、A.Lazaric、M.Ghavamzadeh、R.Munos和P.Auer,《多武装匪徒主动学习的上确界算法》,摘自《算法学习理论》,纽约斯普林格出版社,2011年,第189-203页·Zbl 1349.91073号
[10] C.Chevalier、J.Bect、D.Ginsbourger、E.Vazquez、V.Picheny和Y.Richet,{快速平行克里金逐步不确定度减少及其在偏移集识别中的应用},《技术计量学》,56(2014),第455-465页。
[11] C.Chevalier、D.Ginsburger和X.Emery,{\it校正了批量序列数据同化的克里格更新公式},《地球数学》,施普林格,纽约,2014年,第119-122页。
[12] H.A.Chipman、E.I.George和R.E.McCulloch,《BART:贝叶斯加性回归树》,Ann.Appl。《统计》第4卷(2010年),第266-298页·Zbl 1189.62066号
[13] T.Choi和M.J.Schervish,{关于非参数回归问题的后验一致性},《多元分析杂志》。,98(2007),第1969-1987页·Zbl 1138.62020号
[14] D.A.Cohn,{利用优化实验设计进行神经网络探索},神经网络。,9(1996),第1071-1083页。
[15] D.Egloff,{最优停止和统计学习的蒙特卡罗算法},Ann.Appl。概率。,15(2005),第1396-1432页·Zbl 1125.91050号
[16] J.A.Fuemmeler和V.V.Veeravalli,《传感器网络节能跟踪的智能睡眠策略》,IEEE Trans。信号处理。,56(2008),第2091-2101页·Zbl 1390.94186号
[17] V.Gabillon、M.Ghavamzadeh、A.Lazaric和S.Bubeck,《高级神经信息处理》。系统。,2011年,第2222-2230页。
[18] S.E.Gano、J.E.Renaud、J.D.Martin和T.W.Simpson,{更新用于可变保真度优化的kriging模型的策略},结构。多磁盘。最佳。,32(2006年),第287-298页。
[19] D.T.Gillespie,耦合化学反应的精确随机模拟,J.Phys。化学。,81(1977年),第2340-2361页。
[20] R.B.Gramacy和D.W.Apley,{大型计算机实验的局部高斯过程近似},J.Compute。图表。《统计》,24(2015),第561-578页。
[21] R.B.Gramacy和H.K.H.Lee,《超级计算机实验的自适应设计和分析》,《技术计量学》,51(2009),第130-145页。
[22] R.B.Gramacy和M.Ludkovski,{最优停止问题的序列设计},SIAM J.Financ。数学。,6(2015),第748-775页·Zbl 1320.91154号
[23] R.B.Gramacy和N.Polson,{序贯设计和优化高斯过程模型的粒子学习},J.Compute。图表。《法律总汇》,20(2011),第102-118页。
[24] R.B.Gramacy和M.Taddy,{\it tgp,树高斯过程模型的R包},J.Stat.Softw。,33(2012),第1-48页。
[25] R.B.Gramacy、M.Taddy和N.Polson,《学习和设计的动态树》,《美国统计学会期刊》,106(2011),第109-123页·Zbl 1396.62158号
[26] S.Gru¨newa¨lder、J.-Y.Audibert、M.Opper和J.Shawe-Tylor,{高斯过程强盗问题的遗憾界限},《人工智能与统计国际会议》,2010年,第273-280页。
[27] J.Hespanha、M.Ludkovski和S.Quintro,{使用基于回归的动态规划对小型无人机进行目标跟踪的随机最优协调},J.Intell。机器人。系统。,(2016),第135-162页。
[28] M.W.Hoffman、B.Shahraria和N.de Freitas,《利用贝叶斯多武器强盗优化中的相关性和预算约束》,技术报告,arXiv预印本,2013年。
[29] D.Jones、M.Schonlau和W.Welch,{\it昂贵黑箱函数的有效全局优化},J.全局优化。,13(1998年),第455-492页·Zbl 0917.90270号
[30] A.Joshi、F.Porikli和N.Papanikolopoulos,{图像分类的多类主动学习},摘自IEEE计算机视觉和模式识别会议,CVPR 2009,IEEE,新泽西州皮斯卡塔韦,2009,第2372-2379页。
[31] G.Lai、M.X.Wang、S.Kekre、A.Scheller-Wolf和N.Secomandi,《液化天然气码头储存评估》,Oper。Res.,59(2011),第602-616页·Zbl 1230.91058号
[32] J.Lin和M.Ludkovski,{隐马尔可夫随机动力学模型中的序贯贝叶斯推断及其在季节性流行病检测和应对中的应用},统计计算。,24(2014),第1047-1062页·Zbl 1332.62272号
[33] F.Longstaff和E.Schwartz,《通过模拟评估美国期权:简单最小二乘法》,《金融评论》。研究,14(2001),第113-148页。
[34] M.Ludkovski和J.Niemi,《流感管理的最佳动态政策》,2(1)(2010),第5条(电子版)。
[35] M.Ludkovski和J.Niemi,{使用随机模拟的最佳疾病爆发决策},《2011年冬季模拟会议论文集》,IEEE,新泽西州皮斯卡塔韦,2011年,第3844-3853页。
[36] D.MacKay,{基于信息的主动数据选择目标函数},神经计算。,4(1992年),第590-604页。
[37] M.McKay、R.Beckman和W.Conover,《计算机代码输出分析中选择输入变量值的三种方法的比较》,《技术计量学》,21(1979),第239-245页·Zbl 0415.62011号
[38] N.Meinshausen和B.Hambly,《多重行使期权估价的蒙特卡罗方法》,数学。《金融》,14(2004),第557-583页·兹比尔1169.91372
[39] D.Merl、R.Johnson、R.Gramacy和M.Mangel,《流行病学干预适应性管理的统计框架》,《公共科学图书馆·综合》,4(6)(2009),第5087页。
[40] V.Picheny和D.Ginsbourger,{部分收敛模拟的非平稳时空高斯过程模型},SIAM/ASA J.不确定性。数量。,1(2013年),第57-78页·Zbl 1291.60075号
[41] V.Picheny、D.Ginsbourger、Y.Richet和G.Caplin,{基于分位数的可调精度噪声计算机实验优化},《技术计量学》,55(2013),第2-13页。
[42] V.Picheny、D.Ginsbourger、O.Roustant、R.T.Haftka和N.-H.Kim,《精确逼近靶区的自适应实验设计》,J.Mech。设计。,132(2010),第071008页。
[43] P.Ranjan、D.Bingham和G.Michailidis,《基于复杂计算机代码的轮廓估计的序贯实验设计》,《技术计量学》,50(2008),第527-541页。
[44] B.雷普利,黄土局部多项式回归拟合}。R包版本3.0.1。
[45] O.Roustant,D.Ginsbourger和Y.Deville,{it Dicekriging,DiceOptim:通过基于kriging-based元建模和优化分析计算机实验的两个R包},J.Stat.Softw。,51(2012),第1-51页。
[46] N.Srinivas、A.Krause、S.Kakade和M.Seeger,{盗贼设置下高斯过程优化的信息论遗憾界},IEEE Trans。《信息论》,58(2012),第3250-3265页·Zbl 1365.94131号
[47] C.K.Williams和C.E.Rasmussen,《机器学习的高斯过程》,麻省理工学院出版社,剑桥,2006年·兹比尔1177.68165
[48] M.Zervos、T.C.Johnson和F.Alazemi,《买入-卖出-高投资策略》,数学。《金融》,23(2013),第560-578页·Zbl 1283.91170号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。