×

兹马思-数学第一资源

多维连续空间上非线性参数信念模型的最优学习。(英语) Zbl 1404.62023

理学硕士:
62007年 统计排名和选择程序
90度15度 随机规划
90度59度 数学规划中的逼近方法和启发式方法
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] S、 阿格拉瓦尔和N.戈亚尔,多武装土匪问题的Thompson抽样分析,见《JMLR学习理论研讨会和会议记录》,2012年,第39.1-39.26页。
[2] E、 J.安德森和M.C.费里斯,含噪声函数优化的直接搜索算法,SIAM J.Optim.,11(2001年),第837–857页。·Zbl 1035.90106
[3] D、 V.阿诺德和H.-G.Beyer,噪声环境下进化策略与其它直接搜索方法的比较,计算。擎天柱。应用,24(2003),第135-159页。·Zbl 1035.90110
[4] J、 -Y.Audibert和S.Bubeck,多武装土匪的最佳武器识别《学习理论会议论文集》,2010年。
[5] P、 Auer,N.Cesa Bianchi和P.Fischer,多武装匪徒问题的有限时间分析,马赫。学习,47(2002),第235-256页。·Zbl 1012.68093
[6] N、 T.贝利,生物学中的统计方法,剑桥大学出版社,剑桥,英国,1995年。·Zbl 0092.37102
[7] 五、 E.Bening和V.Y.Korolev,广义Poisson模型及其在保险金融中的应用,Walter de Gruyter,柏林,2002年。·Zbl 1041.60004号
[8] 五十、 比安奇,M.多里戈,L.M.甘巴拉和W.J.古特哈尔,随机组合优化的元启发式研究综述,纳特。Comput.,8(2009),第239-287页。·Zbl 1162.90591号
[9] G、 I.Bischi,A.K.Naimzada和L.Sbragia,具有局部垄断近似的寡头垄断博弈,经济学杂志。行为。Organiz.,62(2007),第371-388页。
[10] A、 J.Booker,J.E.Dennis,P.D.Frank,D.B.Serafini,V.Torczon和M.W.Trosset,用代理优化昂贵函数的严格框架,结构。多盘。Optim.,17(1999),第1-13页。
[11] J、 布兰克、S.梅塞尔和C.施密特,噪声环境下的模拟退火,J.启发式,14(2007),第627-654页。·Zbl 1173.90589
[12] C、 陈浩,林俊杰,余思三,小鸡,进一步提高序数优化效率的模拟预算分配,离散事件动态。系统,10(2000),第251-270页。·Zbl 0970.90014
[13] S、 Chen,K.Reyes,X.He,M.Gupta,J.Goodman,M.McAlpine和W.B.Powell,非中心卡方噪声分布下释放曲线匹配序贯实验的最优学习,工作文件,2016年。
[14] S、 陈,K.—R.G.Reyes,M.K.Gupta,M.C.McAlpine和W.B.Powell,基于知识梯度策略的实验设计优化学习及其在纳米乳液稳定性表征中的应用,暹罗/ASA J.不确定。Quantif.,3(2015),第320-345页。·Zbl 1327.62098
[15] S、 E.奇克、J.布兰克和C.施密特,序贯抽样法使信息的期望值最大化,通知J.Comput.,22(2010),第71-80页。·Zbl 1243.62005
[16] A、 R.Conn,K.Scheinberg和L.N.Vicente,自由插值优化中的导数集,在数学方面。计划,111(2008),第141-172页。·Zbl 1163.90022号
[17] G、 邓和M.C.Ferris,UOBYQA算法对噪声函数的适应性,2006年冬季模拟会议论文集,第312-319页。
[18] M、 丹尼和S.盖恩斯,生物学中的机遇:用概率探索自然,普林斯顿大学出版社,普林斯顿,新泽西州,2002年。·Zbl 1032.92001号
[19] C、 埃尔斯特和A.Neumaier,含噪函数优化的信赖域方法《计算》,58(1997),第31-46页。·Zbl 0879.90166
[20] P、 I.弗雷泽、W.B.鲍威尔和S.戴亚尼克,序列信息采集的知识梯度策略,SIAM J.Control Optim.,47(2008),第2410–2439页。·Zbl 1274.62155
[21] P、 I.弗雷泽、W.B.鲍威尔和S.戴亚尼克,相关正常信念的知识梯度策略,通知J.Comput.,21(2009),第599–613页。·Zbl 1243.91014号
[22] M、 傅成玉,随机梯度估计,实习医生。爵士。操作。资源管理科学。216,斯普林格,查姆,2015年,第105-147页。
[23] M、 傅成玉,胡俊杰,陈春华,熊晓红,相关抽样下确定最优设计的模拟分配,通知J.Comput.,19(2007),第101-111页。·Zbl 1241.62006
[24] A、 加西亚,电气工程的概率统计与随机过程,Addison Wesley,雷丁,马萨诸塞州,2008年。
[25] D、 戈德曼,排序和选择方法实用指南,在《运筹学革命》(The Operations Research Revolution),D.M.Aleman和A.C.Thiele,eds.,INFORMS,马里兰州卡通斯维尔,2015年,第89-110页。
[26] S、 S.Gupta和K.J.Mieske,贝叶斯前瞻性单阶段抽样分配选择最优群体,J.统计学家。普兰。推论,54(1996),第229-244页。·Zbl 0854.62018
[27] J、 M.Harrison,N.B.Keskin,A.Zeevi,J.Michael Harrison,N.Bora Keskin和A.Zeevi,贝叶斯动态定价策略:二元先验分布下的学习与收益,管理。《科学》,58(2012),第570-586页。
[28] T、 黑斯蒂、R.蒂比拉尼和J.弗里德曼,统计学习的要素:数据挖掘、推理和预测,斯普林格·韦拉格,纽约,2009年。·Zbl 1273.62005
[29] D、 他,S.E.Chick和C.-H.Chen,固定数量替代系统序数优化中的机会成本和OCBA选择过程,IEEE Trans。系统人网络。C、 37(2007年),第951-961页。
[30] 十、 他和鲍威尔,基于非线性参数信念模型的随机优化学习,SIAM J.Optim.,28(2018年),第2327-2359页。·Zbl 1400.90233
[31] 五十、 Hong和B.L.Nelson,仿真优化简介,2009年冬季模拟会议论文集,第75-85页。
[32] H、 江和U.V.Shanbhag,不完全信息条件下随机优化问题的求解,2013年冬季模拟会议论文集,第821-832页。
[33] H、 江和U.V.Shanbhag,不完全信息条件下随机优化与变分问题的求解,SIAM J.Optim.,26(2016年),第2394-2429页。·Zbl 1356.90097
[34] 五十、 P.凯尔布林,嵌入式学习系统麻省理工学院出版社,剑桥,马萨诸塞州,1993年。
[35] A、 I.Khuri和S.Mukhopadhayy,响应面法,威利Interdiscip。版次。计算机。Stat.,2(2010),第128-149页。
[36] J、 基弗和沃尔福威茨,回归函数最大值的随机估计,安。数学。Stat.,23(1952),第462-466页。·Zbl 0049.36601
[37] S、 -H.Kim和B.L.Nelson,选择最佳系统,运筹学和管理科学手册13,爱思唯尔,纽约,2006年。
[38] S、 -H.Kim和B.L.Nelson,排名和评选的最新进展,2007年冬季模拟会议论文集,第162-172页。
[39] H、 库什纳和D.克拉克,约束和非约束系统的随机逼近方法,斯普林格·韦拉格,柏林,1978年。
[40] 五十、 Ljung和S.Gunnarsson,系统辨识中的自适应与跟踪综述,Automatica,26(1990年),第7-21页。·Zbl 0714.93053
[41] A、 里昂,为什么正态分布是正态分布?,英国J.菲洛斯。科学,65(2014),第621-649页。·Zbl 1319.62010
[42] K、 L.摩尔,确定性系统的迭代学习控制,斯普林格·韦拉格,纽约,1993年。·Zbl 0773.93002
[43] J、 穆勒、C.A.鞋匠和R.皮切́,SO-MI:求解计算代价昂贵的非线性混合整数黑箱全局优化问题的代理模型算法,计算。操作。第40期(2013年),第1383-1400页。·Zbl 1352.90067
[44] D、 M.Negoescu,P.I.Frazier和W.B.Powell,药物发现中测序实验的知识梯度算法,通知J.Comput.,23(2011),第346–363页。·124ZB23
[45] S、 Ó拉夫森,元启发式,在模拟中,S.G.Henderson和B.L.Nelson编辑,操作手册。法力。科学。13,爱思唯尔,纽约,2006年,第633-654页。
[46] Y、 彭春华,陈春华,傅成玉,胡俊杰,动态抽样分配与设计选择,通知J.Comput.,28(2016),第195–208页。·Zbl 1343.90056
[47] M、 鲍威尔,UOBYQA:基于二次逼近的无约束优化,数学。程序。B、 92年(2002年),第555-582页。·Zbl 1014.65050
[48] W、 鲍威尔,近似动态规划:求解维数问题第二版,约翰威利父子公司,纽约,2011年。·Zbl 1242.90002
[49] W、 鲍威尔和里约夫,最佳学习,John Wiley and Sons,纽约,2012年。
[50] N、 V.Queipo,R.T.Haftka,W.Shyy,T.Goel,R.Vaidyanathan和P.K.Tucker,基于代理的分析与优化,程序。Aerosp公司。《科学》,41(2005),第1-28页。
[51] R、 雷吉斯和C.A.鞋匠,基于径向基函数的昂贵黑盒函数约束全局优化,J.Global Optim.,31(2005),第153-171页。·Zbl 1274.90511号
[52] R、 鲁宾斯坦和夏皮罗,用分数函数法优化静态仿真模型,数学。计算机。《模拟》,32(1990),第373-392页。
[53] D、 Russo和B.Van Roy,通过后验抽样学习优化,数学。操作。第39号决议(2014年),第1221-1243页。·Zbl 1310.93091
[54] W、 斯科特,P.弗雷泽和W.鲍威尔,高斯过程回归连续参数模拟优化的相关知识梯度,SIAM J.Optim.,21(2011年),第996–1026页。·Zbl 1229.62018
[55] S、 辛格,T.Jaakkola,M.L.Littman,C.Szepes和A.S.Hu,单步策略强化学习算法的收敛结果,马赫。学习,39(2000),第287-308页。·Zbl 0954.68127
[56] J、 剥落,随机搜索与优化导论,第1版,威利,纽约,2003年。
[57] R、 萨顿和A.巴托,强化学习:导论麻省理工学院出版社,剑桥,马萨诸塞州,1998年。
[58] F、 Szidarovszky和J.Krawczyk,动态寡头状态下的稳定学习,纯数学。应用程序。(医学硕士),15(2004年),第453-468页。·Zbl 1136.91525
[59] W、 汤普森先生,从两个样本的证据看一个未知概率超过另一个概率的可能性《生物计量学》,25(1933年),第285-294页。·京FM 59.1159.03
[60] M、 W.特罗塞特,直接搜索法在随机优化中的应用,技术报告,莱斯大学,休斯顿,德克萨斯州,2000年。
[61] S、 M.Wild,R.G.Regis和C.A.鞋匠,基于信赖域的径向基函数插值优化轨道,暹罗科学杂志。Comput.,30(2008),第3197-3219页。·Zbl 1178.65065
数字图书馆提供的数学或参考资料就是基于此。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。