陈增静;张、赵昂 具有拱形奖励函数的贝叶斯双臂盗贼问题的最优策略。 (英语) Zbl 07831671号 数学。控制关系。领域 第14页,第1期,91-107页(2024年).MSC公司:62C10个 60F05型 62升05 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{Z.Chen}和\textit{Z.-A.Zhang},数学。控制关系。字段14,编号1,91--107(2024;Zbl 07831671) 全文: 内政部
康启宇;泰伟鹏;她,芮;王思杰;刘晓倩;杨元瑞 具有潜在偏见的多武器线性强盗。 (英语) Zbl 07821776号 信息科学。 660,文章ID 120103,19 p.(2024).MSC公司:91磅06 PDF格式BibTeX公司 XML格式引用 \textit{Q.Kang}等人,《信息科学》。660,文章ID 120103,19页(2024;Zbl 07821776) 全文: 内政部
陈毅;王以宁;方,伊桑·X。;王兆然;李润泽 通过最佳子集选择在小动作空间上实现近维相关稀疏线性强盗。 (英语) 兹比尔07820379 美国统计协会。 119,编号545,246-258(2024).MSC公司:62至XX PDF格式BibTeX公司 XML格式引用 \textit{Y.Chen}等人,《美国统计协会期刊》第119卷,第545、246--258号(2024年;Zbl 07820379) 全文: 内政部 arXiv公司 链接
陈增静;林毅伟;张继晨 证实了关于费尔德曼双臂匪徒问题的猜测。 (英语) Zbl 07808662号 J.应用。普罗巴伯。 61,第1期,121-136(2024).MSC公司:62C10个 62升05 PDF格式BibTeX公司 XML格式引用 \textit{Z.Chen}等人,J.Appl。普罗巴伯。61,编号1,121--136(2024;Zbl 07808662) 全文: 内政部 arXiv公司
蒋楠;谢伟军 分布有利优化:具有内生异常值的数据驱动决策框架。 (英语) Zbl 07801125号 SIAM J.Optim公司。 34,编号1,419-458(2024).MSC公司:90立方厘米 90立方厘米 62J07型 PDF格式BibTeX公司 XML格式引用 \textit{N.Jiang}和\textit{W.Xie},SIAM J.Optim。34,编号1,419--458(2024;Zbl 07801125) 全文: 内政部
朱利安·海登里奇。;科林·博纳蒂;德克·莫尔 基于递归神经网络的塑性模型的传递学习。 (英语) Zbl 07801038号 国际期刊数字。方法工程。 125,第1号,文章ID e7357,31 p.(2024).MSC公司:74C99型 74S99型 68T05型 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{J.N.Heidenreich}等人,国际期刊数字。方法工程125,No.1,文章ID e7357,31 p.(2024;Zbl 07801038) 全文: 内政部 OA许可证
西尔弗,大卫;安德烈·巴雷托 基于仿真的搜索。 (英语) Zbl 07821712号 Beliaev,Dmitry(编辑)等人,《2022年国际数学家大会》,ICM 2022,芬兰赫尔辛基,虚拟,2022年7月6日至14日。第6卷。第12-14节。柏林:欧洲数学学会(EMS)。4800-4819 (2023).MSC公司:68-06 68T05型 68层37 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{D.Silver}和\textit{A.Barreto},in:2022年国际数学家大会,ICM 2022,芬兰赫尔辛基,虚拟,2022年7月6日至14日。第6卷。第12-14节。柏林:欧洲数学学会(EMS)。4800--4819(2023;Zbl 07821712) 全文: 内政部 OA许可证
谢尔盖·五·加巴尔。;Aleksandr V.科尔诺戈洛夫。;阿列克谢·拉祖琴科。 单兵强盗问题中的UCB策略和批处理优化。 (俄语。英文摘要) Zbl 07804520号 Mat.Teor公司。伊格尔·普里洛日。 15,编号4,3-27(2023).MSC公司:91B32型 PDF格式BibTeX公司 XML格式引用 \textit{S.V.Garbar’}等人,Mat.Teor。伊格尔·普里洛日。15、编号4、3——27(2023;Zbl 07804520) 全文: MNR公司
布莱尔·比洛多;杰弗里·尼格里亚;丹尼尔·罗伊(Daniel M.Roy)。 放松i.i.d.假设:通过根向正则化自适应地最小化最大最优后悔。 (英语) Zbl 07783521号 Ann.统计。 51,编号4,1850-1876(2023).MSC公司:62升10 62立方厘米20 60G25型 62M20型 68问题32 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{B.Bilodeau}等人,Ann.Stat.51,No.4,1850--1876(2023;Zbl 07783521) 全文: 内政部 arXiv公司 链接
陆秀媛;本杰明·范罗伊;维兰特·德瓦拉切拉;莫特扎·易卜拉希米;伊恩·奥斯班德;文,郑 强化学习,一点一点。 (英语) Zbl 1525.68120号 已找到。趋势马赫数。学习。 16,第6期,733-865(2023).MSC公司:68T05型 68-02 PDF格式BibTeX公司 XML格式引用 \textit{X.Lu}等人,发现。趋势马赫数。学习。16、编号6、733--865(2023;Zbl 1525.68120) 全文: 内政部 arXiv公司
陆晓宇;汤姆·雷诺思;Teh、Yee Whye Daisee:通过平衡探索和开发实现自适应重要性抽样。 (英语) Zbl 07748387号 扫描。J.统计。 50,编号3,1298-1324(2023).MSC公司:62至XX PDF格式BibTeX公司 XML格式引用 \textit{X.Lu}等人,扫描。J.Stat.50,No.3,1298--1324(2023;Zbl 07748387) 全文: 内政部
F.古洛。;D.曼达利奥。;塔加雷利,A。 关联聚类的组合多臂盗贼方法。 (英语) Zbl 1528.68340号 数据最小知识。发现。 37,第4期,1630-1691(2023).MSC公司:68T05型 05C22号 62H30型 91A46型 PDF格式BibTeX公司 XML格式引用 \textit{F.Gullo}等人,Data Min.Knowl。发现。37,第4号,1630--1691(2023;Zbl 1528.68340) 全文: 内政部
Dennis J.N.J.Soemers。;埃里克·皮埃特;马修·斯蒂芬森;卡梅隆·布朗 一般游戏的空间状态-动作功能。 (英语) 兹比尔1524.68345 Artif公司。智力。 321,文章ID 103937,32 p.(2023).MSC公司:68T20型 91A46型 PDF格式BibTeX公司 XML格式引用 \textit{D.J.N.J.Soemers}等人,Artif。智力。321,文章ID 103937,32 p.(2023;Zbl 1524.68345) 全文: 内政部 arXiv公司
普里扬克·阿格拉瓦尔;图拉班杜拉,塞亚;瓦希斯特阿瓦达努拉 一种适用于多项式logit上下文强盗的易于处理的在线学习算法。 (英语) Zbl 07709846号 欧洲药典。物件。 310,第2期,737-750(2023年).MSC公司:900亿 PDF格式BibTeX公司 XML格式引用 \textit{P.Agrawal}等人,《欧洲药典》。310号决议,第2号,737--750(2023年;Zbl 07709846) 全文: 内政部 arXiv公司
安东尼奥·坎德列里;安德烈·蓬蒂;伊利亚州佐丹尼;弗朗西斯科·阿切蒂 Wasserstein距离在不确定条件下人类决策分布分析中的应用。 (英语) Zbl 07709590号 安。数学。Artif公司。智力。 91,编号2-3,217-238(2023).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{A.Candelieri}等人,《数学年鉴》。Artif公司。智力。91,编号2--3,217--238(2023;Zbl 07709590) 全文: 内政部
李,肖;李玉强;吴贤义 带(varepsilon)-探索的经验Gittins指数策略用于多武装盗贼问题。 (英语) Zbl 07708608号 计算。统计数据分析。 180,文章ID 107610,26 p.(2023).MSC公司:62-08 PDF格式BibTeX公司 XML格式引用 \textit{X.Li}等人,计算。统计数据分析。180,文章ID 107610,26 p.(2023;Zbl 07708608) 全文: 内政部
李彦文;高思阳 最优计算预算分配算法的收敛速度分析。 (英语) Zbl 1520.93316号 Automatica公司 153,文章ID 111042,16 p.(2023).MSC公司:93元65角 90立方厘米26 PDF格式BibTeX公司 XML格式引用 \textit{Y.Li}和\textit{S.Gao},自动化153,文章ID 111042,第16页(2023;Zbl 1520.93316) 全文: 内政部 arXiv公司
阿贝尔斯,阿克塞尔;汤姆·勒纳特斯;维托·特里安尼;现在,安 处理集体决策中的专家偏见。 (英语) Zbl 07702957号 Artif公司。智力。 320,文章ID 103921,22 p.(2023).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{A.Abels}等人,Artif。智力。320,文章ID 103921,22 p.(2023;Zbl 07702957) 全文: 内政部 arXiv公司
邱子怡;杰罗姆·勒尼;Jean-Pierre大卫 使用锚和蒙特卡罗树搜索对动态决策系统进行时序逻辑解释。 (英语) Zbl 07702936号 Artif公司。智力。 318,文章ID 103897,21 p.(2023).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{T.-Y.Chiu}等人,Artif。智力。318,文章ID 103897,21 p.(2023;Zbl 07702936) 全文: 内政部
维克托·本斯;埃克·Hüllermier 对资源消耗进行审查的多武器匪徒。 (英语) Zbl 07694484号 机器。学习。 112,编号1,217-240(2023).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{V.Bengs}和\textit{E.Hüllermeier},马赫。学习。112,编号1,217--240(2023;Zbl 07694484) 全文: 内政部 arXiv公司
马尼什拉加万;阿列克桑德斯·斯利夫金斯;詹妮弗·沃特曼·沃恩;吴志伟Steven 贪婪算法在平滑的上下文盗贼中几乎占主导地位。 (英语) Zbl 07680599号 SIAM J.计算。 52,第2期,487-524(2023年).MSC公司:68T99型 PDF格式BibTeX公司 XML格式引用 \textit{M.Raghavan}等人,SIAM J.Compute。52,第2号,487--524(2023;Zbl 07680599) 全文: 内政部 arXiv公司
哦,不,广志 多武装强盗的量子贪婪算法。 (英语) Zbl 1509.81293号 量子信息处理。 22,第2号,第101号文件,第20页(2023).MSC公司:81页68 PDF格式BibTeX公司 XML格式引用 \textit{H.Ohno},量子信息处理。22,第2号,第101号论文,20页(2023;Zbl 1509.81293) 全文: 内政部
杰伦·弗兰斯曼;Joris Sijs先生;亨利·多尔;埃里克·休尼森;巴特·德·舒特 分布式贝叶斯:连续分布式约束优化问题求解器。 (英语) Zbl 1506.68163号 J.阿蒂夫。智力。研究(JAIR) 76, 393-433 (2023).MSC公司:68T42型 62升05 90立方厘米26 PDF格式BibTeX公司 XML格式引用 \textit{J.Fransman}等人,J.Artif。智力。研究(JAIR)76,393--433(2023;Zbl 1506.68163) 全文: 内政部 arXiv公司
乔里克·乔肯;彼得·莱曼;托尼·沃特斯;Patrick De Causmaecker 使用蒙特卡罗树搜索的改进版本探索搜索空间树以解决组合优化问题。 (英语) Zbl 1520.90177号 计算。操作。物件。 150,文章ID 106070,25 p.(2023).MSC公司:90C27型 90B35型 90C09型 90 C59 PDF格式BibTeX公司 XML格式引用 \textit{J.Jooken}等人,《计算》。操作。第150号决议,文章编号106070,25页(2023年;Zbl 1520.90177) 全文: 内政部 arXiv公司
阿尔瓦罗·卡特亚;帕特里克·张;马特乌斯·姆罗茨卡;罗尔·乌门 场外金融市场AI驱动的流动性条款。 (英语) Zbl 1518.91255号 数量。财务 22,第12期,2171-2204(2022).MSC公司:91G15型 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{阿.卡特亚}等人,数量。财务22,No.12,2171--2204(2022;Zbl 1518.91255) 全文: 内政部
加巴尔,S.V。;科尔诺戈罗夫。 定制J.Bather针对高斯多武器匪徒的UCB策略。 (英语。俄文原件) 兹比尔1508.93330 自动。远程控制 83,第11期,1857-1873(2022); Mat.Teor翻译。伊格尔·普里洛日。14,第2期,第3-30页(2022年)。MSC公司:93E20型 91A80 PDF格式BibTeX公司 XML格式引用 \textit{S.V.Garbar}和\textit{A.V.Kolnogorov},汽车。遥控器83,No.11,1857--1873(2022;Zbl 1508.93330);Mat.Teor翻译。伊格尔·普里洛日。14、第2、3--30号(2022年) 全文: 内政部
安德斯·布雷达尔,科克;大卫·Preinerstorfer;贝齐尔根·维利耶夫 功能性序贯治疗分配。 (英语) Zbl 1506.62409号 美国统计协会。 117,编号539,1311-1323(2022).MSC公司:62P05号 62K99型 PDF格式BibTeX公司 XML格式引用 \textit{A.B.Kock}等人,《美国统计协会期刊》第117卷,第539、1311--1323号(2022年;Zbl 1506.62409) 全文: 内政部 arXiv公司 链接
贾森·罗格纳思;阿尔卑斯山阿克凯;张应倩;乌扎伊·凯马克 在二价拍卖中设定底价,并进行未观察到的竞标。 (英语) Zbl 07640775号 信息J.计算。 34,第6期,2950-2967(2022).MSC公司:90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{J.Rhuggenaath}等人,《信息与计算》。34,第6号,2950--2967(2022;Zbl 07640775) 全文: 内政部 链接
维维克·法里亚斯(Vivek F.Farias)。;Eli Gutin先生 乐观的Gittins指数。 (英语) 兹比尔1516.91030 操作。物件。 70,第6号,3432-3456(2022).MSC公司:91B32型 91磅06 2015年1月62日 PDF格式BibTeX公司 XML格式引用 \textit{V.F.Farias}和\textit{E.Gutin},Oper。第70号决议,第63432-3456号(2022年;兹bl 1516.91030) 全文: 内政部 链接
胡宜春;内森·卡卢斯;毛晓杰 平滑背景盗贼:连接参数化和不可区分的后悔机制。 (英语) Zbl 07640293号 操作。物件。 70,第6号,3261-3281(2022).MSC公司:62至XX PDF格式BibTeX公司 XML格式引用 \textit{Y.Hu}等人,Oper。第70号决议,第6号,3261-3281(2022年;Zbl 07640293) 全文: 内政部 arXiv公司
德瓦夫拉特·沙阿;谢巧敏;徐,志 蒙特卡罗树搜索的非渐近分析。 (英语) Zbl 1510.90286号 操作。物件。 70,第6号,3234-3260(2022).MSC公司:90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{D.Shah}等人,作品。第70号决议,第6号,3234-3260(2022年;Zbl 1510.90286) 全文: 内政部 arXiv公司 链接
王思伟;陈伟 一般报酬函数依赖于完全分布的纯探索问题。 (英语) Zbl 07624273号 机器。学习。 111,第9号,3279-3306(2022).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.Wang}和\textit{W.Chen},Mach。学习。111,编号9,3279--3306(2022;Zbl 07624273) 全文: 内政部 arXiv公司
巴纳甘蒂,基山;Dileep卡拉希尔;普拉文·瓦莱亚 对有限参数化多武器强盗的无限遗憾。 (英语) Zbl 07616578号 Yin,George(编辑)等人,《随机分析、滤波和随机优化》。纪念马克·戴维斯贡献的纪念册。查姆:斯普林格。411-429 (2022).MSC公司:62页99 62M45型 PDF格式BibTeX公司 XML格式引用 \textit{K.Panaganti}等人,in:随机分析、过滤和随机优化。纪念马克·戴维斯贡献的纪念册。查姆:斯普林格。411--429(2022;Zbl 07616578) 全文: 内政部 arXiv公司
蔡·T·托尼;蒲宏明 具有可加模型的随机连续武装匪徒:极大极小遗憾和自适应算法。 (英语) Zbl 07610767号 Ann.统计。 50,第4号,2179-2204(2022).MSC公司:62G08号 62升12 PDF格式BibTeX公司 XML格式引用 \textit{T.T.Cai}和\textit{H.Pu},Ann.Stat.50,No.4,2179--2204(2022;Zbl 07610767) 全文: 内政部
科尔诺戈罗夫。;A.V.纳辛。;石岩,D.N。 双臂盗贼问题和镜像下降算法的批处理版本。 (英语。俄文原件) Zbl 1498.93699号 自动。远程控制 83,第8期,1288-1307(2022); Mat.Teor翻译。伊格尔·普里洛日。第13期,第2期,第9-39页(2021年)。MSC公司:93E03型 93C40型 91A80 PDF格式BibTeX公司 XML格式引用 \textit{A.V.Kolnogorov}等人,《汽车》。遥控器83,编号8,1288--1307(2022;Zbl 1498.93699);Mat.Teor翻译。伊格尔·普里洛日。第13期,第2期,第9-39期(2021年) 全文: 内政部
Garbar’,SergeĭV。;亚历山大五世(Alexander V.Kolnogorov)。 自定义J.Bather针对高斯多武器土匪的UCB策略。 (俄语。英文摘要) Zbl 1500.91019号 Mat.Teor公司。伊格尔·普里洛日。 14,编号2,3-30(2022); 自动翻译。遥控器83,No.11,1857-1873(2022)。MSC公司:91A40型 PDF格式BibTeX公司 XML格式引用 \textit{S.V.Garbar’}和\textit{A.V.Kolnogorov},Mat.Teor。伊格尔·普里洛日。14、第2、3--30号(2022;Zbl 1500.91019);自动翻译。遥控器83,No.11,1857--1873(2022) 全文: MNR公司
蒂莫西·基顿。;阿尔曼·萨巴吉 拆卸和设计用于控制多武器盗贼后悔的复制差异。 (英语) Zbl 07595474号 J.统计理论实践。 16,第4号,第55号论文,29页(2022年).MSC公司:62磅 90立方厘米 91Bxx号 PDF格式BibTeX公司 XML格式引用 \textit{T.J.Keaton}和\textit{A.Sabbaghi},J.Stat.理论与实践。16,第4号,第55号论文,第29页(2022;Zbl 07595474) 全文: 内政部
迈赫迪·达沃迪;Michael N.Katehakis。;杨健 具有固定设置成本和未知离散需求分布的动态库存控制。 (英语) Zbl 1494.90005号 操作。物件。 70,编号3,1560-1576(2022).MSC公司:90B05型 PDF格式BibTeX公司 XML格式引用 \textit{M.Davoodi}等人,Oper。第70号决议,第3号,1560--1576(2022年;Zbl 1494.90005) 全文: 内政部
陈浩鹏;胡寿日 无限武器强盗:通过置信边界优化。 (英语) 兹比尔1524.62373 统计正弦。 32,第3期,1683-1699(2022).MSC公司:62升05 PDF格式BibTeX公司 XML格式引用 \textit{H.P.Chan}和\textit{S.Hu},Stat.Sin。32,第3号,1683-1699(2022;Zbl 1524.62373) 全文: 内政部 arXiv公司
格雷戈·亨德尔 混合整数规划的自适应大邻域搜索。 (英语) Zbl 1489.90067号 数学。程序。计算。 14,第2期,185-221(2022).MSC公司:90立方厘米 90立方厘米 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{G.Hendel},数学。程序。计算。14,第2号,185--221(2022;Zbl 1489.90067) 全文: 内政部
努尔萨吉德;弗朗西斯科·法西奥;兰斯洛特·达科斯塔;托马斯·帕尔;约翰·施密杜贝尔;卡尔·弗里斯顿 贝叶斯大脑和雷尼分歧。 (英语) Zbl 1491.92020年 神经计算。 34,第4号,829-855(2022).MSC公司:92秒20 2015年1月62日 PDF格式BibTeX公司 XML格式引用 \textit{N.Sajid}等人,《神经计算》。34,第4号,829--855(2022;Zbl 1491.92020) 全文: 内政部 arXiv公司
Shogo Hayashi;本田、骏雅;鹿岛,久志 部分指定查询的贝叶斯优化。 (英语) 兹比尔1491.68155 机器。学习。 111,第3期,1019-1048(2022).MSC公司:68T05型 60G15年 2015年1月62日 62升05 PDF格式BibTeX公司 XML格式引用 \textit{S.Hayashi}等人,马赫。学习。111,编号31019-1048(2022;兹bl 1491.68155) 全文: 内政部
Bachouch,Achref公司;库雷,科特迪瓦;尼古拉斯·兰格里内;范惠恩 有限水平随机控制问题的深度神经网络算法:数值应用。 (英语) Zbl 1496.93112号 Methodol公司。计算。申请。普罗巴伯。 24,第1期,143-178(2022).MSC公司:93E03型 93C55美元 68T07型 PDF格式BibTeX公司 XML格式引用 \textit{A.Bachouch}等人,Methodol。计算。申请。普罗巴伯。24,编号1,143--178(2022;Zbl 1496.93112) 全文: 内政部 arXiv公司
徐伟康;徐嘉明;林晓军;贝尔(Mark R.Bell)。 支付不确定排队系统的在线学习与自适应控制集成。 (英语) Zbl 1490.90090号 操作。物件。 70,第2期,1166-1181(2022).MSC公司:90B22型 90C25型 PDF格式BibTeX公司 XML格式引用 \textit{W.-K.Hsu}等人,作品。第70号决议,第2号,1166--1181(2022年;Zbl 1490.90090) 全文: 内政部
伊莎·曼苏尔;亚历克斯·斯利夫金斯;Syrgkanis、Vasilis;吴志伟Steven 贝叶斯探索:激励贝叶斯游戏中的探索。 (英语) Zbl 1493.91078号 操作。物件。 第2号第70页,1105-1127页(2022).MSC公司:91B43型 91B44型 91A27型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Mansour}等人,Oper。第70号决议,第2号,1105--1127(2022年;Zbl 1493.91078) 全文: 内政部 arXiv公司
大岛,Koji;山本大辅;Atsuhiro Yumoto;金松菊;Yusuke伊藤;Mikio长谷川 用于优化复杂无线通信系统性能的在线机器学习算法。 (英语) Zbl 07513251号 数学。Biosci公司。工程师。 第2期第19页,2056-2094(2022).MSC公司:68T05型 94A05型 PDF格式BibTeX公司 XML格式引用 \textit{K.Oshima}等人,数学。Biosci公司。工程19,编号2,2056--2094(2022;Zbl 07513251) 全文: 内政部
查尔斯·费弗曼;贝纳特·吉伦(Bernat Guillén),佩古尔(Pegueroles);克拉伦斯·W·罗利。;梅兰妮·韦伯 动态学习的最优控制:一个玩具问题。 (英语) Zbl 1485.93628号 马特·伊贝罗姆(Mat.Iberoam)版本。 38,第1期,175-187(2022).MSC公司:93E20型 PDF格式BibTeX公司 XML格式引用 \textit{C.Fefferman}等人,《马特·伊贝隆评论》。38,第1号,175--187(2022;Zbl 1485.93628) 全文: 内政部 arXiv公司
徐一鸣;瓦希德·凯沙瓦尔扎德;罗伯特·M·柯比。;阿基尔·纳拉扬 多重性近似的强盗式学习方法。 (英语) Zbl 1478.62007号 SIAM J.科学。计算。 44,编号1,A150-A175(2022).MSC公司:62-08 62J05型 62兰特 65N30型 65二氧化碳 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Xu}等人,SIAM J.Sci。计算。44,编号1,A150-A175(2022;兹bl 1478.62007) 全文: 内政部 arXiv公司
玛丽亚姆·卡里米·马马汗;默罕默德·穆罕默德;帕特里克·梅耶;卡里米·马马汗(Karimi-Mamaghan)、阿米尔·穆罕默德(Amir Mohammad);加扎利Talbi 为解决组合优化问题的元神经服务的机器学习:最新技术。 (英语) Zbl 1490.90250号 欧洲药典。物件。 296,第2号,393-422(2022).MSC公司:90C27型 68T05型 90 C59 PDF格式BibTeX公司 XML格式引用 \textit{M.Karimi Mamaghan}等人,《欧洲药典》。第296号决议,第2号,393--422(2022年;Zbl 1490.90250) 全文: 内政部
拉夫特·杜古特;穆罕默德·埃敏·艾丁;易卜拉欣·阿提利 具有强化学习的自适应操作员选择。 (英语) Zbl 07791407号 信息科学。 581, 773-790 (2021).MSC公司:68T05型 68T09号 65日元15 62H30型 68问题32 PDF格式BibTeX公司 XML格式引用 \textit{R.Durgut}等人,《信息科学》。581773--790(2021;Zbl 07791407) 全文: 内政部
王亚萍;彭志成;张日泉;肖倩 存在离群值的分段静态多臂盗贼问题的稳健序列设计。 (英语) Zbl 07660261号 统计理论相关。领域 5,第2期,122-133(2021).MSC公司:62至XX PDF格式BibTeX公司 XML格式引用 \textit{Y.Wang}等人,《统计理论关系》。字段5,编号2,122--133(2021;Zbl 07660261) 全文: 内政部
卡洛·德埃拉莫;安德烈亚·西尼;亚历山德罗·努拉;马蒂奥·皮罗塔;塞萨尔·阿利皮;简·彼得斯;马塞洛·雷斯特利 Q学习中用于减少偏差的高斯近似。 (英语) Zbl 07626792号 J.马赫。学习。物件。 22,论文编号277,51 p.(2021).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{C.D’Eramo}等人,J.Mach。学习。第22号决议,论文编号277,51页(2021;Zbl 07626792) 全文: 链接
艾萨克·斯莱奇。;何塞·C·普林西佩。 交易效用与不确定性:应用信息的价值来解决强化学习中的探索-开发困境。 (英语) Zbl 07608719号 Vamvoudakis,Kyriakos G.(编辑)等人,《强化学习和控制手册》。查姆:斯普林格。研究系统。Decis公司。控制32557-610(2021)。MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{I.J.Sledge}和\textit{J.C.Príncipe},研究系统。Decis公司。控制32557--610(2021;Zbl 07608719) 全文: 内政部
张学如;刘明艳 基于学习的序列决策算法的公平性:一项调查。 (英语) Zbl 07608718号 Vamvoudakis,Kyriakos G.(编辑)等人,《强化学习和控制手册》。查姆:斯普林格。研究系统。Decis公司。控制325525-555(2021)。MSC公司:68T05型 68T20型 PDF格式BibTeX公司 XML格式引用 \textit{X.Zhang}和\textit{M.Liu},研究系统。Decis公司。控制325、525--555(2021;Zbl 07608718) 全文: 内政部 arXiv公司
张凯庆;杨卓然;巴沙尔,塔梅尔 多智能体强化学习:理论和算法的选择性概述。 (英语) Zbl 07608712号 Vamvoudakis,Kyriakos G.(编辑)等人,《强化学习和控制手册》。查姆:斯普林格。研究系统。Decis公司。控制325321-384(2021)。MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{K.Zhang}等人,研究系统。Decis公司。控制325、321--384(2021;Zbl 07608712) 全文: 内政部 arXiv公司
崔国培;黎子良;童欣T。;Wong,翁记 在自然激励优化和剂量测定试验的优化顺序设计中自适应参数调整的统计方法。 (英语) Zbl 1524.62524号 统计正弦。 31,规格Iss。,2381-2401 (2021).MSC公司:62页第10页 62K05美元 62升05 92 C50 PDF格式BibTeX公司 XML格式引用 \textit{K.P.Choi}等人,Stat.Sin。312381-2401(2021年;Zbl 1524.62524) 全文: 内政部
迈克尔·斯科拉;施美川;菲利普·拉沃里 Bandit理论:在学习医疗系统和临床试验中的应用。 (英语) Zbl 1524.62546号 统计正弦。 31,规范发行。,2289-2307 (2021).MSC公司:62页第10页 62升05 PDF格式BibTeX公司 XML格式引用 \textit{M.Sklar}等人,Stat.Sin。312289-2307(2021年;Zbl 1524.62546) 全文: 内政部
Kim、Dong Woo;黎子良;徐焕忠 具有协变量的多武器强盗:理论和应用。 (英语) Zbl 1524.62374号 统计正弦。 31,规范发行。,2275-2287 (2021).MSC公司:62升05 PDF格式BibTeX公司 XML格式引用 \textit{D.W.Kim}等人,Stat.Sin。2275年31日至2287年(2021年;兹比尔1524.62374) 全文: 内政部
李、柯;杨云;纳维森·纳里塞蒂。 高维上下文线性土匪的回归下界和最优算法。 (英语) Zbl 1493.62477号 电子。J.统计。 15,编号2,5652-5695(2021).MSC公司:62升05 PDF格式BibTeX公司 XML格式引用 \textit{K.Li}等人,《电子》。J.Stat.15,No.2,5652--5695(2021;Zbl 1493.62477) 全文: 内政部 arXiv公司 链接
纳贾科恩Khajonchotpanya;薛依林;纳巴特·鲁吉拉帕布恩 基于CVaR准则的风险规避型多武器强盗改进方法。 (英语) Zbl 1525.91070号 操作。Res.Lett公司。 49,第4期,465-472(2021).MSC公司:91磅06 90立方厘米 91G70型 PDF格式BibTeX公司 XML格式引用 \textit{N.Khajonchotpanya}等人,作品。Res.Lett公司。49,第4号,465--472(2021;Zbl 1525.91070) 全文: 内政部
鲁强;周,朔;陶、范;罗,杰克;王志光 增强基于空间分割和跳跃的符号回归基因表达式编程。 (英语) Zbl 1479.92005年 信息科学。 547, 553-567 (2021).MSC公司:92D10型 68T20型 PDF格式BibTeX公司 XML格式引用 \textit{Q.Lu}等人,《信息科学》。547553-567(2021年;Zbl 1479.92005年) 全文: 内政部
菲利普·巴特克;苏达,马丁 神经优先推荐器。 (英语) Zbl 07437098号 AndréPlatzer等人,《自动扣除——CADE 28》。第28届自动扣款国际会议,虚拟活动,2021年7月12-15日。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。12699, 525-542 (2021).MSC公司:03B35型 68伏15 PDF格式BibTeX公司 XML格式引用 \textit{F.Bártek}和\textit{M.Suda},莱克特。注释计算。科学。12699、525--542(2021;Zbl 07437098) 全文: 内政部
Chang,Hyeong Soo先生 一种基于索引的约束多臂盗贼问题确定性收敛优化算法。 (英语) Zbl 07429790号 Automatica公司 129,文章ID 109673,5 p.(2021).MSC公司:68泰克 49倍X PDF格式BibTeX公司 XML格式引用 \textit{H.S.Chang},Automatica 129,文章ID 109673,5 p.(2021;Zbl 07429790) 全文: 内政部 arXiv公司
阿夫拉米迪斯,Athanassios N。;阿诺德五世(Arnoud V.den Boer)。 有限价格集的动态定价:非参数方法。 (英语) Zbl 1475.91099号 数学。方法操作。物件。 94,第1期,1-34页(2021年). 审核人:Christos E.Kountzakis(卡尔洛瓦西) MSC公司:91B24型 90B05型 90立方厘米 90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{A.N.Avramidis}和\textit{A.V.denBoer},数学。方法操作。第94号决议,第1号,1-34(2021年;Zbl 1475.91099) 全文: 内政部
加内什·加尔梅;达马尔、斯瓦普尼尔;什韦塔·贾恩;苏吉特·古杰尔;Y.纳拉哈里。 用气球轰击多武器匪徒。 (英语) Zbl 1519.68217号 Artif公司。智力。 296,文章ID 103485,22 p.(2021).MSC公司:68T05型 62升10 62升15 PDF格式BibTeX公司 XML格式引用 \textit{G.Ghalme}等人,Artif。智力。296,文章ID 103485,22 p.(2021;Zbl 1519.68217) 全文: 内政部 arXiv公司
维沙卡·帕蒂尔;加内什·加尔梅;奈尔,维尼特;Y.纳拉哈里。 实现随机多武器盗贼问题中的公平性。 (英语) Zbl 07415117号 J.马赫。学习。物件。 22,第174号论文,31页(2021年).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{V.Patil}等人,J.Mach。学习。第22号决议,第174号文件,第31页(2021年;兹bl 0745117) 全文: arXiv公司 链接
康斯坦蒂诺斯·查齐利格鲁迪斯;安托万·卡利;瓦西里亚德斯,瓦西里斯;让-巴蒂斯特·莫雷特 质量差异优化:随机优化的一个新分支。 (英语) Zbl 07404585号 Pardalos,Panos M.(编辑)等人,黑箱优化,机器学习和无自由午餐定理。查姆:斯普林格。Springer Optim公司。申请。170, 109-135 (2021).MSC公司:68T05型 90 C59 PDF格式BibTeX公司 XML格式引用 \textit{K.Chatzilygeroudis}等人,Springer Optim。申请。170、109--135(2021;Zbl 07404585) 全文: 内政部 arXiv公司 链接
雅各布·蒙蒂尔;马克斯·哈尔福德;索洛·马蒂列·马斯特利尼;杰弗里·博尔米尔;萨蒂,拉斐尔;罗宾·韦瑟;阿迪尔·祖伊廷;戈麦斯,海托·穆里洛;读,杰西;塔莱尔·阿卜杜塞勒姆;阿尔伯特·比费特 River:Python中流数据的机器学习。 (英语) Zbl 07370627号 J.马赫。学习。物件。 22,第110号论文,第8页(2021年).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{J.Montiel}等人,J.Mach。学习。第22号决议,第110号论文,第8页(2021;Zbl 07370627) 全文: arXiv公司 链接
朱利安·齐默特;叶夫根尼·塞尔丁 Tsallis-INF:针对随机和对抗性盗贼的优化算法。 (英语) Zbl 07370545号 J.马赫。学习。物件。 22,第28号论文,49页(2021年).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{J.Zimmert}和\textit{Y.Seldin},J.Mach。学习。第22号决议,第28号论文,49页(2021;Zbl 07370545) 全文: arXiv公司 链接
玛丽亚姆·阿齐兹;艾米莉·考夫曼;玛丽·卡雷尔·里维埃尔 关于剂量测定试验的多武器强盗设计。 (英语) Zbl 07370531号 J.马赫。学习。物件。 22,第14号论文,38页(2021年).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{M.Aziz}等人,J.Mach。学习。第22号决议,第14号论文,38页(2021;Zbl 07370531) 全文: arXiv公司 链接
维克托·本斯;鲁伯特·巴斯·费科特;El Mesaoudi Paul,阿迪尔;埃克·Hüllermier 与决斗强盗进行基于偏好的在线学习:一项调查。 (英语) Zbl 07370524号 J.马赫。学习。物件。 22,第7号文件,第108页(2021).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{V.Bengs}等人,J.Mach。学习。第22号决议,第7号论文,108页(2021;Zbl 07370524) 全文: arXiv公司 链接
斯特凡诺·特雷卡;辛西娅·鲁丁;严、魏玉 随着时间的推移,在多武装匪徒中控制贪婪。 (英语) Zbl 07370520号 J.马赫。学习。物件。 22,第3号论文,99页(2021年).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.Tracá}等人,J.Mach。学习。第22号决议,第3号论文,99页(2021;Zbl 07370520) 全文: arXiv公司 链接
拉梅什·乔哈里;维杰·坎布尔;亚什·卡诺里亚 学习时匹配。 (英语) Zbl 1470.90103号 操作。物件。 69,第2号,655-681(2021).MSC公司:90C27型 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{R.Johari}等人,Oper。决议69,第2号,655--681(2021;Zbl 1470.90103) 全文: 内政部 arXiv公司
苏巴什尼·克里希纳萨米;拉贾特·森;拉梅什·乔哈里;桑杰·沙科塔伊 学习队列中的未知服务率:一种多武器强盗方法。 (英语) Zbl 1466.90027号 操作。物件。 69,编号1,315-330(2021).MSC公司:90B22型 90B35型 PDF格式BibTeX公司 XML格式引用 \textit{S.Krishnasamy}等人,作品。第69号决议,第1号,315-330(2021;Zbl 1466.90027) 全文: 内政部 arXiv公司
丹尼尔·拉索 技术注释–关于患者代理的置信上限和Gittins指数等效性的注释。 (英语) Zbl 1482.91072号 操作。物件。 69,编号1,273-278(2021).MSC公司:91磅06 62C10个 PDF格式BibTeX公司 XML格式引用 \textit{D.Russo},操作人员。第69号决议,第1号,273--278(2021年;Zbl 1482.91072) 全文: 内政部 arXiv公司
徐建宇;陈路杰;欧唐 一种针对有风险意识的不安盗贼的在线算法。 (英语) 兹比尔1487.90634 欧洲药典。物件。 290,编号2,622-639(2021).MSC公司:90立方厘米 91G70型 PDF格式BibTeX公司 XML格式引用 \textit{J.Xu}等人,《欧洲药典》。第290号决议,第2号,第622--639号(2021年;Zbl 1487.90634) 全文: 内政部
李晓鸥;陈云晓;陈曦;刘京晨;Ying,志良 众包中的最优停止和工人选择:一个自适应序列概率比测试框架。 (英语) Zbl 1465.62176号 统计正弦。 31,第1号,519-546(2021).MSC公司:62第20页 62升10 62升15 62C10个 60克40 PDF格式BibTeX公司 XML格式引用 \textit{X.Li}等人,Stat.Sin。31,编号1,519--546(2021;Zbl 1465.62176) 全文: arXiv公司
彼得·兰德格伦;瓦布哈夫·斯利瓦斯塔瓦;内奥米·埃里奇·伦纳德 多智能体多武装盗贼的分布式协同决策。 (英语) Zbl 1460.91070号 Automatica公司 125,文章ID 109445,13 p.(2021).MSC公司:91磅06 93甲16 93D50型 PDF格式BibTeX公司 XML格式引用 \textit{P.Landgren}等人,Automatica 125,文章ID 109445,13 P.(2021;Zbl 1460.91070) 全文: 内政部 arXiv公司
贾森·罗格纳思;雷扎·雷法伊·阿夫沙尔;阿尔卑斯山阿克凯;张应倩;乌扎伊·凯马克;法提赫·乔拉克;Muratcan Tanyerli 通过标头招标和广告交换拍卖为出版商实现收入最大化。 (英语) Zbl 1525.91097号 操作。Res.Lett公司。 49,编号2,250-256(2021).MSC公司:91B26型 90B60毫米 PDF格式BibTeX公司 XML格式引用 \textit{J.Rhuggenaath}等人,作品。Res.Lett公司。49,编号2,250--256(2021;Zbl 1525.91097) 全文: 内政部
艾,明瑶;黄益民;于军 具有协变量的多臂盗贼问题的非参数解。 (英语) 兹比尔1455.62067 J.统计计划。推断 211, 402-413 (2021).MSC公司:62升05 62G05型 62甲12 PDF格式BibTeX公司 XML格式引用 \textit{M.Ai}等人,J.Stat.Plann。推论211,402--413(2021;Zbl 1455.62067) 全文: 内政部
保罗·迪·吉安贝拉迪诺;达尼埃拉·亚科维埃洛 一种依赖于状态的资源分配策略方法。 (英语) Zbl 1504.91124号 Gusikhin,Oleg(编辑)等人,《控制、自动化和机器人信息学》。2017年7月26日至28日在西班牙马德里举行的2017年ICINCO第14届国际会议修订了部分论文。查姆:斯普林格。莱克特。注释Electr。工程495,314-336(2020)。MSC公司:91B32型 49J20型 92天30分 PDF格式BibTeX公司 XML格式引用 \textit{P.Di Giamberardino}和\textit{D.Iacoviello},莱克特。注释Electr。工程495,314--336(2020;Zbl 1504.91124) 全文: 内政部
达米安·巴斯托·加斯顿;查克拉波蒂,德布拉吉;Jean-François拉斯金 MDP符号建议引导的蒙特卡罗树搜索。 (英语) Zbl 07559496号 Konnov,Igor(编辑)等人,第31届并发理论国际会议。CONCUR 2020,2020年9月1日至4日,奥地利维也纳,虚拟会议。诉讼程序。Wadern:达格斯图尔宫——莱布尼茨Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。171,第40条,第24页(2020年)。MSC公司:68问题85 PDF格式BibTeX公司 XML格式引用 \textit{D.Busatto-Gaston}等人,LIPIcs——莱布尼茨国际程序。通知。171,第40条,第24页(2020;Zbl 07559496) 全文: 内政部 arXiv公司
韦斯利·考恩;Michael N.Katehakis。 勘探开发政策几乎可以肯定,但增长缓慢的渐进遗憾随之而来。 (英语) Zbl 1484.62039号 普罗巴伯。工程信息科学。 34,第3期,406-428(2020年).MSC公司:62G05型 6220国集团 62升10 PDF格式BibTeX公司 XML格式引用 \textit{W.Cowan}和\textit{M.N.Katehakis},Probab。工程信息科学。34,第3号,406--428(2020;Zbl 1484.62039) 全文: 内政部 arXiv公司
费德里科·卡梅伦吉;比安卡·杜米特拉斯库;费德里科·法拉利;巴巴拉·恩格哈特(Barbara E.Engelhardt)。;斯特凡诺·法瓦罗 用于单细胞实验设计的非参数贝叶斯多武器强盗。 (英语) Zbl 1498.62195号 附录申请。斯达。 2003-2019年第4期第14条(2020年).MSC公司:62页第10页 62G05型 60G57型 2015年1月62日 PDF格式BibTeX公司 XML格式引用 \textit{F.Camerlenghi}等人,Ann.Appl。Stat.14,No.4,2003-2019(2020;Zbl 1498.62195) 全文: 内政部 arXiv公司
霍沃杰Stojić;雅各布·L·奥金。;彼得·大雁;雷蒙德·多兰(Raymond J.Dolan)。;马滕·斯佩肯布里克 学习、选择和视觉定势的不确定性。 (英语) Zbl 1456.91041号 程序。国家。阿卡德。科学。美国 117,第6号,3291-3300(2020).MSC公司:91磅06 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{H.Stojić}等人,Proc。国家。阿卡德。科学。美国117,No.6,3291--3300(2020;Zbl 1456.91041) 全文: 内政部
王浩然;萨利亚·扎里普普鲁;周迅余 连续时间和空间中的强化学习:一种随机控制方法。 (英语) Zbl 07307478号 J.马赫。学习。物件。 21,第198号文件,第34页(2020).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{H.Wang}等人,J.Mach。学习。第21号决议,第198号论文,第34页(2020年;Zbl 07307478) 全文: 链接
维沙尔·阿胡贾;约翰·R·伯奇。 反应适应性临床试验设计的近似方法。 (英语) Zbl 07303812号 信息J.计算。 32,第4期,877-894(2020年).MSC公司:90立方厘米 PDF格式BibTeX公司 XML格式引用 \textit{V.Ahuja}和\textit{J.R.Birge},《信息与计算》。32,第4号,877--894(2020;Zbl 07303812) 全文: 内政部
Daniel R.江。;利纳·阿尔·坎吉;沃伦·鲍威尔。 具有采样信息松弛对偶边界的乐观蒙特卡罗树搜索。 (英语) Zbl 1457.90168号 操作。物件。 68,第6期,1678-1697(2020).MSC公司:90立方厘米 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{D.R.Jiang}等人,Oper。第68号决议,第6号,1678--1697(2020;Zbl 1457.90168) 全文: 内政部 arXiv公司
萨贾德·莫达雷西;丹尼斯·索雷;胡安·巴勃罗·维尔玛 学习组合优化:探索什么以及如何探索。 (英语) Zbl 1457.90132号 操作。物件。 68,第5期,1585-1604(2020).MSC公司:90C27型 90立方厘米 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{S.Modaresi}等人,Oper。第68号决议,第5号,1585--1604(2020年;Zbl 1457.90132) 全文: 内政部
韩伟东;鲍威尔,沃伦·B。 基于离散先验的非线性信念模型的最优在线学习。 (英语) Zbl 1457.90167号 操作。物件。 68,第5期,1538-1556(2020).MSC公司:90立方厘米 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{W.Han}和\textit{W.B.鲍威尔},Oper。第68号决议,第5号,1538--1556(2020年;Zbl 1457.90167) 全文: 内政部
约纳坦·明茨;阿尼尔·阿斯瓦尼;菲利普·卡明斯基;弗劳尔斯,埃琳娜;福冈,吉米 具有习惯化和恢复动态的非固定土匪。 (英语) Zbl 1455.90095 操作。物件。 68,第5期,1493-1516(2020).MSC公司:90B50型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Mintz}等人,作品。第68号决议,第5号,1493-1516(2020年;Zbl 1455.90095) 全文: 内政部 arXiv公司
维拉格·沙阿;Lennart Gulikers公司;Laurent Massoulié;Vojnović,米兰 不确定任务类型专家系统的自适应匹配。 (英语) Zbl 1455.90052号 操作。物件。 68,第5期,1403-1424(2020).MSC公司:90B22型 PDF格式BibTeX公司 XML格式引用 \textit{V.Shah}等人,作品。第68号决议,第5号,1403-1424(2020年;Zbl 1455.90052) 全文: 内政部 arXiv公司
Michael N.Katehakis。;杨健;周婷婷 动态库存和价格控制涉及离散非易腐物品的未知需求。 (英语) Zbl 1455.90010号 操作。物件。 68,第5期,1335-1355(2020).MSC公司:90B05型 91B24型 PDF格式BibTeX公司 XML格式引用 \textit{M.N.Katehakis}等人,Oper。第68号决议,第5号,1335--1355(2020年;Zbl 1455.90010) 全文: 内政部
伊莎·曼苏尔;阿列克桑德斯·斯利夫金斯;Syrgkanis、Vasilis 贝叶斯激励相容土匪探索。 (英语) Zbl 1451.90079号 操作。物件。 68,第4期,1132-1161(2020).MSC公司:90B50型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Mansour}等人,Oper。第68号决议,第4号,1132--1161(2020年;Zbl 1451.90079) 全文: 内政部 arXiv公司
韩,凯;何云天;Liu,Alex X。;唐少杰;黄,何 不同的私人和预算限制的土匪学习拟阵。 (英语) Zbl 1474.68253号 信息J.计算。 32,编号3,790-804(2020).MSC公司:68T05型 05B35号 62升10 62升15 68第27页 90C27型 PDF格式BibTeX公司 XML格式引用 \textit{K.Han}等人,《信息与计算》。32,第3号,790--804(2020;Zbl 1474.68253) 全文: 内政部
阿夫拉米迪斯,Athanassios N。 具有未知到达率和价格敏感性的定价问题。 (英语) Zbl 1457.91182号 数学。方法操作。物件。 92,第1期,77-106(2020年).MSC公司:91B24型 90B05型 62G05型 PDF格式BibTeX公司 XML格式引用 \textit{A.N.Avramidis},数学。方法操作。第92号决议,第1号,77--106(2020年;Zbl 1457.91182) 全文: 内政部
李莹莹;胡钦然;李娜 一种可靠性感知的多武器盗贼方法,用于在需求响应中学习和选择用户。 (英语) Zbl 1451.91103号 Automatica公司 119,文章ID 109015,第9页(2020).MSC公司:91B42型 91A60 PDF格式BibTeX公司 XML格式引用 \textit{Y.Li}等人,Automatica 119,文章ID 109015,9 p.(2020;Zbl 1451.91103) 全文: 内政部 arXiv公司
萨基·阿里亚;杨玉红 具有延迟奖励的上下文多武装匪徒的非参数估计随机分配。 (英语) Zbl 1456.62064号 统计概率。莱特。 164,文章ID 108818,8 p.(2020).MSC公司:62G08号 62升05 62升12 PDF格式BibTeX公司 XML格式引用 \textit{S.Arya}和\textit{Y.Yang},Stat.Probab。莱特。164,文章ID 108818,8 p.(2020;Zbl 1456.62064) 全文: 内政部 arXiv公司
安东尼奥·坎德列里;里卡多·佩雷戈;伊利亚州佐丹尼;弗朗西斯科·阿切蒂 人类在优化黑盒函数中是贝叶斯的吗? (英语) Zbl 07250741号 谢尔盖耶夫、雅罗斯拉夫D.(编辑)等人,《数值计算:理论和算法》。第三届国际会议,2019年6月15日至21日,意大利克罗托内,NUMTA 2019。修订了选定的论文。第二部分。查姆:斯普林格。莱克特。注释计算。科学。11974, 32-42 (2020).MSC公司:65-XX岁 PDF格式BibTeX公司 XML格式引用 \textit{A.Candelieri}等人,Lect。注释计算。科学。11974,32-42(2020;Zbl 07250741) 全文: 内政部
何新余;克里斯托弗·G·雷耶斯。;沃伦·鲍威尔。 连续设计中局部非线性参数模型的最优学习。 (英语) Zbl 1445.62207号 SIAM J.科学。计算。 42,第4号,A2134-A2157(2020).MSC公司:62升05 62F07型 2015年1月62日 65日第15天 第62页,第35页 68T05型 62兰特 PDF格式BibTeX公司 XML格式引用 \textit{X.He}等人,SIAM J.Sci。计算。42,第4号,A2134--A2157(2020;Zbl 1445.62207) 全文: 内政部