文件Zbl 07694481-zbMATH Open

尼古拉斯·奥克勒布隆;法泽莱·萨达特·霍塞尼;莫特萨·哈吉尔·谢里加尼（Haghir Chehreghani，Morteza）

通过极小极大路径在线学习网络瓶颈。（英语） Zbl 07694481号

机器。学习。 112，编号1，131-150（2023）.

摘要：在本文中，我们通过提取极小极大路径来研究网络瓶颈识别。许多现实世界的网络具有随机权重，事先无法获得其全部知识。因此，我们将此任务建模为一个组合半强盗问题，并将汤普森抽样的组合版本应用于该问题，并建立相应贝叶斯遗憾的上界。由于该问题的计算复杂性，我们随后设计了一个近似于原始目标的替代问题公式。最后，我们用近似公式在实际有向和无向网络上对汤普森采样的性能进行了实验评估。

引用于2文件

MSC公司：

68T05型

人工智能中的学习和自适应系统

关键词：

在线学习;组合半强盗;汤普森采样;瓶颈识别

软件：

统计网;开放街道地图;帕耶克;Pajek数据集

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

参考文献：

[1]	Agrawal，S.、Goyal，N.（2012）《多武器强盗问题的汤普森抽样分析》。收录：Mannor，S.、Srebro，N.、Williamson，R.C.（编辑）《第25届学习理论年会论文集》。机器学习研究论文集。第23卷，第39-13926页。苏格兰爱丁堡PMLR。
[2]	Okerblom，N.、Chen，Y.、Haghir Chehreghani，M.（2020）电动汽车节能导航的在线学习框架。摘自：第二十届国际人工智能联合会议（IJCAI）会议记录，第2051-2057页。10.24963/ijcai.2020/284
[3]	Auer，P.，《利用置信界限进行开发-勘探权衡》，《机器学习研究杂志》。，3，null，397-422（2003）·Zbl 1084.68543号
[4]	Batagelj，V.，Mrvar，A.（2006）Pajek数据集。http://vlado.fmf.uni-lj.si/pub/networks/data/。访问时间：2021-09-08
[5]	Beebe，N.H.F.（2002）Nelson H.F.Beebe的书目页。http://www.math.utah.edu/beebe/书目.html。访问时间：2021-09-08
[6]	O.伯曼。；Handler，GY，网络上单个服务单元到非服务目的地的最优最小最大路径，运输科学，21，2，115-122（1987）·兹比尔0631.90023 ·doi:10.1287/trsc.21.2.115
[7]	塞萨·比安奇，N。；Lugosi，G.，《组合匪徒》，《计算机与系统科学杂志》，第78、5、1404-1422页（2012年）·Zbl 1262.91052号 ·文件编号：10.1016/j.jcss.2012.01.01.jcss
[8]	沙佩尔，O。；李，L。；肖-泰勒，J。；泽梅尔，R。；Bartlett，P。；佩雷拉，F。；Weinberger，KQ，汤普森抽样的实证评估，神经信息处理系统的进展（2011），伦敦：斯普林格，伦敦
[9]	Chen，W.、Hu，W.，Li，F.、Li，J.、Liu，Y.、Lu，P.（2016）具有一般奖励功能的组合式多武器匪徒。收录：Lee，D，Sugiyama，M，Luxburg，U，Guyon，I，Garnett，R（编辑）《神经信息处理系统进展》。第29页
[10]	Chen，W.，Wang，Y.，Yuan，Y.（2013）组合多武装匪徒：一般框架和应用。摘自：Dasgupta，S.，McAllester，D.（编辑）《第30届机器学习国际会议论文集》。机器学习研究论文集，第28卷，第151-159页。美国佐治亚州亚特兰大
[11]	Clark，CE，《有限随机变量中最大的一组》，运筹学，9，2，145-162（1961）·Zbl 0201.51102号 ·doi:10.1287/opre.9.2145
[12]	DasGupta，A.（2021）三个独立法线最大值的期望值公式和稀疏高维情形。https://www.stat.purdue.edu/dasgupta/orderstat.pdf。访问日期：2021-09-07（n.d.）
[13]	Dijkstra，EW，关于与图有关的两个问题的注记，数字数学，1，1，269-271（1959）·Zbl 0092.16002号 ·doi:10.1007/bf01386390
[14]	Du，Y.、Kuroki，Y.和Chen，W.（2021）带瓶颈回报函数的组合纯粹探索。arXiv公司。1048550/ARXIV.2102.12094
[15]	马里兰州弗雷德曼；Tarjan，RE，Fibonacci堆及其在改进网络优化算法中的应用，《ACM杂志》，34，3，596-615（1987）·兹比尔1412.68048 ·doi:10.1145/28869.28874
[16]	盖，Y。；Krishnamachari，B。；Jain，R.，未知变量的组合网络优化：具有线性奖励和个人观察的多武装匪徒，IEEE/ACM网络汇刊，20，5，1466-1478（2012）·doi:10.1109/TNET.2011.2181864
[17]	Graepel，T.、Candela，J.Q.n.、Borchert，T.和Herbrich，R.（2010）微软必应搜索引擎中赞助搜索广告的网络贝叶斯点击率预测。摘自：第27届国际机器学习会议论文集。ICML’10，第13-20页。美国威斯康星州麦迪逊Omnipress
[18]	Haghir Chehreghani，M.，具有最小最大距离测量的无监督表示学习，机器学习，109，112063-2097（2020）·Zbl 1523.68054号 ·doi:10.1007/s10994-020-05886-4
[19]	Handcock，M.S.、Hunter，D.、Butts，C.T.、M.、G.S.、Morris，M.（2003）Statnet：社交网络统计建模的R包。http://www.csde.washington.edu/statnet。访问时间：2021-09-08
[20]	Hansen，P。；范德尔，G。；Gal，T.，双标准路径问题，多准则决策理论与应用，109-127（1980），柏林：斯普林格出版社，柏林·Zbl 0444.90098号 ·doi:10.1007/978-3-642-48782-8_9
[21]	轩尼诗，DA；Wiesenthal，DL，交通拥堵，驾驶员压力和驾驶员攻击，攻击性行为，25，6，409-423（1999）·doi:10.1002/（SICI）1098-2337（1999）25:6<409:：AID-AB2>3.0.CO；2-0
[22]	Horrace，WC，截断正态分布的矩，生产力分析杂志，43，2，133-138（2015）·doi:10.1007/s11123-013-0381-8
[23]	胡，TC，最大容量路由问题，运筹学，9898-900（1961）·doi:10.1287/opre.9.6.898
[24]	Jones，B.（2002）计算几何数据库。http://jeffe.cs.illinois.edu/compgeom/biblios.html。访问时间：2021-09-08
[25]	Kaufmann，E.，Cappe，O.，Garivier，A.（2012）关于强盗问题的贝叶斯置信上限。摘自：Lawrence，N.D.，Girolma，M.（编辑）《第十五届国际人工智能与统计会议论文集》。机器学习研究论文集，第22卷，第592-600页。加那利群岛拉帕尔马
[26]	Kaufmann，E.、Korda，N.、Munos，R.（2012）《汤普森抽样：渐近最优有限时间分析》。摘自：《算法学习理论——第23届国际会议》，ALT，第199-213页。10.1007/978-3-642-34106-9_18 ·Zbl 1386.91055号
[27]	Kim，K.-H.，Choi，S.（2007）具有全局几何的邻域搜索：极大极小消息传递算法。摘自：第24届机器学习国际会议论文集。ICML'07，第401-408页，美国纽约州纽约市10.1145/1273496.1273547
[28]	Kveton，B.，Wen，Z.，Ashkan，A.，Szepesvari，C.（2015）随机组合半带紧后悔界限。收录：黎巴嫩，G.，Vishwanathan，S.V.N.（编辑）第十八届国际人工智能与统计会议论文集。机器学习研究论文集，第38卷，第535-543页。美国加利福尼亚州圣地亚哥
[29]	赖，TL；Robbins，H.，渐近有效自适应分配规则，应用数学进展，6，1，4-22（1985）·Zbl 0568.62074号 ·doi:10.1016/0196-8858（85）90002-8
[30]	Lo，C.（2020）通过设计空间探索提高硬件设计重用。加拿大多伦多大学博士论文
[31]	Liu，K.，Zhao，Q.（2012）未知和随机变化链路状态下的自适应最短路径路由。2012年第十届移动、自组网和无线网络建模与优化国际研讨会（WiOpt）。第232-237页。
[32]	Nuara，A.、Trovo，F.、Gatti，N.、Restelli，M.（2018）用于在线联合投标/预算优化付费点击广告活动的组合带算法。参加：第三十二届AAAI人工智能会议。10.1609/aaai.v32i1.11888·兹伯利07505973
[33]	OpenStreetMap贡献者（2017）星球转储检索自。www.openstreetmap.org。访问时间：2021-09-08
[34]	Orabona，F.，Pal，D.（2015）《专家建议下学习的最大遗憾的最佳非症状下限》。arXiv公司。1048550/ARXIV.1511.02176
[35]	Pollack，M.，《网络的最大容量》，运筹学（1960）·doi:10.1287/opre.8.5.733
[36]	Prim，RC，最短连接网络和一些推广，贝尔系统技术期刊，36，6，1389-1401（1957）·doi:10.1002/j.1538-7305.1957.tb01515.x
[37]	Riquelme，C.，Tucker，G.，Snoek，J.（2018）深度贝叶斯强盗对决：汤普森抽样的贝叶斯深度网络实证比较。参加：学习代表国际会议。
[38]	Russo博士。；Van Roy，B.，《通过后验抽样学习优化》，运筹学数学研究，39，4，1221-1243（2014）·Zbl 1310.93091号 ·doi:10.1287/门2014.0650
[39]	Russo，DJ；罗伊，英属维尔京群岛；Kazerouni，A。；奥斯本·I。；Wen，Z.，《汤普森抽样教程，机器学习的基础和趋势》。，11, 1, 1-96 (2018) ·Zbl 1409.62024号 ·doi:10.1561/2200000070
[40]	Seshadri，R。；Srinivasan，KK，确定具有正态分布和相关链路旅行时间的网络上最可靠旅行时间路径的算法，交通研究记录，2196，183-92（2010）·doi:10.3141/2196-09
[41]	Shacham，N.（1992年）。分层数据的多播路由。参见：【会议记录】SUPERCOMM/ICC 92《发现通信的新世界》，第1217-12213页。doi:doi:10.1109/ICC.1992.268047
[42]	Slivkins，A.，《多武装匪徒简介，机器学习的基础和趋势》，12，1-2，1-286（2019）·Zbl 1478.68006号 ·doi:10.1561/2200000068
[43]	WR汤普森，《鉴于两个样本的证据，一种未知概率超过另一种概率的可能性》，Biometrika，25，3-4，285-294（1933）·doi:10.2307/2332286
[44]	Wang，S.，Chen，W.（2018）组合半强盗的汤普森抽样。摘自：Dy，J.，Krause，A.（编辑）第35届机器学习国际会议论文集。机器学习研究论文集。第80卷，第5114-5122页。
[45]	Zou，Z.，Proutiere，A.，Johansson，M.（2014）在线最短路径路由：信息的价值。2014年美国控制会议。第2142-2147页。10.1109/ACC.2014.6859133号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
输出	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
”ab c公司”	短语
(ab c公司)	括号

示例

领域

操作员

通过极小极大路径在线学习网络瓶颈。（英语） Zbl 07694481号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

通过极小极大路径在线学习网络瓶颈。 （英语） Zbl 07694481号

MSC公司：

关键词：

软件：

参考文献：

通过极小极大路径在线学习网络瓶颈。（英语） Zbl 07694481号