×

通过内部卷进行上下文搜索。 (英语) Zbl 1502.90097号

摘要:我们研究上下文搜索问题,这是二元搜索的多维泛化,它捕获了上下文决策中的许多问题。在上下文搜索中,学习者试图学习隐藏向量\(v\In[0,1]^d\)的值。每一轮都为学习者提供一个对抗性选择的上下文\(u_t\in\mathbb{R}^d\),对\(\langle u_t,v\langle\)的值进行猜测\(p_t\),学习\(p_t<\langle u_t,v\langle\)是否存在,并导致损失\(\langle u_t,v\langle,p_t)\)(对于某些损失函数\(\lell)\)。学员的目标是将其在T轮课程中的总损失降至最低。我们给出了对称损失函数(ell(theta,p)=|theta-p|\)的上下文搜索问题的一个算法,该函数实现了(O_d(1))总损失。我们为动态定价问题(可以作为上下文搜索问题的特例来实现)提出了一种新的算法,该算法实现了(O_d(\log\log T))总损失,改进了以前已知的上界(O_d),并匹配了已知的下界(可达对(d)的多项式依赖)。这两种算法都充分利用了积分几何领域的思想,尤其是凸集的内禀体积的概念。据我们所知,这是内在体积在算法设计中的首次应用。

理学硕士:

90B50型 管理决策,包括多个目标
68问题32 计算学习理论
91B24型 微观经济理论(价格理论和经济市场)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.Agarwal、D.J.Hsu、S.Kale、J.Langford、L.Li和R.E.Schapire,《驯服怪物:一种快速简单的上下文盗贼算法》,载于《第31届机器学习国际会议论文集》,2014年,中国北京,第1638-1646页。
[2] D.Amelunxen、M.Lotz、M.B.McCoy和J.A.Tropp,《生活在边缘:随机数据凸规划中的相变》,《Inf.Inference》,3(2014),第224-294页·Zbl 1339.90251号
[3] K.Amin、A.Rostamizadeh和U.Syed,与战略买家重复拍卖的学习价格,神经信息处理系统的进展,26(2013),第1169-1177页。
[4] K.Amin、A.Rostamizadeh和U.Syed,《与战略买家的重复上下文拍卖》,载于《神经信息处理系统的进展27:2014年神经信息处理体系年度会议》,加拿大魁北克省蒙特利尔,2014年,第622-630页。
[5] M.Babaioff、S.Dughmi、R.Kleinberg和A.Slivkins,限量供应的动态定价,ACM Trans。经济。计算。,3 (2015), 42015.
[6] A.Badanidiyuru、R.Kleinberg和A.Slivkins,《背包匪徒》,摘自2013年IEEE第54届计算机科学基础年度研讨会论文集,IEEE,2013年,第207-216页·Zbl 1425.68340号
[7] A.Badanidiyuru、J.Langford和A.Slivkins,《资源丰富的背景盗贼》,第27届学习理论会议论文集,PMLR,2014年,第1109-1134页。
[8] G.-Y.Ban和N.B.Keskin,《带机器学习的个性化动态定价:高维特征和异质弹性》,Manag。科学。,67(2021年),第5549-5568页。
[9] I.Baíraíny和Z.Fuíredi,计算体积很困难,离散计算。地理。,2(1987年),第319-326页·Zbl 0628.68041号
[10] H.Bastani和M.Bayati,高维协变量在线决策,Oper。研究,68(2020),第276-294页·Zbl 1445.90042号
[11] O.Besbes和A.Zeevi,《不知道需求函数的动态定价:风险边界和近最优算法》,Oper。Res.,57(2009),第1407-1420页·Zbl 1233.90011号
[12] M.C.Cohen、I.Lobel和R.P.Leme,《基于特征的动态定价》,载于《第17届ACM经济与计算会议论文集》,EC’16,荷兰马斯特里赫特,2016,817。
[13] A.Drutsa,与真实和战略买家重复拍卖中的地平线依赖最优定价,《第26届万维网国际会议论文集》,2017年,第33-42页。
[14] M.Dyer、A.Frieze和R.Kannan,用于逼近凸体体积的随机多项式时间算法,J.Assoc.Comput。机器。,38(1991),第1-17页·Zbl 0799.68107号
[15] S.Gillen、C.Jung、M.Kearns和A.Roth,《使用未知公平性指标的在线学习》,预印本,https://arxiv.org/abs/1802.06936, 2018.
[16] A.Javanmard,《数据的易逝性:变系数模型下的动态定价》,J.Mach。学习。研究,18(2017),第1714-1744页·Zbl 1440.62386号
[17] A.Javanmard和H.Nazerzadeh,高维动态定价,J.马赫。学习。决议,20(2019),9·Zbl 1484.91202号
[18] R.Karp、E.Koutsoupias、C.Papadimitriou和S.Shenker,拥塞控制中的优化问题,第41届计算机科学基础年度研讨会论文集,IEEE,2000年,第66-74页。
[19] D.A.Klain和G.-C.Rota,《几何概率导论》,剑桥大学出版社,1997年·Zbl 0896.60004号
[20] R.Kleinberg和T.Leighton,《了解需求曲线的价值:网上标价拍卖的遗憾界限》,第44届IEEE计算机科学基础研讨会论文集,IEEE,2003年,第594-605页。
[21] I.Lobel、R.P.Leme和A.Vladu,《上下文决策的多维二进制搜索》,Oper。第66号决议(2018年),第1346-1361页·Zbl 1443.90221号
[22] P.McMullen,内禀体积之间的不等式,莫纳什。数学。,111(1991),第47-53页·Zbl 0722.52003号
[23] S.Qiang和M.Bayati,带需求协变量的动态定价,2016年,http://doi.org/10.2139/ssrn.2765257。
[24] S.H.Schanuel,土豆的长度是多少?,几何测量理论导论,数学课堂讲稿。1174年,柏林施普林格出版社,1986年,第118-126页·Zbl 0621.51023号
[25] V.Shah、R.Johari和J.Blanchet,《半参数动态上下文定价》,载《第33届神经信息处理系统国际会议论文集》,2019年,第2363-2373页。
[26] Z.Wang、S.Deng和Y.Ye,《缩小差距:针对单一产品收入管理问题的学习-实践算法》,Oper。研究,62(2014),第318-331页·Zbl 1302.91100号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。