文件Zbl 1502.90097-zbMATH Open

通过内部卷进行上下文搜索。（英语） Zbl 1502.90097号

SIAM J.计算。 51，第4期，1096-1125（2022）.

摘要：我们研究上下文搜索问题，这是二元搜索的多维泛化，它捕获了上下文决策中的许多问题。在上下文搜索中，学习者试图学习隐藏向量\（v\In[0,1]^d\）的值。每一轮都为学习者提供一个对抗性选择的上下文\（u_t\in\mathbb｛R｝^d\），对\（\langle u_t，v\langle\）的值进行猜测\（p_t\），学习\（p_t<\langle u_t，v\langle\）是否存在，并导致损失\（\langle u_t，v\langle，p_t）\）（对于某些损失函数\（\lell）\）。学员的目标是将其在T轮课程中的总损失降至最低。我们给出了对称损失函数（ell（theta，p）=|theta-p|\）的上下文搜索问题的一个算法，该函数实现了（O_d（1））总损失。我们为动态定价问题（可以作为上下文搜索问题的特例来实现）提出了一种新的算法，该算法实现了（O_d（\log\log T））总损失，改进了以前已知的上界（O_d），并匹配了已知的下界（可达对（d）的多项式依赖）。这两种算法都充分利用了积分几何领域的思想，尤其是凸集的内禀体积的概念。据我们所知，这是内在体积在算法设计中的首次应用。

理学硕士：

90B50型	管理决策，包括多个目标
68问题32	计算学习理论
91B24型	微观经济理论（价格理论和经济市场）

关键词：

在线学习;定价算法;凸几何;积分几何

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	A.Agarwal、D.J.Hsu、S.Kale、J.Langford、L.Li和R.E.Schapire，《驯服怪物：一种快速简单的上下文盗贼算法》，载于《第31届机器学习国际会议论文集》，2014年，中国北京，第1638-1646页。
[2]	D.Amelunxen、M.Lotz、M.B.McCoy和J.A.Tropp，《生活在边缘：随机数据凸规划中的相变》，《Inf.Inference》，3（2014），第224-294页·Zbl 1339.90251号
[3]	K.Amin、A.Rostamizadeh和U.Syed，与战略买家重复拍卖的学习价格，神经信息处理系统的进展，26（2013），第1169-1177页。
[4]	K.Amin、A.Rostamizadeh和U.Syed，《与战略买家的重复上下文拍卖》，载于《神经信息处理系统的进展27：2014年神经信息处理体系年度会议》，加拿大魁北克省蒙特利尔，2014年，第622-630页。
[5]	M.Babaioff、S.Dughmi、R.Kleinberg和A.Slivkins，限量供应的动态定价，ACM Trans。经济。计算。，3 (2015), 42015.
[6]	A.Badanidiyuru、R.Kleinberg和A.Slivkins，《背包匪徒》，摘自2013年IEEE第54届计算机科学基础年度研讨会论文集，IEEE，2013年，第207-216页·Zbl 1425.68340号
[7]	A.Badanidiyuru、J.Langford和A.Slivkins，《资源丰富的背景盗贼》，第27届学习理论会议论文集，PMLR，2014年，第1109-1134页。
[8]	G.-Y.Ban和N.B.Keskin，《带机器学习的个性化动态定价：高维特征和异质弹性》，Manag。科学。，67（2021年），第5549-5568页。
[9]	I.Baíraíny和Z.Fuíredi，计算体积很困难，离散计算。地理。，2（1987年），第319-326页·Zbl 0628.68041号
[10]	H.Bastani和M.Bayati，高维协变量在线决策，Oper。研究，68（2020），第276-294页·Zbl 1445.90042号
[11]	O.Besbes和A.Zeevi，《不知道需求函数的动态定价：风险边界和近最优算法》，Oper。Res.，57（2009），第1407-1420页·Zbl 1233.90011号
[12]	M.C.Cohen、I.Lobel和R.P.Leme，《基于特征的动态定价》，载于《第17届ACM经济与计算会议论文集》，EC’16，荷兰马斯特里赫特，2016，817。
[13]	A.Drutsa，与真实和战略买家重复拍卖中的地平线依赖最优定价，《第26届万维网国际会议论文集》，2017年，第33-42页。
[14]	M.Dyer、A.Frieze和R.Kannan，用于逼近凸体体积的随机多项式时间算法，J.Assoc.Comput。机器。，38（1991），第1-17页·Zbl 0799.68107号
[15]	S.Gillen、C.Jung、M.Kearns和A.Roth，《使用未知公平性指标的在线学习》，预印本，https://arxiv.org/abs/1802.06936, 2018.
[16]	A.Javanmard，《数据的易逝性：变系数模型下的动态定价》，J.Mach。学习。研究，18（2017），第1714-1744页·Zbl 1440.62386号
[17]	A.Javanmard和H.Nazerzadeh，高维动态定价，J.马赫。学习。决议，20（2019），9·Zbl 1484.91202号
[18]	R.Karp、E.Koutsoupias、C.Papadimitriou和S.Shenker，拥塞控制中的优化问题，第41届计算机科学基础年度研讨会论文集，IEEE，2000年，第66-74页。
[19]	D.A.Klain和G.-C.Rota，《几何概率导论》，剑桥大学出版社，1997年·Zbl 0896.60004号
[20]	R.Kleinberg和T.Leighton，《了解需求曲线的价值：网上标价拍卖的遗憾界限》，第44届IEEE计算机科学基础研讨会论文集，IEEE，2003年，第594-605页。
[21]	I.Lobel、R.P.Leme和A.Vladu，《上下文决策的多维二进制搜索》，Oper。第66号决议（2018年），第1346-1361页·Zbl 1443.90221号
[22]	P.McMullen，内禀体积之间的不等式，莫纳什。数学。，111（1991），第47-53页·Zbl 0722.52003号
[23]	S.Qiang和M.Bayati，带需求协变量的动态定价，2016年，http://doi.org/10.2139/ssrn.2765257。
[24]	S.H.Schanuel，土豆的长度是多少？，几何测量理论导论，数学课堂讲稿。1174年，柏林施普林格出版社，1986年，第118-126页·Zbl 0621.51023号
[25]	V.Shah、R.Johari和J.Blanchet，《半参数动态上下文定价》，载《第33届神经信息处理系统国际会议论文集》，2019年，第2363-2373页。
[26]	Z.Wang、S.Deng和Y.Ye，《缩小差距：针对单一产品收入管理问题的学习-实践算法》，Oper。研究，62（2014），第318-331页·Zbl 1302.91100号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

通过内部卷进行上下文搜索。（英语） Zbl 1502.90097号

理学硕士：

关键词：

参考文献：

示例

领域

操作员

通过内部卷进行上下文搜索。 （英语） Zbl 1502.90097号

理学硕士：

关键词：

参考文献：

通过内部卷进行上下文搜索。（英语） Zbl 1502.90097号