×

多尺度在线学习:在线拍卖和定价的理论和应用。 (英语) Zbl 1489.68406号

摘要:我们考虑在线拍卖/定价问题中的收入最大化。卖家在每个时期向新买家或新买家群出售相同的商品。对于在线定价问题,无论是当到达的买家出价还是只对公布的价格作出响应时,我们都设计了一种算法,该算法的后悔约束范围是事后看来最好的固定价格,而不是值的范围。在投标模型下,我们进一步证明了我们的算法实现的收入收敛速度与单物品单买家拍卖的离线样本复杂度相匹配。当与要求市场份额下限的基准进行比较时,我们还显示了无标度的遗憾边界,并与离线样本的复杂性相匹配。我们进一步将我们的结果从定价扩展到多买家拍卖,并获得了拍卖的在线学习算法,其收敛率与在线单项多买家拍卖的已知样本复杂度上限相匹配。
这些结果是通过将专家的经典学习和多武器盗贼问题推广到其多尺度版本而得到的。在这个版本中,每个动作的奖励都在不同的范围内,对于给定动作的后悔会根据其范围而不是最大范围来衡量。通过引入一种新的在线镜像下降(OMD)算法,我们获得了几乎最优的多尺度后悔界,该算法的镜像映射是负熵函数的多尺度版本。通过引入该OMD算法的随机变量,我们进一步推广到强盗设置。

MSC公司:

68周27 在线算法;流式算法
68T05型 人工智能中的学习和自适应系统
91B26型 拍卖、议价、投标和销售以及其他市场模式
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] Shipra Agrawal和Nikhil R Devanur。带有凹面奖励和凸面背包的土匪。《第十五届ACM经济与计算会议论文集》,第989-1006页。ACM,2014年。
[2] Kareem Amin、Afshin Rostamizadeh和Umar Syed。与战略买家一起学习重复拍卖的价格。《神经信息处理系统进展》,第1169-1177页,2013年。
[3] Sanjeev Arora、Elad Hazan和Satyen Kale。乘法权重更新方法:一种元算法及其应用。计算理论,8(1):121-1642012·Zbl 1283.68414号
[4] Jean-Yves Audibert和Sébastien Bubeck。针对敌对和随机盗贼的Minimax政策。2009年,《国际刑事诉讼法》第217-226页。
[5] 彼得·奥尔(Peter Auer)、尼科洛·塞萨·比安奇(Nicolo Cesa Bianchi)、约夫·弗伦德(Yoav Freund)和罗伯特·夏皮雷(Robert E Schapire)。在被操纵的赌场赌博:对抗性的多武装土匪问题。计算机科学基础,1995年。诉讼程序。,第36届年度研讨会,第322-331页。IEEE,1995年·Zbl 0938.68920号
[6] Moshe Babaioff、Shaddin Dughmi、Robert Kleinberg和Aleksandrs Slivkins。限量供应的动态定价。ACM经济学与计算学报,3(1):42015年4月·Zbl 1333.91013号
[7] 阿什文库马尔·巴达尼迪尤鲁(Ashwinkumar Badanidiyuru)、罗伯特·克莱恩伯格(Robert Kleinberg)和阿列克桑德斯·斯利夫金斯(Aleksandrs Slivkins)。背着背包的土匪。计算机科学基础(FOCS),2013年IEEE第54届年度研讨会,第207-216页。IEEE,2013年·Zbl 1425.68340号
[8] 玛丽亚·福丽娜·巴尔坎、阿夫林·布鲁姆、杰森·德·哈特琳和伊莎·曼苏尔。通过机器学习将机构设计简化为算法设计。计算机与系统科学杂志,74(8):1245-12702008·Zbl 1157.68055号
[9] 齐夫·巴·约瑟夫(Ziv Bar-Yossef)、克里斯汀·希尔特伦(Kirsten Hildrum)和菲利克斯·吴(Felix Wu)。数字产品的激励兼容在线拍卖。第十三届ACM-SIAM离散算法年会论文集,964-970页。工业和应用数学学会,2002年·兹比尔1092.91522
[10] Omar Besbes和Assaf Zeevi。不知道需求函数的动态定价:风险边界和近最优算法。运筹学,57(6):1407-14202009·Zbl 1233.90011号
[11] 多尺度在线学习:理论及其在在线拍卖和定价中的应用
[12] Avrim Blum和Jason D Hartline。近乎最优的在线拍卖。第十六届ACM-SIAM离散算法研讨会论文集,第1156-1163页。工业和应用数学学会,2005年·Zbl 1297.91075号
[13] Avrim Blum、Vijay Kumar、Atri Rudra和Felix Wu。在线拍卖中的在线学习。理论计算机科学,324(2-3):137-1462004·Zbl 1091.91028号
[14] 塞巴斯蒂安·布贝克。在线优化简介。讲座笔记,第1-86页,2011年。
[15] 杨才,康斯坦蒂诺斯·达斯卡拉基斯和马修·温伯格。最优多维机制设计:减少收入以实现福利最大化。《计算机科学基础》(FOCS),2012年IEEE第53届年度研讨会,第130-139页。IEEE,2012年。
[16] 理查德·科尔(Richard Cole)和蒂姆·拉夫加登(Tim Roughgarden)。收入最大化的样本复杂性。2014年5月31日至6月3日,美国纽约州纽约市,STOC 2014计算机理论研讨会,第243-252页·Zbl 1315.91026号
[17] 阿诺德五世登布尔。动态定价和学习:历史渊源、当前研究和新方向。运筹学和管理科学调查,20(1):1-182015。
[18] Nikhil R Devanur、Zhiyi Huang和Christos-Alexandros Psomas。附带信息拍卖的样本复杂性。第48届ACM SIGACT计算机理论年会论文集,第426-439页。ACM,2016年·Zbl 1375.91092号
[19] Peerapong Dhangwatnoai、Tim Roughgarden和Qiqi Yan。通过单个样本实现收入最大化。《游戏与经济行为》,2014年·Zbl 1318.91088号
[20] 伊迪丝·埃尔金德。设计和学习最优有限支持拍卖。第十八届ACM-SIAM离散算法年会论文集,第736-745页。工业和应用数学学会,2007年·Zbl 1303.91083号
[21] Dylan J Foster、Satyen Kale、Mehryar Mohri和Karthik Sridharan。通过模型选择实现无参数在线学习。《神经信息处理系统进展》,第6020-6030页,2017年。
[22] Yoav Freund和Robert E Schapire。在线学习的决策理论推广及其在助推中的应用。在欧洲计算学习理论会议上,第23-37页。斯普林格,1995年。
[23] Yannai A Gonczarowski和Noam Nisan。单参数拍卖环境中的有效经验收益最大化。2017年ACM STOC会议记录·Zbl 1370.68252号
[24] 黄志毅(Zhiyi Huang)、伊莎·曼苏尔(Yishay Mansour)和蒂姆·拉夫加登(Tim Roughgarden)。充分利用您的样品。2015年6月15日至19日,美国俄勒冈州波特兰市,EC’15,《第十六届ACM经济与计算会议记录》,第45-60页,2015a·Zbl 1390.91146号
[25] 黄志毅、Yishay Mansour和Tim Roughgarden。充分利用您的样品。第十六届美国计算机学会经济学与计算会议论文集,第45-60页。ACM,2015年b·Zbl 1390.91146号
[26] 罗伯特·克莱伯格(Robert Kleinberg)和汤姆·莱顿(Tom Leighton)。了解需求曲线的价值:对网上标价拍卖感到后悔。计算机科学基础,2003年。诉讼程序。第44届IEEE年会,第594-605页。IEEE,2003年。
[27] 杰米·莫根斯坦(Jamie H Morgenstern)和蒂姆·罗加登(Tim Roughgarden)。关于近似最优拍卖的伪维。《神经信息处理系统进展》,第136-1442015页。
[28] 罗杰·B·迈尔森。最优拍卖设计。运筹学数学,6(1):58-731981·Zbl 0496.90099号
[29] 蒂姆·拉夫加登(Tim Roughgarden)和奥克·施里杰弗斯(Okke Schrijvers)。《黑暗中的熨烫》,《2016年美国计算机学会经济与计算会议论文集》,第1-18页。ACM,2016年。
[30] 伊利亚·西格尔。需求未知的最优定价机制。《美国经济评论》,93(3):509-5292003。
[31] 瓦西里斯·西兰卡尼斯。样本复杂性度量及其在学习最优拍卖中的应用。arXiv预印本arXiv:1704.025982017。
[32] Kalyan T Talluri和Garrett J Van Ryzin。《收入管理理论与实践》,第68卷。Springer科学与商业媒体,2006年·Zbl 1083.90024号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。