×

具有多个产品和部分指定需求分布的动态定价。 (英语) Zbl 1308.90083号

摘要:我们研究了一个具有多个产品和无限库存的动态定价问题。对这些产品的需求取决于销售价格和卖方未知的参数。它们的价值可以通过使用统计估计技术从累积销售数据中获得。参数估计的质量受到价格离散程度的影响;然而,销售价格的大幅度变化可能代价高昂,因为这意味着使用了次优价格。因此,卖方需要平衡优化参数估计的质量和优化即时收入,即开采和勘探。
在本研究中,我们针对这个动态定价问题提出了一种定价策略。关键思想是在每个时间段使用相对于当前参数估计值而言最优的价格,并附加一个约束,以确保充分的价格分散。我们通过设计矩阵的最小特征值来衡量价格离散度,并说明如何通过价格优化问题中的简单二次约束来实现该特征值的期望增长率。我们通过提供遗憾界限来研究定价政策的绩效,该界限衡量了使用次优价格导致的预期收入损失。

MSC公司:

90B60毫米 营销、广告
62升05 顺序统计设计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abbasi-Yadkori Y,Szepesvári C(2011)线性二次系统自适应控制的遗憾界。Kakade S,von Luxburg U,编辑。第24届年度大会学习。理论(COLT)第19卷,第1-26页。
[2] Abbasi-Yadkori Y,Pal D,Szepesvári C(2011)线性随机盗贼的改进算法。Shawe-Taylor J、Zemel RS、Bartlett P、Pereira FCN、Weinberger KQ编辑。神经信息处理系统的进展24, 2312-2320.
[3] Araman VF,Caldentey R(2009年),具有需求学习的非易腐蚀产品的动态定价。操作。物件。57(5):1169-1188. 摘要·Zbl 1233.91099号
[4] Arora S,Hazan E,Kale S(2012)乘法权重更新方法:元算法和应用。理论计算。8:121-164. 交叉参考·Zbl 1283.68414号
[5] Auer P,Cesa Bianchi N,Fischer P(2002)多武装匪徒问题的有限时间分析。机器学习。47(2):235-256。交叉参考·Zbl 1012.68093号
[6] Auer P、Ortner R、Szepesvári C(2007)随机连续体武装匪徒问题的改进率。Bshouty N,Gentile C,编辑。学习理论《计算机科学讲义》,第4539卷(柏林施普林格出版社),第454-468页。交叉参考·Zbl 1203.68134号
[7] Aviv Y,Pazgal A(2005)动态定价的部分可观测马尔可夫决策过程。管理科学。51(9):1400-1416. 摘要·Zbl 1232.91238号
[8] Bartlett MS(1951)判别分析中出现的逆矩阵调整。安。数学。统计师。22(1):107-111. 交叉参考·Zbl 0042.38203号
[9] Bartlett PL,Tewari A(2009)REGAL:弱通信MDP中基于正则化的强化学习算法。程序。2009年UAI人工智能第25次冲突不确定性(弗吉尼亚州阿灵顿AUAI出版社),35-42。
[10] Baum LE,Katz M(1965)《大数定律的收敛速度》。事务处理。阿默尔。数学。Soc公司。120(1):108-123. 交叉参考·Zbl 0142.14802号
[11] Bertsimas D,Perakis G(2006)《动态定价:一种学习方法》。拥堵收费的数学和计算模型(纽约施普林格),45-79。交叉参考·Zbl 1115.90061号
[12] Besbes O,Zeevi A(2009)《不知道需求函数的动态定价:风险边界和近最优算法》。操作。物件。57(6):1407-1420. 摘要·Zbl 1233.90011号
[13] Besbes O,Zeevi A(2011),关于变化环境中定价的最小最大复杂性。操作。物件。59(1):66-79. 摘要·Zbl 1217.91062号
[14] Boyd S、Vandenberghe L(2004)凸优化(剑桥大学出版社,纽约)。交叉参考
[15] Broder J,Rusmevichientong P(2012),一般参数选择模型下的动态定价。操作。物件。60(4):965-980. 摘要·Zbl 1260.91094号
[16] Bubeck S,Cesa-Bianchi N(2012)随机和非随机多武器强盗问题的后悔分析。基础趋势机器学习。58(1):1-122. 交叉参考·Zbl 1281.91051号
[17] Carvalho AX,Puterman ML(2005)《动态优化与学习:当需求函数未知时,管理者应该如何定价?》?巴西经济研究所(IPEA)1117号讨论文件。
[18] Carvalho AX,Puterman ML(2005),具有二项式需求的互联网环境中的学习和定价。J.收入定价管理3(4):320-336. 交叉参考
[19] Chang YI(1999)最后一次广义线性模型中最大拟似然估计的强一致性。统计师。普罗巴伯。莱特。45(3):237-246. 交叉参考·Zbl 0934.62071号
[20] Clausen J(1999)分支定界算法——原理和示例,http://janders.eecg.toronto.edu/1387/readings/b_and_b.pdf。
[21] Cope E(2007)电子商务中动态定价的贝叶斯策略。海军后勤部。54(3):265-281. 交叉参考·Zbl 1130.91329号
[22] Cope EW(2009)一类连环武装匪徒问题的遗憾与收敛边界。IEEE传输。自动控制54(6):1243-1253. 交叉参考·Zbl 1367.93738号
[23] Dani V,Hayes TP,Kakade SM(2008),强盗反馈下的随机线性优化。第21届年度Conf.Learn。理论(COLT)(威斯康星州麦迪逊市Omnipress),355-366。
[24] Davis JA(1968)中等偏差概率的收敛速度。安。数学。统计师。39(6):2016-2028. 交叉参考·Zbl 0196.20901号
[25] den Boer AV(2013)《动态定价和学习:历史渊源、当前研究和新方向》。工作文件,http://ssrn.com/abstract=2334429。
[26] den Boer AV,Zwart B(2011)最大拟似然估计量的均方收敛速度。提交出版,https://www.researchgate.net/publication/257985753_Mean_square_convergence_rates_for_maximum_quasi-likelihood_estimators。
[27] den Boer AV,Zwart B(2013)使用受控方差定价同时学习和优化。管理科学。,ePub将于12月10日印刷,http://dx.doi.org/10.1287/mnsc.2013.1788。
[28] Duistermaat JJ,Kolk JAC(2004)多维实数分析:微分《剑桥高等数学研究》(86)(英国剑桥大学出版社)。
[29] Erdos P(1949)关于Hsu和Robbins的一个定理。安。数学。统计师。20(2):286-291. 交叉参考·Zbl 0033.29001号
[30] 鄂尔多斯P(1950)对我的论文“关于徐和罗宾斯的一个定理”的评论安。数学。统计师。21(1):138. 交叉参考
[31] Eren SS,Maglaras C(2010)《需求信息有限的垄断定价》。J.收入定价管理9:23-48. 交叉参考
[32] Farias VF,van Roy B(2010)具有事先市场反应的动态定价。操作。物件。58(1):16-29. 摘要·Zbl 1233.91104号
[33] Filippi S、Cappe O、Garivier A、Szepesvari C(2010)《参数强盗:广义线性情形》。Lafferty J、Williams CKI、Shawe-Taylor J、Zemel RS、Culotta A编辑。神经信息处理系统的进展23(纽约州Red Hook市Curran Associates),586-594。
[34] 吉尔J(2001)广义线性模型:统一方法(Sage Publications,千橡树,加利福尼亚州)。
[35] Godambe VP,Heyde CC(1987),拟似然和最优估计。国际。统计师。版次。55(3):231-244. 交叉参考·Zbl 0671.62007号
[36] Hager WW(1989)更新矩阵的逆矩阵。SIAM版本。31(2):221-239. 交叉参考·Zbl 0671.65018号
[37] Hall P,Heyde CC(1980)鞅极限理论及其应用《概率与数理统计》(纽约学术出版社)。
[38] Harrison JM、Keskin NB、Zeevi A(2012)《贝叶斯动态定价政策:二元先验分布下的学习和收益》。管理科学。58(3):570-586. 摘要
[39] Heyde CC(1997)拟似然及其应用《斯普林格统计系列》(Springer Verlag,纽约)。交叉参考
[40] Heyde CC,Morton R(1996)准似然和EM算法的推广。J.罗伊。统计师。Soc.序列号。B(方法学)58(2):317-327. ·Zbl 0853.62021号
[41] Hsu PL,Robbins H(1947)完全收敛与大数定律。程序。国家。阿卡德。科学。美国33(2):25-31. 交叉参考·Zbl 0030.20101号
[42] Jaksch T,Ortner R,Auer P(2010)强化学习的近似最优后悔界限。J.机器学习。物件。11:1563-1600. ·兹比尔1242.68229
[43] Katz ML(1963)分布尾部的概率。安。数学。统计师。34(1):312-318. 交叉参考·Zbl 0209.49503号
[44] Keskin NB,Zeevi A(2013),未知线性需求模型下的动态定价:渐近最优半近视政策。芝加哥大学工作文件,http://faulty.chicagobooth.edu/bora.keskin/pdfs/DynamicPricingUnknownDemandModel.pdf。 ·Zbl 1368.91103号
[45] Kleinberg R(2005)连环武装匪徒问题的边界几乎很紧。Saul LK、Weiss Y、Bottou L编辑。神经信息处理系统的进展17(麻省理工学院出版社,马萨诸塞州剑桥),697-704。
[46] Kleinberg R,Leighton T(2003)《了解需求曲线的价值:网上标价拍卖的遗憾界限》。程序。第44届IEEE交响乐团。计算基础。科学。(IEEE计算机学会,华盛顿特区),594-605。交叉参考
[47] Lai TL(1974)时滞和的极限定理。安·普罗巴伯。2(3):432-440. 交叉参考·Zbl 0305.60009号
[48] Lai TL,Wei CZ(1982)随机回归模型中的最小二乘估计及其在动态系统识别和控制中的应用。Ann.Statist公司。10(1):154-166. 交叉参考·Zbl 0649.62060号
[49] Le Guen T(2008)数据驱动定价。马萨诸塞州剑桥市麻省理工学院硕士论文。2011年4月4日检索,http://hdl.handle.net/1721.1/45627。
[50] Lim AEB、Shanthikumar JG(2007),相对熵、指数效用和稳健动态定价。操作。物件。55(2):198-214. 摘要·Zbl 1167.91347号
[51] Lim AEB、Shanthikumar JG、Watewai T(2008)稳健的多产品定价。加州大学伯克利分校工作文件,http://dx.doi.org/10.2139/ssrn.1078012。
[52] Lobo MS,Boyd S(2003)《需求不确定的定价和学习》。斯坦福大学工作文件,http://www.stanford.edu网站/\simboid/papers/pdf/pric_learn_unc_dem.pdf。
[53] Loève M(1977)概率论I第4版(Springer Verlag,纽约)。
[54] McCullagh P(1983)拟似然函数。Ann.Statist公司。11(1):59-67. 交叉参考·Zbl 0507.62025号
[55] McCullagh P,Nelder JA(1983年)广义线性模型(查普曼和霍尔,伦敦)。交叉参考
[56] Nassiri-Toussi K,Ren W(1994)关于白噪声中最小二乘估计的收敛性。IEEE传输。自动控制39(2):364-368. 交叉参考·Zbl 0825.93985号
[57] 奥斯本MR(1992)费舍尔评分法。国际。统计师。国际统计版次60(1):99-117. ·Zbl 0755.62005号
[58] Pronzato L(2008)最优实验设计和一些相关的控制问题。Automatica公司44(2):303-325. 交叉参考·Zbl 1283.93154号
[59] Pronzato L(2009)有限设计空间随机模型中非线性估计的渐近性质。统计师。普罗巴伯。莱特。79(21):2307-2313. 交叉参考·Zbl 1176.62020号
[60] 罗斯柴尔德M(1974)市场定价的双臂强盗理论。《经济学杂志》。理论9(2):185-202. 交叉参考
[61] Rusmevichientong P,Tsitsiklis JN(2010)《线性参数化匪徒》。数学。操作。物件。35(2):395-411。摘要·Zbl 1217.93190号
[62] Spataru A(2004)一系列T.L.Lai的精确渐近性。程序。阿默尔。数学。Soc公司。132(11):3387-3395. 交叉参考·Zbl 1042.60013号
[63] Spataru A(2009)改进了尾部概率的收敛速度。牛市。特拉维尼亚大学布拉什诺夫分校。三: 数学。,信息学、物理学。2(51):137-142. ·Zbl 1224.60102号
[64] Stoica G(2007)鞅的Baum-Katz-Nagaev型结果。数学杂志。分析。申请。336(2):1489-1492. 交叉参考·Zbl 1130.60020号
[65] Stout WF(1970)Kolmogorov重对数定律的鞅模拟。Zeitschrift für Wahrscheinlichkeits理论和verwandte Gebiete15(4):279-290. 交叉参考·Zbl 0209.49004号
[66] Wang Y,Audibert JY,Munos R(2009)《无限多武装匪徒的算法》。Koller D、Schuurmans D、Bengio Y、Bottou L编辑。神经信息处理系统的进展21(Curran Associates,Red Hook,NY),1729-1736年。
[67] Wedderburn RWM(1974)《拟似然函数、广义线性模型和高斯-纽顿方法》。生物特征61(3):439-447·Zbl 0292.62050号
[68] Xia CH,Dube P(2007)需求不确定性下电子服务的动态定价。生产运营。管理16(6):701-712. 交叉参考
[69] Yin C,Zhang H,Zhao L(2008)多元广义线性模型中最大拟似然估计的强相合率。通信统计–理论方法37(19):3115-3123. 交叉参考·Zbl 1292.62046号
[70] Yu JY,Mannor S(2011)统一模式土匪。Getoor L,Scheffer T,编辑。程序。第28届国际。Conf.机器学习。,华盛顿州贝尔维尤,(威斯康星州麦迪逊,Omnipress),41-48。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。