Dynamic Pricing in High-dimensions

Adel Javanmard; Hamid Nazerzadeh

我们研究了一家公司面临的定价问题，该公司向长期到达的客户销售大量产品，这些产品通过各种功能进行描述。客户根据包含产品特性和客户特征（编码为$d$维数值向量）以及提供的价格的通用选择模型独立做出购买决策。选择模型的参数对公司来说是先验未知的，但可以随着（二值）销售数据的积累而学习。该公司的目标是实现收入最大化。我们使用经典的遗憾最小化框架对性能进行基准测试，其中遗憾被定义为预期收入损失，而不是预先知道选择模型参数并始终提供收入最大化价格的千里眼策略。这种设置的部分原因是允许实时定价的在线市场的盛行。我们假设一个结构化选择模型，其参数取决于$d$产品特性中的$s_0$。假设市场噪声分布已知，我们提出了一种动态策略，称为正则化最大似然定价（RMLP），该策略利用高维模型的（稀疏性）结构，并获得以$T$表示的对数后悔。更具体地说，我们算法的遗憾是$O（s_0\log d\cdot\log T）$。此外，我们还证明了没有任何保单能比$O（s_0（\log d+\log T））$更好地获得遗憾。{此外，我们建议将我们的策略推广到市场噪声分布未知但属于参数化分布族的情况。此策略获得$O（\sqrt{（\logd）T}）$的遗憾。我们进一步证明，在这种环境中，没有任何策略比$\Omega（\sqrt{T}）$更能获得遗憾。}

高维动态定价

摘要