×

利普希茨强盗没有利普希兹常数。 (英语) 兹比尔1349.60069

Kivinen,Jyrki(编辑)等人,《算法学习理论》。2011年10月5日至7日在芬兰埃斯波举行的ALT 2011第22届国际会议。诉讼程序。柏林:施普林格出版社(ISBN 978-3-642-24411-7/pbk)。计算机科学课堂讲稿6925。人工智能课堂讲稿,144-158(2011)。
摘要:我们考虑了武器连续体由\([0,1]^{d}\)索引的随机强盗问题。我们首先指出,文献中迄今为止所考虑的策略只提供了形式的理论保证:给定一些调整参数,对于依赖这些参数的一类环境来说,遗憾很小。然而,这并不是正确的观点,因为战略应该适应当前特定的强盗环境,而不是相反。换言之,提出了一个适应问题。我们针对均值-衰减函数全局为Lipschitz的特殊环境进行了求解。更准确地说,我们证明了在平均值函数为Lipschitz且具有常数L的环境下,(T)时间实例上遗憾界的最小最大数量级(L^{d/(d+2)}T^{(d+1)/(d=2)}\)可以在不预先知道(L\)或(T\)的情况下实现。这与之前所有已知的策略形成了对比,这些策略在一定程度上需要了解(L)才能实现这一性能保证。
关于整个系列,请参见[Zbl 1223.68007号].

理学硕士:

60克40 停车时间;最优停车问题;赌博理论
91A60型 概率博弈;赌博
PDF格式BibTeX公司 XML格式引用