×

序列分配问题的最优自适应策略。 (英语) Zbl 0854.60032号

摘要:考虑从\(m\)统计群体中顺序抽样的问题,以最大化长期预期的结果总和。在对未知参数\(\theta\)的适当假设下,证明了存在一类具有以下性质的自适应策略\(C_R\):(i)在\(C_R\)中的任何策略\(\pi^0\)下的预期\(n\)视界奖励\(V^{\pi^0}_n(\theta)\)等于\(n\mu^*(\theta)-M(\theta)\log n+o(\log n)\),作为\(n到\ infty),其中\(μ^*(θ)\)是最大的总体平均值,\(M(θ。(ii)(C_R)中的策略在更大的“一致快速收敛”策略类(C_{text{UF}})中渐近最优,即\[\varlimsup_{n\to\infty}\bigl,\]对于C_{text{UF}}中的任何\(\pi\)和\ theta\中的任意\(\ theta\),使得\(M(\ theta)>0。(C_R)中的策略是通过易于计算的索引指定的,定义为对偶问题的唯一解决方案,对偶问题是由函数形式(M(θ)自然产生的。此外,对于由有限支持度的非参数离散单变量分布指定的总体,验证了这些假设。在均值和方差未知的正态总体的情况下,我们把验证一个假设作为一个公开的问题。

MSC公司:

60F99型 概率论中的极限定理
90C99号 数学编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接