文件Zbl 07575079-zbMATH Open

在马尔洛模型下找到第二个最佳候选人。（英语） Zbl 07575079号

西奥。计算。科学。 929, 39-68 (2022).

摘要：序列分析和最优停止理论中著名的秘书问题要求在实时做出接受/拒绝决策的约束下，最大化在序列检查列表中找到最优候选人的概率。这个问题在数学界引起了极大的兴趣，并且与在线搜索、数据流、日常购买建模和多臂盗贼机制中出现的实际问题有关。问题的一个版本是所谓的博士后问题，对此感兴趣的问题是设计一种策略，该策略识别具有最高可能成功概率的第二最佳候选者。
我们以组合形式研究博士后问题。在这种情况下，根据对称群（S_N）上的某些分布对长度为（N）的排列（pi）进行采样，并且从左到右逐个显示（pi，人们只能确定到目前为止所揭示的元素的相对顺序。在每个步骤中，必须决定接受或拒绝当前呈现的元素，并且以后不能再回忆起该决定。感兴趣的问题是找到选择第二大价值头寸的最佳策略。我们解决了非传统背景下的博士后问题，在这种背景下，候选者不是随机统一呈现的，而是根据从马尔洛分布中得出的排列。Mallows分布为每个置换（S_N中的π）分配一个权重（θc（π）}），其中函数（c）表示（π和恒等置换之间的Kendall（τ）距离（即π中的反转数）。为了确定更具挑战性的博士后问题的最佳停止标准，我们采用了一种组合方法，与秘书问题中首次引入的分析相比，该方法包括新的证明技术和新的方法学扩展。最优策略取决于Mallows分布的参数（θ），并且可以通过求解定义良好的递归关系精确地确定。

引用于2文件

MSC公司：

68周27	在线算法；流式算法
60克40	停车时间；最优停车问题；赌博理论

关键词：

秘书问题;博士后问题;马尔洛模型;次佳候选人;排列;在线算法

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	巴巴奥夫，M。；Immorlica，N。；Kempe，D。；Kleinberg，R.，《在线拍卖和广义秘书问题》，ACM SIGecom Exch。，7, 2, 1-11 (2008)
[2]	巴永，L。；阿尤索，P.F。；Grau，J。；Oller-Marceén，A。；Ruiz，M.，《最好还是最好以及博士后问题》，J.Comb。最佳。，35, 3, 703-723 (2018) ·Zbl 1416.90039号
[3]	巴永，L。；阿尤索，P.F。；Grau，J。；Oller-Marceén，A。；Ruiz，M.，随机候选人数的最佳或最佳博士后问题，J.Comb。最佳。，38, 1, 86-110 (2019) ·兹比尔1461.90115
[4]	Bearden，J.N.，基于等级选择和基数报酬的新秘书问题，J.Math。心理医生。，50, 1, 58-59 (2006) ·Zbl 1125.90028号
[5]	Busa-Fekete，R。；Fotakis，D。；Szörényi，B。；Zampetakis，M.，Mallows区块模型的最优学习，Proc。机器。学习。决议，99，1-4（2019）
[6]	Crews，M。；琼斯，B。；Myers，K。；塔尔曼，L。；Urbanski，M。；Wilson，B.，最佳选择游戏中的机会成本，Electron。J.库姆。，26,1（2019），#P1.45·Zbl 1409.60065号
[7]	Dynkin，E.，马尔可夫过程停止时刻的最佳选择，Dokl。阿卡德。诺克SSSR，150，238-240（1963）·Zbl 0242.60018号
[8]	Esfandiari，H。；哈加伊，M。；Liaghat，V。；Monemizadeh，M.，先知秘书，SIAM J.离散数学。，31, 3, 1685-1701 (2017) ·Zbl 1378.91094号
[9]	Fowlkes，A。；Jones，B.，《最佳选择游戏中的位置策略》，Involve，12，4，647-658（2019）·Zbl 1417.91147号
[10]	加德纳，M.，《数学游戏》，科学。美国，202，2152（1960）
[11]	加德纳，M.，《数学游戏》，科学。美国，202，3，178-179（1960）
[12]	Jones，B.，《避免模式并做出最佳选择》，《离散数学》。，342, 6, 1529-1545 (2019) ·Zbl 1414.05014号
[13]	琼斯，B.，最佳选择加权游戏，SIAM J.离散数学。，34, 1, 399-414 (2020) ·兹比尔1431.91059
[14]	Kleinberg，R.D.，一种用于在线拍卖的多选秘书算法（SODA，第5卷（2005）），630-631·Zbl 1297.68268号
[15]	Lindley，D.，动态规划和决策理论，应用。《统计》，第10卷，第39-52页（1961年）·Zbl 0114.34904号
[16]	刘，X。；Milenkovic，O。；Moustakides，G.，Mallows模型下基于查询的最优候选者选择·Zbl 07755523号
[17]	Mallows，C.L.，《非完全排名模型》，《生物统计学》，44，1/2，114-130（1957）·Zbl 0087.34001号
[18]	Rose，J.S.，《最优选择和分配问题》，Oper。《决议》，第30卷，第172-181页（1982年）·Zbl 0481.90049号
[19]	Rubinstein，A.，《超越拟阵：秘书问题和带有一般约束的预言不等式》，（第48届ACM计算理论研讨会论文集。第48届ASM计算理论会议论文集，STOC（2016）），324-332·Zbl 1373.68457号
[20]	Szajowski，K.，《具有基数回报和选择成本的基于等级的选择》，《科学》。数学。日本。，69, 2, 285-293 (2009) ·Zbl 1160.62075号
[21]	Vanderbei，R.J.，秘书问题的博士后变体（2012），普林斯顿大学，技术报告·Zbl 1499.60133号
[22]	Zhao，T。；胡，M。；Rahimi，R。；国王，我，时间到了！将客户行为建模为日常交易网站中的秘书问题，（2017年国际神经网络联合会议。2017年国际神经元网络联合会议，IJCNN（2017），IEEE），3670-3679

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

在马尔洛模型下找到第二个最佳候选人。（英语） Zbl 07575079号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

在马尔洛模型下找到第二个最佳候选人。 （英语） Zbl 07575079号

MSC公司：

关键词：

参考文献：

在马尔洛模型下找到第二个最佳候选人。（英语） Zbl 07575079号