×

在马尔洛模型下找到第二个最佳候选人。 (英语) Zbl 07575079号

摘要:序列分析和最优停止理论中著名的秘书问题要求在实时做出接受/拒绝决策的约束下,最大化在序列检查列表中找到最优候选人的概率。这个问题在数学界引起了极大的兴趣,并且与在线搜索、数据流、日常购买建模和多臂盗贼机制中出现的实际问题有关。问题的一个版本是所谓的博士后问题,对此感兴趣的问题是设计一种策略,该策略识别具有最高可能成功概率的第二最佳候选者。
我们以组合形式研究博士后问题。在这种情况下,根据对称群(S_N)上的某些分布对长度为(N)的排列(pi)进行采样,并且从左到右逐个显示(pi,人们只能确定到目前为止所揭示的元素的相对顺序。在每个步骤中,必须决定接受或拒绝当前呈现的元素,并且以后不能再回忆起该决定。感兴趣的问题是找到选择第二大价值头寸的最佳策略。我们解决了非传统背景下的博士后问题,在这种背景下,候选者不是随机统一呈现的,而是根据从马尔洛分布中得出的排列。Mallows分布为每个置换(S_N中的π)分配一个权重(θc(π)}),其中函数(c)表示(π和恒等置换之间的Kendall(τ)距离(即π中的反转数)。为了确定更具挑战性的博士后问题的最佳停止标准,我们采用了一种组合方法,与秘书问题中首次引入的分析相比,该方法包括新的证明技术和新的方法学扩展。最优策略取决于Mallows分布的参数(θ),并且可以通过求解定义良好的递归关系精确地确定。

MSC公司:

68周27 在线算法;流式算法
60克40 停车时间;最优停车问题;赌博理论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴巴奥夫,M。;Immorlica,N。;Kempe,D。;Kleinberg,R.,《在线拍卖和广义秘书问题》,ACM SIGecom Exch。,7, 2, 1-11 (2008)
[2] 巴永,L。;阿尤索,P.F。;Grau,J。;Oller-Marceén,A。;Ruiz,M.,《最好还是最好以及博士后问题》,J.Comb。最佳。,35, 3, 703-723 (2018) ·Zbl 1416.90039号
[3] 巴永,L。;阿尤索,P.F。;Grau,J。;Oller-Marceén,A。;Ruiz,M.,随机候选人数的最佳或最佳博士后问题,J.Comb。最佳。,38, 1, 86-110 (2019) ·兹比尔1461.90115
[4] Bearden,J.N.,基于等级选择和基数报酬的新秘书问题,J.Math。心理医生。,50, 1, 58-59 (2006) ·Zbl 1125.90028号
[5] Busa-Fekete,R。;Fotakis,D。;Szörényi,B。;Zampetakis,M.,Mallows区块模型的最优学习,Proc。机器。学习。决议,99,1-4(2019)
[6] Crews,M。;琼斯,B。;Myers,K。;塔尔曼,L。;Urbanski,M。;Wilson,B.,最佳选择游戏中的机会成本,Electron。J.库姆。,26,1(2019),#P1.45·Zbl 1409.60065号
[7] Dynkin,E.,马尔可夫过程停止时刻的最佳选择,Dokl。阿卡德。诺克SSSR,150,238-240(1963)·Zbl 0242.60018号
[8] Esfandiari,H。;哈加伊,M。;Liaghat,V。;Monemizadeh,M.,先知秘书,SIAM J.离散数学。,31, 3, 1685-1701 (2017) ·Zbl 1378.91094号
[9] Fowlkes,A。;Jones,B.,《最佳选择游戏中的位置策略》,Involve,12,4,647-658(2019)·Zbl 1417.91147号
[10] 加德纳,M.,《数学游戏》,科学。美国,202,2152(1960)
[11] 加德纳,M.,《数学游戏》,科学。美国,202,3,178-179(1960)
[12] Jones,B.,《避免模式并做出最佳选择》,《离散数学》。,342, 6, 1529-1545 (2019) ·Zbl 1414.05014号
[13] 琼斯,B.,最佳选择加权游戏,SIAM J.离散数学。,34, 1, 399-414 (2020) ·兹比尔1431.91059
[14] Kleinberg,R.D.,一种用于在线拍卖的多选秘书算法(SODA,第5卷(2005)),630-631·Zbl 1297.68268号
[15] Lindley,D.,动态规划和决策理论,应用。《统计》,第10卷,第39-52页(1961年)·Zbl 0114.34904号
[16] 刘,X。;Milenkovic,O。;Moustakides,G.,Mallows模型下基于查询的最优候选者选择·Zbl 07755523号
[17] Mallows,C.L.,《非完全排名模型》,《生物统计学》,44,1/2,114-130(1957)·Zbl 0087.34001号
[18] Rose,J.S.,《最优选择和分配问题》,Oper。《决议》,第30卷,第172-181页(1982年)·Zbl 0481.90049号
[19] Rubinstein,A.,《超越拟阵:秘书问题和带有一般约束的预言不等式》,(第48届ACM计算理论研讨会论文集。第48届ASM计算理论会议论文集,STOC(2016)),324-332·Zbl 1373.68457号
[20] Szajowski,K.,《具有基数回报和选择成本的基于等级的选择》,《科学》。数学。日本。,69, 2, 285-293 (2009) ·Zbl 1160.62075号
[21] Vanderbei,R.J.,秘书问题的博士后变体(2012),普林斯顿大学,技术报告·Zbl 1499.60133号
[22] Zhao,T。;胡,M。;Rahimi,R。;国王,我,时间到了!将客户行为建模为日常交易网站中的秘书问题,(2017年国际神经网络联合会议。2017年国际神经元网络联合会议,IJCNN(2017),IEEE),3670-3679
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。