×

具有随机查询的秘书问题的最优停止方法。 (英语) Zbl 07845406号

摘要:应聘者按顺序到达面试流程,这会使他们相对于前任者进行排名。必须根据每次可用的等级制定决策机制,以选择或解雇当前候选人,以最大限度地提高选择最佳人选的机会。这个经典版本的“秘书问题”已经被深入研究,主要使用组合方法,以及许多其他变体。我们考虑一个特定的新版本,在审查过程中,可以询问外部专家,以提高做出正确决定的概率。与现有的公式不同,我们认为专家不一定是绝对正确的,并且可能提供错误的建议。为了解决我们的问题,我们采用了概率方法,并将查询时间视为连续的停止时间,我们借助于最优停止理论进行优化。对于每个查询时间,我们还必须设计一种机制来决定是否应在查询时间终止搜索。在通常的无误专家的假设下,这个决定是直截了当的,但当专家有错误时,它的结构要复杂得多。

MSC公司:

60克40 停车时间;最优停车问题;赌博理论
62升15 统计中的最优停止
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Antoniadis,A.、Gouleakis,T.、Kleer,P.和Kolev,P.(2020年)。秘书和在线匹配问题与机器学习的建议。程序中。第34届Conf.Neural Inf.Proc。系统。,第7933-7944页。
[2] Chien,I.、Pan,C.和Milenkovic,O.(2018)。查询K-表示聚类和双数码杯问题。程序中。第32次确认神经信息程序。系统。,第6649-6658页。
[3] Crews,M.、Jones,B.、Myers,K.、Taalman,L.、Urbanski,M.和Wilson,B.(2019年)。最佳选择游戏中的机会成本。电子。J.组合学26,第1.45页·Zbl 1409.60065号
[4] Duting,P.、Lattanzi,S.、Leme,R.P.和Vassilvitskii,S.(2021)。秘书提供建议。程序中。第22届ACM经济大会。公司。,第409-429页。
[5] Dynkin,E.B.(1963年)。马尔可夫过程停止时刻的最优选择。多克。阿卡德。恶心。SSSR150、238-240·Zbl 0242.60018号
[6] Ferguson,T.S.(1989)。谁解决了秘书的问题?统计师。科学4,282-289·Zbl 0788.90080号
[7] 弗里曼,P.R.(1983)。秘书问题及其延伸——综述。国际统计。第51版,189-206·Zbl 0516.62081号
[8] Gardner,M.(1960年)。数学游戏。《科学美国人》202,178-179。
[9] Gilbert,J.和Mosteller,F.(1966年)。识别序列的最大值。J.艾默。统计师。协会61,35-73。
[10] Gusein Zade,S.(1966年)。一系列独立试验的选择问题和最优停止规则。理论探索。申请11472-476。
[11] Jones,B.(2020年)。最佳选择的加权游戏。SIAM J.离散数学34,399-414·兹比尔1431.91059
[12] Lindley,D.(1961年)。动态规划与决策理论。应用统计10,39-52·Zbl 0114.34904号
[13] Liu,X.和Milenkovic,O.(2022)。在马尔洛模型下找到第二个最佳候选人。理论。计算。科学929,39-68·Zbl 07575079号
[14] Liu,X.、Milenkovic,O.和Moustakides,G.V.(2021)。Mallows模型下基于查询的最佳候选人选择。预印本,arXiv:2101.07250。
[15] Mazumdar,A.和Saha,B.(2017年)。带有杂乱查询的聚类。程序中。第31届Conf.Neural Inf.Proc。系统。,第5789-5800页。
[16] Nikolaev,M.(1977年)。关于最佳选择问题的推广。理论探索。申请22187-190年·Zbl 0377.60048号
[17] Peskir,P.和Shiryaev,A.(2006年)。最优停车和自由边界问题。纽约州施普林格·Zbl 1115.60001号
[18] Rose,J.S.(1982)。最优选择和分配问题。运营商。172-181年第30号决议·Zbl 0481.90049号
[19] Sakaguchi,M.(1978年)。嫁妆问题和OLA政策。代表统计申请。JUSE251224-128号决议·Zbl 0416.62058号
[20] Shiryaev,A.(1978年)。最佳停止规则。纽约州施普林格·Zbl 0391.60002号
[21] Tamaki,M.(1979年)。有双重选择的秘书问题。J.歌剧。Res.Soc.日本2257-264·Zbl 0424.60054号
[22] Tamaki,M.(1979年)。识别序列的最大值和第二个最大值。J.应用。探针16,803-812·Zbl 0443.60040号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。