×

如何举办有效的数据竞赛:竞赛设计和分析的统计建议。 (英语) Zbl 07260636号

总结:数据竞赛依靠实时排行榜对参赛者进行排名,并刺激算法改进。虽然这类竞赛已经变得非常流行和普遍,特别是在监督学习形式中,但主持人对它们的实现是高度可变的。如果没有仔细的规划,有监督的学习竞赛很容易出现过拟合现象,即获胜的解决方案与所提供的特定数据集密切相关,因此无法概括到主持人感兴趣的潜在问题。本文概述了根据我们的经验,战略性地设计相关信息数据集以最大限度地提高举办比赛的学习效果的一些重要考虑因素。它还描述了一个竞争后分析,该分析能够对来自不同竞争对手的解决方案的优缺点进行稳健而有效的评估,以及更好地了解解决得很好的输入空间区域。竞争后分析是对排行榜的补充,它使用探索性数据分析和广义线性模型(GLM)。GLM不仅扩展了我们可以探索的结果范围,还提供了对单个子问题的更详细分析,包括不同类型场景中算法之间的相似性和差异、输入空间中普遍存在的简单或困难区域以及不同的学习目标。当与战略规划的数据生成方法相结合时,这些方法提供了更丰富、信息更丰富的摘要,以增强对结果的解释,而不仅仅是排行榜上的排名。最近完成的一项竞赛对这些方法进行了说明,该竞赛旨在评估能够在城市环境中检测、识别和定位放射性物质的算法。

MSC公司:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] K.M.Abdelbasit和R.Plackett,二进制数据的实验设计,J.Amer。《统计协会》第78卷(1983年),第90-98页·Zbl 0501.62071号
[2] A.Agresti,《分类数据分析导论》,第二版,John Wiley&Sons,新泽西州霍博肯,2007年·Zbl 1266.62008号
[3] C.M.Anderson-Cook,《平衡优先级:做出难以捉摸的完美决定:初级读物》,Qual。程序。46 (2013), 52-53.
[4] C.M.Anderson-Cook和C.M.Borror,“等效”和“不不同”之间的差异,Qual。工程28(2015),249-262。
[5] C.M.Anderson-Cook和L.Lu,《多需求结构:一个新的五步决策过程有助于评估和平衡竞争目标》,《质量进步》48(10)(2015),42-50。
[6] C.M.Anderson-Cook、K.L.Myers、L.Lu、K.R.Quinlan和N.Pawley,《通过战略性生成信息数据集改进数据竞争学习》,质量工程2019年出版。
[7] C.R.Bilder和T.M.Loughin,《R分类数据分析》,CRC出版社,英国伦敦,2014年·Zbl 1320.62001
[8] A.Blum和M.Hardt,《阶梯:机器学习竞赛的可靠排行榜》,《第32届机器学习国际会议论文集》。PMLR 37,第1006-10142015页。
[9] G.Derringer和R.Suich,多个响应变量的同时优化,J.Qual。Technol公司。12 (1980), 214-219.
[10] L.Freeman等人,实验规划教程,Qual。工程25(2013),315-332。
[11] T.Hastie和R.Tibshirani,《无监督学习》,载于《统计学习的要素:数据挖掘、推理和预测》,纽约斯普林格出版社,2009年,485-586·Zbl 1273.62005年
[12] M.Kutner、C.Nachtsheim和J.Neter,《应用线性回归模型》,McGraw-Hill,纽约,2004年,第155-157页。
[13] L.Lu、C.M.Anderson Cook和T.J.Robinson,《利用帕累托前沿基于多个标准的设计实验优化》,Technometrics 53(2011),353-365。
[14] P.McCullough和J.A.Nelder,《广义线性模型》,第二版,查普曼和霍尔出版社,伦敦,1989年·Zbl 0744.62098号
[15] D.Montgomery,《实验设计与分析》,第9版,威利出版社,纽约,2017年。
[16] R.H.Myers等人,《广义线性模型:在工程和科学中的应用》,第二版,新泽西州霍博肯威利出版社,2010年·Zbl 1267.62082号
[17] R.Myers、D.Montgomery和C.M.Anderson-Cook,《响应面方法:使用设计实验进行过程和产品优化》,第四版,威利出版社,纽约,2016年·Zbl 1332.62004号
[18] K.R.Quinlan和C.M.Anderson Cook,用于评估多种取证算法的逻辑回归实验的贝叶斯设计,Appl。斯托克。模型总线。Ind.34(2018),908-921·Zbl 1414.62470号
[19] K.R.Quinlan、C.M.Anderson-Cook和K.L.Myers,逻辑回归实验中结合专家意见的加权先验方法,Qual。工程29(2017),484-498。
[20] S.J.Richter和C.Richter,《工业应用中确定等效性的方法》,Qual。《工程》14(2002),375-380。
[21] J.Simpson、C.Listak和G.Hutto,《评估精心设计的实验的规划和证据指南》,Qual。工程25(2013),333-355。
[22] N.Stevens和C.M.Anderson-Cook,《相关人群的可靠性与同意概率的比较》,《技术计量学》59(3)(2017a),371-380。
[23] N.Stevens和C.M.Anderson-Cook,使用一致概率量化可靠性表面的相似性,Qual。工程29(3)(2017b),395-408。
[24] J.L.Szarka,质量、制造和测试工程师的等效性和非劣性测试,J.Qual。Technol公司。46 (2014), 378-380. ·Zbl 1306.62030号
[25] S.Wellek,《检验等效性和非劣效性的统计假设》,第二版,CRC出版社,纽约,2010年·Zbl 1219.62002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。