×

预测下一个Pogačar:一种检测年轻专业自行车人才的数据分析方法。 (英文) Zbl 07712042号

小结:在过去几年里,年轻运动员在职业自行车领域的重要性突飞猛进。然而,这些车手的早期天赋鉴定在很大程度上仍然是一种主观评估。因此,应该安装一个分析系统,根据免费获得的青少年成绩自动检测天才车手。然而,这种系统不能直接从相关领域复制,因为自行车运动和其他运动之间存在着巨大的差异。本文的目的是开发这样一个数据分析系统,该系统利用每个种族的独特特征,从而专注于特征工程、数据质量和可视化。为了便于在没有完整案例的情况下部署预测算法,我们提出了一种使用专家知识的k-最近邻插补算法。总的来说,我们提出的方法与最终的骑手表现密切相关,可以帮助球探瞄准年轻人才。除此之外,我们还介绍了几种模型解释工具,以深入了解当前初学者中哪些专业车手有望表现良好,以及为什么。

MSC公司:

68泰克 人工智能
62至XX 统计
62卢比 代数和拓扑结构统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andreff,W.(2016)。环法自行车赛:尽管存在竞争失衡和兴奋剂,但仍取得了成功。《职业公路自行车经济学》(第233-255页)。查姆施普林格。
[2] 安塞尔,MH;Lidor,R.,《运动中的人才检测计划:心理测量的可疑使用》,《运动行为杂志》,35,3,239(2012)
[3] Baesens,B.,《大数据世界中的分析:数据科学及其应用的基本指南》(2014),威利出版社
[4] Blom,C.(2019)。使用数据分析使体育人才的选拔和培训更加有效(硕士论文)
[5] 博加特,M。;Ballings,M。;Van den Poel,D.,《评估不同沟通类型在社交媒体浪漫关系预测中的重要性》,《运营研究年鉴》,263,1,501-527(2018)·Zbl 1391.91142号 ·doi:10.1007/s10479-016-2295-0
[6] Breiman,L.,《随机森林,机器学习》,45,1,5-32(2001)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[7] 布雷曼,L。;弗里德曼,J。;斯通,CJ;Olshen,RA,分类和回归树(1984),CRC出版社·Zbl 0541.62042号
[8] Chen,T.和Guestrin,C.(2016)。Xgboost:一个可扩展的树增强系统。第22届ACM sigkdd国际知识发现和数据挖掘会议记录(第785-794页)。
[9] 舞蹈,CP;Reidy,J.,《心理学无数学统计》(2007),培生教育
[10] De Spiegleer,E.(2019年)。使用机器学习预测循环结果。
[11] De Bock,J.和Verstock,S.(2020年)。全球定位系统驱动的摄像机选择,用于自动生成骑手故事。在icSPORTS 2020中,第八届体育科学研究和技术支持国际会议(第67-74页)。
[12] Demšar,J.,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30(2006)·Zbl 1222.68184号
[13] HA Dolatsara;陈,YJ;埃文斯,C。;古普塔,A。;Megahed,FM,在单调概率约束下预测心脏移植存活概率的两阶段机器学习框架,决策支持系统,137113363(2020)·doi:10.1016/j.dss.2020.113363
[14] 德莱赛特尔,S。;Ohno-Machado,L.,Logistic回归和人工神经网络分类模型:方法综述,《生物医学信息学杂志》,35,5-6,352-359(2002)·doi:10.1016/S1532-464(03)00034-0
[15] 费尔南德斯·德尔加多,M。;Cernadas,E。;巴罗,S。;Amorim,D.,我们需要数百个分类器来解决现实世界的分类问题吗?,机器学习研究杂志,15,1,3133-3181(2014)·Zbl 1319.62005号
[16] Gaudette,L.和Japkowicz,N.(2009年)。有序分类的评价方法。加拿大人工智能会议(第207-210页)。柏林,海德堡:施普林格。
[17] Gauthier,TD,使用Spearman等级相关系数检测趋势,环境法医学,2,4,359-362(2001)·doi:10.1006/enfo.20011.0061
[18] Gujarati,D.N.和Porter,D.C.(2009)《基本计量经济学》,第3卷(第55-97页)。塔塔·麦格劳-希尔教育。
[19] 盖恩,I。;Elisseeff,A.,《变量和特征选择简介》,《机器学习研究杂志》,31157-1182(2003)·Zbl 1102.68556号
[20] Hilmkil,A.、Ivarsson,O.、Johansson,M.、Kuylenstierna,D.和van Erp,T.(2018年)。基于专业自行车手数据的机器学习。CoRR abs/1808.00198。
[21] 贾达夫,A。;Pramod,D。;Ramanathan,K.,《数值数据集数据插补方法性能比较》,应用人工智能,33,10,913-933(2019)·doi:10.1080/08839514.2019.1637138
[22] 阿拉斯加州贾恩;Duin,RPW公司;Mao,J.,《统计模式识别:综述》,IEEE模式分析和机器智能汇刊,22,1,4-37(2000)·doi:10.1109/34.824819
[23] 约翰斯顿,K。;Wattie,N。;肖勒,J。;Baker,J.,《运动中的人才识别:系统综述》,《运动医学》,48,1,97-109(2018)·doi:10.1007/s40279-017-0803-2
[24] Karetnikov,A.,《数据驱动分析在专业自行车赛车队运动数据中的应用》(2019年),埃因霍温理工大学
[25] Kataoka,Y.和Gray,P.(2018年)。环法自行车赛实时动力性能预测。在体育分析的机器学习和数据挖掘国际研讨会上(第121-130页)。查姆:斯普林格。
[26] Kholkine,L.、De Schepper,T.、Verdonck,T.和Latré,S.(2020)。一种用于公路自行车比赛成绩预测的机器学习方法。在运动分析的机器学习和数据挖掘国际研讨会上(第103-112页)。查姆:斯普林格。
[27] 科切图洛夫,A。;Pardalos,PM;Karakitsiou,A.,《计算生物医学的海量数据集和机器学习:趋势和挑战》,《运筹学年鉴》,276,1,5-34(2019)·Zbl 1430.62268号 ·doi:10.1007/s10479-018-2891-2
[28] Koseler,K。;Stephan,M.,《棒球中的机器学习应用:系统文献综述》,《应用人工智能》,31,9-10,745-763(2017)·doi:10.1080/08839514.2018.1442991
[29] 科瓦里克,A。;Templ,M.,R包VIM插补,统计软件杂志,74,7,1-16(2016)·doi:10.18637/jss.v074.i07
[30] 库马尔,A。;弗吉尼亚州阮;Teo,KM,《新加坡通勤自行车政策:基于法利卡数据分析的方法》,《运筹学年鉴》,236,1,57-73(2016)·doi:10.1007/s10479-014-1585-7
[31] 库萨,MB;Rudnicki,WR,Boruta包的特征选择,统计软件杂志,36,11,1-13(2010)·doi:10.18637/jss.v036.i11
[32] Larson,D.J.和Maxcy,J.G.(2016)。职业自行车运动中的人力资本开发。《职业公路自行车经济学》(第129-145页)。查姆:斯普林格。
[33] Liu,Y.、Schulte,O.和Li,C.(2018)。用于识别NHL和NBA选秀中杰出球员的模型树。在运动分析的机器学习和数据挖掘国际研讨会上(第93-105页)。查姆:斯普林格。
[34] 伦德伯格,SM;Lee,SI,解释模型预测的统一方法,《神经信息处理系统进展》,304765-4774(2017)
[35] 罗毅、蔡毅、张毅、徐毅、袁毅(2018)。生成性对抗网络的多元时间序列插补。第32届神经信息处理系统国际会议论文集(第1603-1614页)。
[36] 梅纳斯帕,P。;Rampinini,E。;A.波西奥。;Carlomagno,D。;里吉奥,M。;Sassi,A.,不同专业和表现水平的青少年自行车运动员的生理和人体测量特征,斯堪的纳维亚体育医学与科学杂志,22,392-398(2012)·doi:10.1111/j.1600-0838.2010.01168.x
[37] Menaspà,P。;萨西,A。;Impellizzeri,FM,有氧健身变量不能预测年轻自行车运动员的职业生涯,《运动与锻炼中的医学与科学》,42,4,805-812(2010)·doi:10.1249/MSS.0b013e3181ba99bc
[38] Miller,J。;Susa,K.,《世界巡回赛和专业大陆自行车运动员的人体测量特征比较》,《科学与自行车杂志》,7,3,3-6(2018)·doi:10.28985/181231.jsc.02
[39] Molnar,C.,可解释机器学习(2020),Lulu.com
[40] 纳维尔,上午;Jobson,SA;帕尔默,GS;Olds,TS,《衡量最大摄氧量以预测实地骑行时间试验性能:非线性方法》,《欧洲应用生理学杂志》,94,5,705-710(2005)·doi:10.1007/s00421-005-1321-8
[41] Persson,T.L.、Kozlica,H.、Carlsson,N.和Lambrix,P.(2020年)。冰球运动员排名的预测。在运动分析的机器学习和数据挖掘国际研讨会上(第89-100页)。查姆:斯普林格。
[42] Piri,S.,《缺失护理:解决频繁缺失价值观问题的框架》;帕金森病临床决策支持系统案例,决策支持系统,136113339(2020)·doi:10.1016/j.dss.2020.113339
[43] Schetgen,L。;博加特,M。;Van den Poel,D.,《预测捐赠行为:使用脸书数据在非营利部门进行收购建模》,决策支持系统,141113446(2021)·doi:10.1016/j.dss.2020.113446
[44] Tingling,PM;艾伯特·J。;格利克曼,ME;斯瓦茨,TB;Koning,RH,《受过教育的猜测:国家曲棍球联盟的起草》,《体育统计方法和分析手册》,327-339(2016),CRC出版社
[45] 俄勒冈州特罗扬斯卡娅。;康托,M。;Sherlock,G。;布朗,P。;哈斯蒂,T。;Tibshirani,R。;博茨坦,D。;Altman,RB,DNA微阵列缺失值估计方法,生物信息学,17,6,520-525(2001)·doi:10.1093/bioinformatics/17.6.520
[46] 弗吉尼亚州。;Lenoir,M。;威廉姆斯,AM;Philippaerts,RM,体育人才识别和发展计划,运动医学,38,9,703-714(2008)·doi:10.2165/00007256-200838090-00001
[47] Van Reeth,D.(2016)。职业公路自行车的全球化。《职业公路自行车经济学》(第165-205页)。查姆:斯普林格。
[48] Van Buuren,S。;Groothuis-Oudshoorn,K.,《小鼠:R中链式方程的多元插补》,《统计软件杂志》,45,1-68(2010)
[49] van Erp,T。;桑德斯,D。;Lamberts,RP,《在职业自行车运动中保持功率输出和累积的工作水平是成功的关键决定因素》,《运动和锻炼中的医学和科学》,第53期,1903-1910页(2021年)·doi:10.1249/MSS.00000000002656
[50] Van Reeth,D.,《环法自行车赛电视观众预测:多国分析》,《国际预测杂志》,35,2,810-821(2019)·doi:10.1016/j.ij预测2018.06.003
[51] 韦贝克,W。;Dejaeger,K。;Martens,D。;胡尔,J。;Baesens,B.,《电信行业流失预测的新见解:利润驱动的数据挖掘方法》,《欧洲运筹学杂志》,218,1,211-229(2012)·doi:10.1016/j.ejor.2011.09.031
[52] Vomfell,L。;哈德勒,WK;Lessmann,S.,《利用推特和出租车数据改进犯罪预测》,决策支持系统,113,73-85(2018)·doi:10.1016/j.dss.2018.07.003
[53] Weissbock,J.(2015)。草案分析:揭示潜在客户群成功模式。3月检索。17. 2021.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。