×

信息通信技术和统计职业的技能需求:来自网络职位空缺的证据。 (英语) Zbl 07260732号

摘要:收集网络职位空缺的在线招聘门户网站已成为招聘供需匹配的重要媒体。它们还代表了一个日益扩大的研究领域,即应用分析方法,利用创新数据源研究劳动力市场。本文分析了2015年6月至9月期间从几种类型的意大利网络招聘门户网站上获得的意大利网络职位空缺。在描述了如何识别与每个网络空缺相关的职业(分类高达4级),以及使用监督和非监督混合文本挖掘方法在文本中检索相关技能后,我们重点关注了与信息通信技术和统计职位相关的职位空缺。
本文的主要目的是从需求的角度,根据劳动力市场中出现的所需技能来描述这些工作,并确定最能将统计员与其他ICT职业区分开来的技能。因此,使用了几种机器学习技术来评估最能将职业代码与其他工作组区分开来的技能。
在质量控制和消除重复后,该公司收集了超过110000份招聘广告:近6200份被归类为信息通信技术或统计职位(主要由软件开发人员主导)。数据表明,高级统计学家具有优越且异质的专业背景,与理论统计相关,其中分析技能比计算技能更重要。还需要许多面向管理的软技能,这些技能在较低级别的统计学家中缺失,他们只能从事面向通用计算和信息学的技术性工作。

MSC公司:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 经合组织,《2015年数字经济展望》,经合组织出版社,巴黎,2015年。
[2] 塞德福。信息和通信技术专业人员:技能机会和挑战。技能全景,2016年a。http://skillspanorama.cedefop.europa.eu/en/analytical_highligths/information网站通信技术专业人员技能机会。2016年11月13日查阅。
[3] 美国劳工统计局。《职业展望手册》,2015年。2015年12月17日。网址:http://www.bls.gov/ooh/2016年11月17日访问
[4] 塞德福。欧洲的技能短缺和过剩职业。Cedefop简报9115,2016b。http://www.cedefop.europa.eu/en/publications网站资源/出版物/9115。2016年11月13日访问
[5] Lovaglio,P.G.、Vacca,G.和Verzillo,S.,高等教育中的人力资本估算,高级数据分析。分类。10(4)(2016),465–489·Zbl 1414.62501号
[6] 瓦里安,H.《麦肯锡季刊》,2009年1月。
[7] Davenport,T.H.和Patil,D.J.,《数据科学家:21世纪最性感的工作》,HBR公司90(2012),70-76。
[8] Hunter,D.《ISCO‐08的设计原则:全球职业编码的挑战》。国际劳工组织日内瓦。2014年2月10日,在阿姆斯特丹Ingrid研讨会上发表的演讲。https://inclusivegrowth.be/events/call6专家研讨会/计划和演示文稿2016年9月18日查阅
[9] 国际劳工组织,国际职业标准分类ISCO‐08。第1卷:结构、组定义和对应表,国际劳工局,日内瓦,2012年。
[10] Askitas,N.和Zimmermann,K.谷歌计量经济学和失业预测。2009年第4201号IZA讨论文件http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1465341。2015年6月13日访问
[11] Bergamaschi、S.E.Carlini、M.Ceci、B.Furletti、F.Giannotti、D.Malerba、M.Mezzanzanica、A.Monreale、G.Pasi、D.Pedreschi等人,《意大利大数据研究:透视》,工程类2 ( 2016), 163– 170.
[12] D’Amuri,F.和Marcucci,J.谷歌!使用谷歌求职指数预测美国失业率。Nota di lavoro/Eni Enrico Mattei基金会:2010年全球挑战。http://www.econstor.eu/handle/10419/435362015年12月22日访问
[13] Lovaglio,P.G.和Vittadini,G.,具有协变量的冗余分析框架中的结构方程模型,多变量。行为。物件。49 ( 2014), 486– 501.
[14] Lovaglio,P.G.和Verzillo,S.,《高等教育的异质经济回报:来自意大利的证据》,资格。权。50 ( 2016), 791– 822.
[15] Mezzanzanica,M.和Mercorio,F.,大数据支持劳动力市场情报。《大数据技术百科全书》,Springer International,Cham,2018年。
[16] Aggarwal,C.和Zhai,C.,《挖掘文本数据》,施普林格,海德堡,2012年。
[17] Sebastiani,F.,自动文本分类中的机器学习,ACM计算。Surv公司。34( 1) ( 2002), 1– 47.
[18] Amato,F.R.Boselli,M.Cesarini,F.Mercorio,M.Mezzanzanica,V.Moscato,F.Persia,A.Picariello,《挑战:处理网络文本以分类工作机会》,摘自2015年IEEE语义计算国际会议论文集,M.S.Kankanhalli,T.Li,W.Wang,Eds。,电气与电子工程师协会计算机社会出版社,加利福尼亚州阿纳海姆,2015,460-463。
[19] Marrara,S.、Pasi,G.、Viviani,M.、Cesarini,M.,Mercorio,F.、Mezzanzanica,M.和Pappagallo,M.《从网络发现新型劳动力市场职业的语言建模方法》。2017年IEEE/WIC/ACM网络智能国际会议(WI 2017),2017年,第1026-1034页。
[20] Lee,I.,《电子招聘的演变:财富100强职业网站的内容分析》,JECO公司3(3)(2005),57–68。
[21] Singh,A.、Rose,C.、Visweswariah,K.、Chenthamarakshan,V.和Kambhatla,N.。前景:筛选招聘候选人的系统。2010年第19届ACM信息和知识管理国际会议记录,第659-668页。
[22] Yu,K.,Guan,G.和Zhou,M.,2005年。用级联混合模型进行恢复信息提取。计算语言学协会第43届年会会议记录,第499-506页。
[23] Poch,M.、Bel、Espeja,S.和Navio,F.对求职者的工作机会进行排名:从大数据中学习隐藏的知识。第九届语言资源与评估国际会议记录,2014年,第2076-2082页。
[24] Yi,X.、Allan,J.和Croft,W.B.根据相关性模型匹配简历和工作。2007年第30届ACM STGTR国际信息检索研究与开发会议记录,第809-810页。
[25] Hong,W.、Zheng,S.和Wang,H.。基于动态用户配置文件的工作推荐系统。第八届国际计算机科学与教育会议论文集,2013年,第1499-1503页。
[26] Lu,Y.、Helou,E.S.和Gillet,D.分析用户模式,得出求职和招聘网站的设计指南,2012年。第四届普及模式与应用国际会议记录,第11-16页。
[27] Fayyad,U.、Piatetsky‐Shapiro,G.和Smyth,P.,从大量数据中提取有用知识的KDD过程,Commun公司。ACM公司39( 11) ( 1996), 27– 34.
[28] Cavnar,W.B.和Trenkle,J.M.,基于N‐gram的文本分类,《SDAIR‐94会议录》,第三届文档分析和信息检索年度研讨会,密歇根州安娜堡,1994年,161–175。
[29] Cohen,A.M.和Hersh,W.R.,《生物医学文本挖掘当前工作的调查》,简介。生物信息。6 ( 2005), 57– 71.
[30] Liu,X.、Rujia,G.和Liufu,S.。基于N-Gram语言模型的网络新闻标题分类方法。计算机科学与信息处理国际会议记录,2012年,第826-828页,https://doi.org/10.109/CSIP.2012.6308980。
[31] Vapnik,V.和Chervonenkis,A.,关于一类感知的注释,自动远程控制25 ( 1964), 821– 837.
[32] Pedregosa,F.等人,《Scikit‐learn:python中的机器学习》,J.马赫。学习。物件。12 ( 2011), 2825– 2830. ·Zbl 1280.68189号
[33] Bird,S.、Ewan,K.和Edward,L.。《用蟒蛇进行自然语言处理》,O'Reilly Media,2009年·Zbl 1187.68630号
[34] Fan,R.E.等人,LIBLINEAR:大型线性分类库,J.马赫。学习。物件。9 ( 2008), 1871– 1874. ·Zbl 1225.68175号
[35] Tibshirani,R.,通过Lasso回归收缩和选择,J.R.统计。Soc.B公司58 ( 1996), 267– 288. ·Zbl 0850.62538号
[36] Zou,H.和Hastie,T.,通过弹性网进行正则化和变量选择,J.R.统计。Soc.B公司67 ( 2005), 301– 320. ·Zbl 1069.62054号
[37] Fan,J.,评论A.Antoniadis的“统计中的小波:综述”,J.意大利统计协会。6(1997),131–138·Zbl 1454.62116号
[38] Fan,J.和Li,R.,通过非冲突惩罚似然选择变量及其预言属性,美国统计协会。96(2001),1348-1360·Zbl 1073.62547号
[39] Zhao,P.和Yu,B.,关于Lasso的模型选择一致性,J.马赫。学习。物件。7 ( 2006), 2541– 2563. ·兹比尔1222.62008
[40] Wang,H.和Leng,C.,通过最小二乘近似进行统一套索估计,美国统计协会。102 ( 2007), 1039– 1048. ·Zbl 1306.62167号
[41] Xu,J.和Ying,Z.,使用拉索型惩罚的中值回归中的同时估计和变量选择,Ann.Inst.Stat.数学。62 ( 2010), 487– 514. ·Zbl 1440.62280号
[42] Fix,E.和Hodges,J.L.。判别分析,非参数判别:一致性属性,1951年。德克萨斯州伦道夫菲尔德美国空军航空医学院技术报告4·Zbl 0715.62080号
[43] Breiman,L.,《随机森林》,机器。学习。45( 1) ( 2001), 5– 32. ·Zbl 1007.68152号
[44] Aiello,S.、Eckstrand,E.、Fu,A.、Landry,M.和Aboyoun,P.《R和H_2O机器学习》,2016年。http://h2o.ai/resources网站/2016年9月18日访问
[45] Freund,Y.和Schapire,R.,《助推简介》,事务处理。日本。Soc.Artif公司。智力。14 ( 1999), 771– 780.
[46] Friedman,J.H.,《随机梯度增强》,1999年。IMS Reits讲座。
[47] Friedman,J.H.,《贪婪函数近似:梯度提升机》,Ann.统计。29( 5) ( 2001), 1189– 1232. ·Zbl 1043.62034号
[48] Friedman,J.、Hastie,T.和Tibshirani,R.,《加性逻辑回归:增长的统计观点》,Ann.统计。28 ( 2000), 337– 374. ·Zbl 1106.62323号
[49] Mease,D.和Wyner,A.,《与推动统计观点相反的证据》,J.马赫。学习。物件。9 ( 2008), 131– 156.
[50] Boser,B.E.,Guyon,I.M.和Vapnik,V.N.,《最佳边缘分类器的训练算法》,载于《计算学习理论第五届年度研讨会论文集》,ACM出版社,匹兹堡,1992年,144–152页。
[51] Boselli,R.、M.Cesarini、F.Mercorio和M.Mezzanzanica,《数据库中机器学习和知识发现的数据清洗人工智能规划系统——欧洲会议》,ECML PKDD,《计算机科学讲义》,第10536卷,查姆斯普林格,2017c,349–353。
[52] Boselli,R.、M.Cesarini、F.Mercorio和M.Mezzanzanica,《规划与数据清理》,第24届国际自动规划与调度会议(ICAPS),2014年,第439-443页。
[53] Boselli,R.、M.Cesarini、F.Mercorio和M.Mezzanzanica,《基于模型的KDD数据质量活动评估》,通知。流程管理。51( 2) ( 2015), 144– 166.
[54] Gosling,S.D.等人,我们应该相信基于网络的研究吗,美国心理医生。59( 2) ( 2004), 93– 104.
[55] Pedraza,P.、Tijdens,K.和Muñoz de Bustillo,R.WP 60——连续网络自愿调查中的样本偏差、权重和权重效率,2007年。阿姆斯特丹高级劳工研究所。http://ideas.repec.org/p/aia/aiaswp/wp60.html2015年7月23日查阅。
[56] Stefánik,M.,《互联网求职数据作为技能需求信息的可能来源(斯洛伐克大学毕业生的结果)》,《建立在技能预测的基础上——比较方法和应用》,Cedefop,Ed.,Cedefop,卢森堡,2012246-260。
[57] Steinmetz,S.、Tijdens,K.和Pedraza,P.WP 76——比较志愿者网络调查的不同加权程序。AIAS,阿姆斯特丹高级劳工研究所,2009年。http://ideas.repec.org/p/aia/aiaswp/wp76.html。2016年9月18日访问
[58] 网上求职和匹配质量。慕尼黑大学IFO经济研究所,2012年。ftp://ftp.zew.de/pub/zewdocs/veranstaltungen/ITC2012/Papers/Mang.pdf。2016年10月2日访问
[59] Little,R.J.A.和Rubin,D.B.,《缺失数据的统计分析》,John Wiley&Sons,纽约,1987年·Zbl 0665.62004号
[60] Kennan,M.A.等人,《不断变化的工作场所需求:招聘广告告诉我们什么》,Aslib程序。58( 3) ( 2006), 179– 196. https://doi.org/10.1108/00012530610677228。
[61] Michael R.Wade和Michael Parent,《工作技能与绩效之间的关系:网站管理员研究》,J.管理。通知。系统。18( 3) ( 2001), 71– 96. https://doi.org/10.2307/40398554。
[62] Kureková,L.、Beblaví,M.和Haita,C.资质或软技能?研究招聘广告对低技能人才的需求。NEUJOBS 2012年第4.3.3号工作文件。https://papers.ssrn.com/sol3/papers.cfm?abstract_id=24027292017年1月21日访问
[63] Boselli,R.、M.Cesarini、F.Mercorio和M.Mezzanzanica,《将机器学习用于劳动力市场智能》,载于《机器学习和数据库中的知识发现》。ECML PKDD,《计算机科学讲义》,第10536卷,Y.Altun等人,Eds.,Springer,Cham,2017a,2017年。
[64] Boselli,R.,M.Cesarini,S.Marrara,F.Mercorio,M.Mezzanzanica,G.Pasi,M.Viviani,WoLMIS:用于分类网络职位空缺的劳动力市场智能系统,J.智力。通知。系统。(2017b),1-26。
[65] Boselli,R.、M.Cesarini、F.Mercorio和M.Mezzanzanica,《通过模型检查和机器学习技术进行准确数据清理,在计算机和信息科学中的数据管理技术和通信应用》,第178卷,M.Helfert等人,编辑,Springer International,Cham,2015年,62–80页。
[66] Boselli,R.、M.Cesarini、F.Mercorio和M.Mezzanzanica,《基于政策的劳工和医疗数据清洗和整合框架》,知识。发现。数据挖掘LNCS8401 ( 2014), 141– 168.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。