文件Zbl 1502.90094-zbMATH Open

基于非参数Dirichlet过程的潜在因素模型的细粒度工作薪酬基准。（英语） Zbl 1502.90094号

信息J.计算。第5号第34页，2443-2463页（2022）.

摘要：作为人力资源管理中薪酬与福利（C&B）的关键决策过程，工作薪酬基准（JSB）在吸引、激励和留住人才方面发挥着不可或缺的作用。虽然现有的研究主要集中于揭示个人和组织特征以及经济因素对劳动力成本（如薪酬和福利）的基本影响，但很少有研究从实际、数据驱动的角度优化JSB。传统方法因使用小而稀疏的数据以及线性统计模型在实践中的局限性而存在问题。此外，在少数基于机器学习的JSB方法中，还需要解决一些重要的技术问题，例如考虑全新类型的公司、工作或模型可解释性问题时的“冷启动”问题。为此，我们建议通过对大规模、真实世界的在线招聘数据进行建模，从细粒度的角度使用数据驱动技术解决JSB问题。具体来说，我们开发了一个基于非参数Dirichlet过程的潜在因素模型（NDP-JSB）来联合建模公司和职位的潜在表征，然后将该模型应用于基于公司和职位信息的薪酬预测。我们的模型通过解决现有模型中的上述问题，加强了数据驱动方法在JSB优化中的使用。为了进行评估，在两个大规模的真实世界数据集上进行了大量实验。我们的结果验证了NDP-JSB的有效性，并证明了其在提供可解释的薪酬基准方面的优势，以帮助人才管理中的复杂决策过程。
贡献总结：本文将前沿机器学习技术与它们在人力资源实际运筹问题中的实现联系起来。我们致力于优化薪酬匹配工作，通过提出一种数据驱动的方法来捕获用户和公司档案中隐藏的模式，帮助公司为其职位寻求合理的薪酬。这项工作的贡献在于运筹学和计算。我们（1）制定了JSB优化问题，（2）通过开发数据驱动方法以及有效的算法优化来解决它。此外，该方法在解决数据稀疏性和结果可解释性问题方面具有优势。

MSC公司：

90B50型

管理决策，包括多个目标

关键词：

工作工资基准;非参数Dirichlet过程;潜在因素模型;人才管理

软件：

BERT（误码率）

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Adomavicius G，Tuzhilin A（2005）《走向下一代推荐系统：最先进和可能扩展的调查》。IEEE传输。知识数据工程。17（6）：734-749.Crossref，谷歌学者·doi:10.1109/TKDE.2005.99
[2]	Andonie R（2019）学习系统中的超参数优化。J.膜计算。1（4）：279-291.Crossref，谷歌学者·Zbl 1469.68020号 ·doi:10.1007/s41965-019-00023-0
[3]	Antoniak CE（1974）Dirichlet过程的混合及其在贝叶斯非参数问题中的应用。安。统计师。2（6）：1152-1174.谷歌学者Crossref·Zbl 0335.60034号 ·doi:10.1214/aos/1176342871
[4]	Armstrong M（2006）《人力资源管理实践手册》（Kogan Page出版社，伦敦）。谷歌学者
[5]	Barkema HG，Gomez-Mejia LR（1998）《管理薪酬与企业绩效：一般研究框架》。阿卡德。管理J。41（2）：135-145.谷歌学者Crossref·doi:10.5465/257098
[6]	Bergmann T，Scarpello V（2002）薪酬决策（俄亥俄州梅森西南郡）。谷歌学者
[7]	Berkowitz L、Fraser C、Treasure FP、Cochran S（1987）《薪酬、公平、工作满意度和薪酬满意度比较》。J.应用。心理学。72（4）：544-551.Crossref，谷歌学者·doi:10.1037/0021-9010.72.4.544
[8]	Blankmeyer E、LeSage JP、Stutzman J、Knox KJ、Pace RK（2011）《薪酬基准中的同辈群体依赖性：统计模型》。管理决策经济学。32（2）:91-104.谷歌学者
[9]	Blei DM，Jordan MI（2006），Dirichlet工艺混合物的变分推断。贝叶斯分析。1（1）：121-143.Crossref，谷歌学者·Zbl 1331.62259号 ·doi:10.1214/06-BA104
[10]	Blei DM、Ng AY、Jordan MI（2003）《潜在迪里克莱分配》。J.机器学习。物件。3（1月）：993-1022.谷歌学者·Zbl 1112.68379号
[11]	Brick IE，Palmon O，Wald JK（2006）首席执行官薪酬、董事薪酬和公司绩效：任人唯亲的证据？J.公司财务12（3）:403-423.Crosref，谷歌学者·doi:10.1016/j.jcorpfin.2005.08.005
[12]	Bühlmann P，Van De Geer S（2011）高维数据统计：方法、理论与应用（施普林格科技与商业媒体，柏林）。Crossref，谷歌学者·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[13]	Chang E，Hahn J（2006），绩效工资是否提高了集体主义员工的分配公平感？人员版次。35（4）:397-412.Crossref，谷歌学者·doi:10.1108/00483480610670571
[14]	Chaturvedi A，Green PE，Caroll JD（2001）K-modes聚类。J.分类18（1）：35-55.Crossref，谷歌学者·Zbl 1047.91566号 ·doi:10.1007/s00357-001-0004-3
[15]	Chen X，Xia Y，Jin P，Carroll J（2015）具有描述性LDA的无数据文本分类。Bonet B，Koenig S编辑，Proc。第29届AAAI人工智能大会，（德克萨斯州奥斯汀，AAAI出版社），2224-231.谷歌学者
[16]	Cheng S，Dai R，Xu W，Shi Y（2006）数据挖掘和知识管理研究及其在中国经济发展中的应用：意义和趋势。国际。J.通知。技术决策5（4）：585-596.Crossref，谷歌学者·doi:10.1142/S021962200600226X
[17]	Correll SJ、Benard S、Paik I（2007年）《找工作：是否有做母亲的惩罚？》？阿默尔。J.社会学。112（5）：1297-1338.Crossref，谷歌学者·doi:10.1086/511799
[18]	Dahl DB（2006）通过Dirichlet过程混合模型对表达数据进行基于模型的聚类。Do K，Müller P，Vannucci M，编辑。基因表达和蛋白质组学的贝叶斯推断（英国剑桥大学出版社），201-218.Crossref，谷歌学者·doi:10.1017/CBO9780511584589.011
[19]	Devlin J，Chang M-W，Lee K，Toutanova K（2018）Bert:语言理解深度双向变换器的预训练。10月11日提交的预印本，https://arxiv.org/abs/1810.04805.谷歌学者
[20]	Duchi J、Shalev-Shwartz S、Singer Y、Chandra T（2008）高维学习中对l1球的有效投影。张泽主编。国际25强。Conf.机器学习。（计算机械协会，纽约，NY），272-279.谷歌学者
[21]	Edwards JE、Scott JC、Raju NS（2003）人力资源计划评估手册（SAGE Publications，Inc.，千橡，CA）。Crossref，谷歌学者·doi:10.4135/9781412986199
[22]	Escobar MD，West M（1995），贝叶斯密度估计和混合推理。J.Amer。统计师。协会。90（430）：577-588.Crossref，谷歌学者·Zbl 0826.62021号 ·doi:10.1080/01621459.1995.10476550
[23]	Faulkender M，Yang J（2010）《黑匣子内部：薪酬对等群体的角色和组成》。《金融经济学杂志》。96（2）：257-270.Crossref，谷歌学者·doi:10.1016/j.jfineco.2010.01.006
[24]	Ferguson TS（1973）一些非参数问题的贝叶斯分析。安。统计师。1（2）：209-230.Crossref，谷歌学者·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[25]	Ferris GR、Witt LA、Hochwarter WA（2001）社会技能和一般心理能力对工作绩效和工资的影响。J.应用。心理学。86（6）：1075-1082.Crossref，谷歌学者·doi:10.1037/0021-9010.86.6.1075
[26]	Frydman C，Jenter D（2010）首席执行官薪酬。财务经济年度收益。2（1）：75-102.Crossref，谷歌学者·doi:10.1146/anurev-financial-120209-133958
[27]	Ghahramani Z（2015）概率机器学习和人工智能。性质521（7553）：452-459.Crossref，谷歌学者·doi:10.1038/nature14541
[28]	Gomez L、Patel Y、Rusiñol M、Karatzas D、Jawahar C（2017）通过将图像嵌入文本主题空间，实现视觉特征的自我监督学习。Bertino E，Chen Y编辑，Proc。IEEE配置计算。视觉模式识别（IEEE Computer Society，Los Alamitos，CA），4230-4239。谷歌学者
[29]	龚JJ，李S（2013）首席执行官激励与盈利预测。修订数量。财务会计40（4）：647-674.Crossref，谷歌学者·doi:10.1007/s11156-012-0291-2
[30]	Guo Y，Barnes SJ，Jia Q（2017）从在线评级和评论中挖掘意义：使用潜在狄利克雷分配的游客满意度分析。旅游管理59:467-483.Crossref，谷歌学者·doi:10.1016/j.tourman.2016年9月16日
[31]	Hamlen KR，Hamlen WA（2016），教师工资作为MBA项目学生离职工资的预测因素。J.Ed.公共汽车。91（1）：38-44.Crossref，谷歌学者·doi:10.1080/08832323.2015.1110552
[32]	Hofmann T（1999）概率潜在语义索引。Lang J，编辑Sigir’99：Proc。第22届国际年会。ACM SIGIR Conf.Res.Development in Informat公司。检索（计算机械协会，纽约州纽约市），50-57谷歌学者
[33]	Ishwaran H，James LF（2001），吉布斯（Gibbs）《破胶前期的取样方法》。J.Amer。统计师。协会。96（453）：161-173.Crossref，谷歌学者·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[34]	Jerrim J（2015）大学生比劳动力中的年轻人更能预测未来收入吗？经济学编辑。23（2）：162-179.谷歌学者
[35]	Kenthapadi K、Chudhary A、Ambler S（2017a）LinkedIn薪资：一个安全收集和向求职者展示结构化薪酬见解的系统。Bertino E、Chen Y主编，2017年IEEE交响乐团。隐私感知计算。（IEEE，计算机学会，加利福尼亚州洛斯阿拉米托斯），13-24.谷歌学者
[36]	Kenthapadi K，Ambler S，Zhang L，Agarwal D（2017b）《为世界带来薪酬透明度：通过LinkedIn薪酬计算强大的薪酬洞察力》。Lim E-P，Winslett M编辑，Proc。2017年ACM会议通知。知识管理（ACM，纽约州纽约市），447-455.谷歌学者
[37]	Khongchai P，Songmuang P（2016a）使用数据挖掘技术实施薪酬预测系统以提高学生的动机。Gaol FL，Theeramunkong T，Papadopo GA，编辑：2016年第11届国际。Conf.知识告知。创意支持系统（IEEE，日惹，印尼），1-6谷歌学者
[38]	Khongchai P，Songmuang P（2016b）薪酬预测系统的随机森林，以提高学生的动机。Manfredi G、Pietro G编辑，2016年第12期国际。Conf.Signal-Image Tech.基于互联网的系统（IEEE，Los Alamitos，CA），637-642.谷歌学者
[39]	Kim D，Yum B-J（2005）基于迭代主成分分析的协同过滤。专家系统应用。28（4）：823-830.谷歌学者Crossref·doi:10.1016/j.eswa.2004年12月37日
[40]	Koller D，Friedman N（2009）概率图形模型：原理和技术（麻省理工学院出版社，马萨诸塞州剑桥）。谷歌学者·Zbl 1183.68483号
[41]	Koren Y（2008）因子分解与邻域相遇：一个多方面的协作过滤模型。Li Y，Liu B，编辑：Proc。第14届ACM SIGKDD国际。Conf.知识发现数据挖掘，（ACM，纽约州纽约市），426-434.谷歌学者
[42]	Koren Y，Bell R，Volinsky C（2009）推荐系统的矩阵分解技术。计算。42（8）：30-37.Crossref，谷歌学者·doi:10.1109/MC.2009.263
[43]	Lazar A（2004）通过支持向量机进行收入预测。Tourassi GD，编辑：国际。Conf.机器学习与应用，（ICMLA），143-149。Crossref，谷歌学者·doi:10.1109/CIMLA.2004.1383506
[44]	Le Q，Mikolov T（2014）句子和文档的分布式表示。Xing EP，Jebara T，编辑：国际。Conf.机器学习。（PMLR），1188-1196.谷歌学者
[45]	Lee DD，Seung HS（1999）通过非负矩阵分解学习对象的部分。性质401（6755）:788-791.Crossref，谷歌学者·Zbl 1369.68285号 ·doi:10.1038/44565
[46]	Lee DD，Seung HS（2001）非负矩阵分解算法。高级神经信息。处理系统13:556-562.谷歌学者
[47]	L'heureux A、Grolinger K、Elyamany HF、Capretz MA（2017）《大数据机器学习：挑战与方法》。IEEE接入5:7776-7797.谷歌学者Crossref·doi:10.1109/ACCESS.2017.2696365
[48]	Lin H、Zhu H、Zoo Y、Zhuc C、Wu J、Xiong H（2017）《合作公司简介：从员工的角度看问题》。Singh S，Markovitch S，eds.第31届AAAI人工智能大会（AAAI Press，San Francisco，CA），1417-1423.谷歌学者
[49]	Luo X，Zhou M，Xia Y，Zhu Q（2014）一种基于非负矩阵分解的高效推荐系统协同过滤方法。IEEE传输。工业。信息学10（2）：1273-1284.Crossref，谷歌学者·doi:10.1109/TII.2014.2308433
[50]	Meng Q，Zhu H，Xiao K，Xiong H（2018）《人才招聘的智能薪酬基准：整体矩阵分解法》。Zhu F，Yu J主编，2018 IEEE国际。Conf.数据挖掘（IEEE Computer Society，Los Alamitos，CA），337-346.谷歌学者
[51]	Mnih A，Salakhutdinov RR（2008）概率矩阵分解。Platt JC、Koller D、Singer Y、Rowies ST编辑。程序。第20国际。Conf.高级神经信息。处理系统NIPS’07（Curran Associates Inc.，纽约州Red Hook），20:1257-1264.谷歌学者
[52]	Neal RM（2000）Dirichlet过程混合模型的马尔可夫链抽样方法。J.计算。图形统计。9（2）：249-265.谷歌学者
[53]	Nguyen V，Gupta S，Rana S，Li C，Venkatesh S（2016）多标签分类的贝叶斯非参数方法。Durrant RJ，Kim K编辑，《亚洲计算机学习》。，第63卷（新西兰汉密尔顿怀卡托大学），254-269.谷歌学者
[54]	Ocepek U，Rugelj J，BosnićZ（2015）《冷启动示例的改进矩阵分解建议》。专家系统应用。42（19）：6784-6794.Crossref，谷歌学者·doi:10.1016/j.eswa.2015.04.071
[55]	Paterek A（2007）《改进协同滤波的正则奇异值分解》，Liu B主编，Proc。KDD杯和研讨会（纽约州纽约市），5-8。谷歌学者
[56]	Pavlinek M，Podgorelec V（2017）基于自学训练和LDA主题模型的文本分类方法。专家系统应用。80:83-93.Crossref，谷歌学者·doi:10.1016/j.eswa.2017.03.020
[57]	Peng L，Röell A（2008）操纵与股权补偿。阿默尔。经济。版次。98（2）：285-290.Crossref，谷歌学者·doi:10.1257/aer.98.2.285
[58]	Peng L，Röell A（2014）管理激励与股价操纵。J.金融69（2）：487-526.Crossref，谷歌学者·doi:10.1111/jofi.12129
[59]	Ramasamy R（2015）《信息通信技术专业人员工资档案的制作：从结构化数据库转向大数据分析》。统计师。国际天文学联合会31（2）：177-191.Crossref，谷歌学者·doi:10.3233/sji-150891
[60]	Ranjbar M，Moradi P，Azami M，Jalili M（2015）用于提高协同过滤系统准确性的基于插补的矩阵分解方法。工程应用。人工智能46:58-66.Crossref，谷歌学者·doi:10.1016/j.engappai.2015.08.010
[61]	Rasiwasia N，Vasconcelos N（2013）图像分类的潜在Dirichlet分配模型。IEEE传输。模式分析。机器智能35（11）：2665-2679.Crossref，谷歌学者·doi:10.1109/TPAMI.2013.69
[62]	Sarwar B，Karypis G，Konstan J，Riedl J（2001）基于项目的协同过滤推荐算法。Shen VY，Saito N编辑，Proc。第十届国际。Conf.万维网（计算机械协会，纽约，NY），285-295.谷歌学者
[63]	Scarpello V，Jones FF（1996）《为什么公正在薪酬决策中至关重要》。《器官杂志》。行为。17（3）：285-299.Crossref，谷歌学者·doi:10.1002/（SICI）1099-1379（199605）17:3<285:：AID-JOB750>3.0.CO；2-0
[64]	Shollo A，Kautz K（2010）《走向商业智能的理解》。Green P、Rosemann M编辑。第21届澳大拉西亚会议通知。系统。（ACIS 2010），澳大利亚布里斯班。谷歌学者
[65]	Steiger DM（2010）《作为知识创造的决策支持：商业智能设计理论》。国际。J.总线。情报研究。1（1）:29-47.Crossref，谷歌学者·doi:10.4018/jbir.210071703
[66]	Teh YW、Jordan MI、Beal MJ、Blei DM（2005）《相关群体之间的共享集群：分层Dirichlet过程》。Saul L、Weiss Y、Bottou L编辑。高级神经信息。处理系统（麻省理工学院出版社，马萨诸塞州剑桥），17:1385-1392.谷歌学者
[67]	Terpstra DE，Honoree AL（2003）外部、内部、个人和程序公平对支付满意度的相对重要性：程序公平对员工来说可能比组织认为的更重要。薪酬福利收入。35（6）：67-74.Crossref，谷歌学者·doi:10.1177/0886368703259005
[68]	Tirunillai S，Tellis GJ（2014）《从在线聊天中挖掘营销意义：使用潜在Dirichlet分配对大数据进行战略品牌分析》。J.营销研究。51（4）：463-479.Crossref，谷歌学者·doi:10.1509/jmr.12.0106
[69]	Van der Wal Z，Oosterbaan A（2013）政府还是企业？确定MPA和MBA学生职业偏好的决定因素。公共人事管理42（2）：239-258.Crossref，谷歌学者·doi:10.1177/0091026013487123
[70]	Wainwright MJ，Jordan MI（2008）图形模型、指数族和变分推理（现为Publishers，Inc.，荷兰代尔夫特）。谷歌学者
[71]	Wan C，Peng Y，Xiao K，Liu X，Jiang T，Liu D（2020）联合提取产品方面和意见的关联约束LDA模型。通知。科学。519:243-259.Crossref，谷歌学者·doi:10.1016/j.ins.2020.01.036
[72]	Wang C，Blei DM（2011）推荐科学文章的协作主题建模。Apte C，Ghosh J，编辑程序。第17届ACM SIGKDD国际。Conf.知识发现数据挖掘（ACM，纽约州纽约市），448-456.谷歌学者
[73]	Xue Y，Liao X，Carin L，Krishnapuram B（2007）《Dirichlet过程先验分类的多任务学习》。J.机器学习。物件。8:35-63.谷歌学者·Zbl 1222.68338号
[74]	Yang C，Liu Z，Zhao D，Sun M，Chang E（2015）《文本信息丰富的网络表征学习》。Yang Q，Wooldridge M，第24版国际出版社。人工智能联合会议（AAAI Press，San Francisco，CA），2111-2117.谷歌学者
[75]	姚S，于德，肖克（2019）通过潜在语义插补增强领域词嵌入。程序。第25届ACM SIGKDD国际。Conf.Knowledge Discovery Data Mining（纽约计算机械协会）557-565.谷歌学者
[76]	Zhang J，Ghahramani Z，Yang Y（2005）在线文档聚类的概率模型及其在新颖性检测中的应用。Saul L、Weiss Y、Bottou L编辑。高级神经信息。处理系统（麻省理工学院出版社，马萨诸塞州剑桥），17:1617-1624.谷歌学者
[77]	Zhang X，Li W，Nguyen V，Zhuang F，Xiong H，Lu S（2018b）多任务多标签学习中贝叶斯非参数方法的标签敏感任务分组。Lang J编辑。程序。第27届国际。人工智能联合会（AAAI出版社，加利福尼亚州旧金山），3125-3131.Crossref，谷歌学者·doi:10.24963/ijcai.2018/434
[78]	Zhang L，Xiao K，Zhu H，Liu C，Yang J，Jin B（2018a）Caden:一个用于财务意见挖掘的上下文深层嵌入网络。Zhu F，Yu J主编，2018 IEEE国际。Conf.数据挖掘（IEEE Computer Society，Los Alamitos，CA），757-766.谷歌学者

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

基于非参数Dirichlet过程的潜在因素模型的细粒度工作薪酬基准。 （英语） Zbl 1502.90094号

MSC公司：

关键词：

软件：

参考文献：

基于非参数Dirichlet过程的潜在因素模型的细粒度工作薪酬基准。（英语） Zbl 1502.90094号