预测学生辍学:UTAD大学的一项研究
摘要
1.简介
2.背景理论与文献综述
3.数据和方法
3.1. 数据收集
3.2. 人工神经网络
3.3. 集成方法
3.3.1. 随机森林
3.3.2. 梯度增强
3.4. 排列特征重要性
3.5. 随机过采样
3.6. 数据预处理
4.结果和讨论
5.结论和未来工作
作者贡献
基金
数据可用性声明
利益冲突
缩写
工具书类
Engrácia,P。; 奥利维拉,J。; DGEEC公司。 Percursos no Ensino Superior 2018年。 在线可用: https://www.dgeec.mec.pt/np4/292/%7B $ clientServletPath%7D/? newsId=516&fileName=DGEEC_SituacaoApos4AnosLicenciatures.pdf (2022年1月17日访问)。 Siri,A.使用人工神经网络预测大学学生辍学。 意大利语。 J.社会学。 教育。 2015 , 7 , 225–247. [ 谷歌学者 ] 基洛加,E.M。; 洛佩斯,J.L。; 卡佩尔,K。; Aguiar,M。; 阿劳约,R.M。; 穆尼奥斯,R。; Villarroel,R。; Cechinel,C.《确定有辍学风险的学生的学习分析方法:远程技术教育课程的案例研究》。 申请。 科学。 2020 , 10 , 3998. [ 谷歌学者 ] [ 交叉参考 ] 穆巴拉克,A.A。; 曹,H。; Hezam,I.M.大规模开放在线课程中学生辍学预测的深度分析模型。 计算。 选举人。 工程师。 2021 , 93 , 107271. [ 谷歌学者 ] [ 交叉参考 ] 达斯,S。; Gary,K。; 坎宁安,J.使用随机森林模型预测自学MOOC课程中的学生辍学。 问询处 2021 , 12 , 476. [ 谷歌学者 ] [ 交叉参考 ] 奥尔本,M。; Mauricio,D.预测大学辍学的神经网络。 国际J·马赫。 学习。 计算。 2019 , 9 , 149–153. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Plagge,M.使用人工神经网络预测一年级传统学生二年级保留率。 2013年4月4日至6日在美国佐治亚州萨凡纳举行的年度东南会议记录; ACM出版社:美国纽约州纽约市,2013年; 第1页。 [ 谷歌学者 ] [ 交叉参考 ] Chung,J.Y。; Lee,S.使用机器学习的高中生辍学预警系统。 儿童。 青年服务生。 版次。 2019 , 96 , 346–353. [ 谷歌学者 ] [ 交叉参考 ] 佩雷拉,R.T。; Zambrano,J.C.决策树在检测学生辍学情况中的应用。 2017年12月18日至21日在墨西哥坎昆举行的2017年IEEE第16届机器学习和应用国际会议(ICMLA)会议记录; 第528-531页。 [ 谷歌学者 ] 弗南德斯·加西亚,a.J。; Preciado,J.C。; 梅尔彻,F。; 罗德里格斯·埃切韦里亚(Rodriguez-Echeverria,R.)。; 科内杰罗,J.M。; Sánchez-Figueroa,F.使用学术数据预测不同阶段大学辍学的真实机器学习经验。 IEEE接入 2021 , 9 , 133076–133090. [ 谷歌学者 ] [ 交叉参考 ] Hutagaol,北卡罗来纳州。; Suharjito,S.在高等教育中使用集成分类器方法对学生辍学进行预测建模。 高级科学。 Technol公司。 工程系统。 J。 2019 , 4 , 206–211. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 亲吻,B。; Nagy,M。; 莫伦泰,R。; Csabay,B.使用高中和第一学期学业成绩指标预测辍学。 2019年11月21日至22日在斯洛伐克斯塔尔·斯莫科维奇举行的2019年第17届新兴在线学习技术和应用国际会议(ICETA)会议记录; 第383–389页。 [ 谷歌学者 ] Dharmawan,T。; Ginardi,H。; Munif,A.使用非学术数据进行辍学检测。 2018年8月7日至8日在印度尼西亚日惹举行的2018年第四届国际科学技术大会(ICST)会议记录; 第1-4页。 [ 谷歌学者 ] 哈斯本,T。; Araya,A。; Villalon,J.利用决策树将课外活动作为高等教育辍学预测因素。 2016年IEEE第16届高级学习技术国际会议(ICALT)会议记录,2016年8月7日至8日,印度尼西亚日惹; 第242-244页。 [ 谷歌学者 ] 北卡罗来纳州姆杜马。; Kalegele,K。; Machuve,D.2019年学生辍学预测的机器学习方法和技术调查。 在线可用: https://dspace.nm-aist.ac.tz/handle/20.50012479/71 (2022年1月17日访问)。 德奥利维拉,C.F。; Sobral,S.R。; 费雷拉,M.J。; Moreira,F.学习分析如何有助于防止学生在高等教育中辍学:系统的文献综述。 大数据认知。 计算。 2021 , 5 , 64. [ 谷歌学者 ] [ 交叉参考 ] Kriesel,D.神经网络。 2007年。在线提供: https://www.dkriesel.com/_media/science/neuronalenetze-en-zeta2-2col-dkrieselcom.pdf (2022年1月17日访问)。 周,Z.H.合奏学习。 在 生物统计学百科全书 ; 施普林格:波士顿,马萨诸塞州,美国,2009年; 第270-273页。 [ 谷歌学者 ] [ 交叉参考 ] Dietterich,T.G.机器学习中的集成方法。 在 多分类器系统国际讲习班 ; 计算机科学课堂讲稿(包括人工智能子系列课堂讲稿和生物信息学课堂讲稿); 施普林格:德国柏林/海德堡,2000年; 第1857卷,第1-15页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 布罗德利,C.E。; Friedl,M.A.根据遥感数据对土地覆盖进行决策树分类。 遥感环境。 1997 , 61 , 399–409. [ 谷歌学者 ] [ 交叉参考 ] Trainor,P.J。; Yampolskiy,R.V.公司。; DeFilippis,A.P.《人工人群在非靶向代谢组学中的智能特征选择:血栓性心肌梗死血液诊断试验的开发应用》。 J.生物识别。 通知。 2018 , 81 , 53–60. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] Natekin,A。; Knoll,A.梯度增强机器,教程。 前面。 神经机器人。 2013 , 7 , 21. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] [ 绿色版本 ] 陈,T。; Guestrin,C.XGBoost:一个可扩展的树木提升系统。 ACM SIGKDD知识发现和数据挖掘国际会议论文集。 计算机协会,美国加利福尼亚州旧金山,2016年8月13日至17日; 第785-794页。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Dorogush,A.V.公司。; 埃尔绍夫,V。; Gulin,A.CatBoost:支持分类功能的梯度增强。 arXiv公司 2018 ,arXiv:1810.11363。 [ 谷歌学者 ] Breiman,L.《随机森林》。 机器。 学习。 2001 , 45 , 5–32. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] He,H。; Garcia,E.A.从不平衡数据中学习。 IEEE传输。 知识。 数据工程。 2009 , 21 , 1263–1284. [ 谷歌学者 ] [ 交叉参考 ] Vishwakarma,G。; Sonpal,A。; Hachmann,J.《标杆管理和不确定性量化指标:化学机器学习的质量、适用性和最佳实践》。 趋势化学。 2021 , 三 , 146–156. [ 谷歌学者 ] [ 交叉参考 ]