×

基于遗传算法的大数据集LTS算法改进。 (英语) Zbl 1489.62204号

摘要:作者介绍了一种估计大数据集中最小平方(LTS)参数的算法。该算法执行遗传算法搜索,以形成不太可能包含离群值的基本子集。P.J.卢梭K.Van Driessen公司[“计算大数据集的LTS回归”,data Min.Knowl.Discov.12,No.1,29-45(2006;doi:10.1007/s10618-005-0024-4)]建议绘制独立的基本子集并多次迭代C步以最小化LTS准则。作者的算法构造了一个遗传算法来形成一个基本子集,并迭代C步来计算LTS准则的代价值。遗传算法是优化非线性目标函数的成功方法,但在许多情况下速度较慢。算法中的遗传算法配置可以保持简单,因为从数据中搜索了少量观察值。准备了一个R包对算法进行蒙特卡罗模拟。仿真结果表明,该算法的性能适用于即使是大数据集,因为总是要进行少量的试验。

MSC公司:

62J05型 线性回归;混合模型
62层35 鲁棒性和自适应程序(参数推断)
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] DOI:10.1016/S0167-9473(00)00056-6·Zbl 1030.62052号 ·doi:10.1016/S0167-9473(00)00056-6
[2] Ardia,D.,Mullen,K.M.(2010年)。DEoptim包:R.版本2.0-5中的差分进化优化。
[3] DOI:10.1093/biomet/73.3.533·Zbl 0614.62092号 ·doi:10.1093/biomet/73.3.533
[4] DOI:10.1023/A:1008942604045·doi:10.1023/A:1008942604045
[5] 内政部:10.1002/0471725153·doi:10.1002/0471725153
[6] Billor N.,《美国数学与管理科学杂志》,第26页,第229页–(2005年)·Zbl 1244.62024号 ·doi:10.1080/1966324.206.10737673
[7] DOI:10.1016/S0167-9473(99)00101-2·Zbl 1145.62314号 ·doi:10.1016/S0167-9473(99)00101-2
[8] Deb K.,《使用进化算法的多目标优化》(2004)·Zbl 1165.90019号
[9] DOI:10.1016/S0895-7177(02)00069-9·Zbl 1106.62340号 ·doi:10.1016/S0895-7177(02)00069-9
[10] Goldberg D.,搜索、优化和机器学习中的遗传算法(1989)·Zbl 0721.68056号
[11] 内政部:10.1080/01621459.1993.10476407·doi:10.1080/01621459.1993.10476407
[12] Holland J.H.,《自然和人工系统的适应性》(1975)
[13] 内政部:10.2307/2531498·Zbl 0715.62144号 ·doi:10.2307/2531498
[14] 内政部:10.1080/00401706.1985.10488078·doi:10.1080/00401706.1985.10488078
[15] Rousseeuw,P.,Croux,C.,Todorov,V.,Ruckstuhl,A.,Salibian-Barrera,M.,Verbeke,T.,Maechler,M.(2009年)。稳健基础:基本稳健统计。R包版本0.5-0.1。
[16] DOI:10.1002/0471725382·doi:10.1002/0471725382
[17] 内政部:10.1007/s10618-005-0024-4·doi:10.1007/s10618-005-0024-4
[18] DOI:10.1016/S0167-9473(98)00021-8·Zbl 1042.62575号 ·doi:10.1016/S0167-9473(98)00021-8
[19] Venables W.N.,《现代应用统计学与S.》,第4期。编辑(2002)·Zbl 1006.62003号 ·doi:10.1007/978-0-387-21706-2
[20] Willighagen,E.(2005)。Genalg:基于R的遗传算法。R包版本0.1.1。
[21] Wisnowski,J.W.(1999)。线性回归中的多个异常值:检测方法、稳健估计和变量选择的进展。亚利桑那州立大学博士论文。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。