×

区间值数据的聚类非线性回归算法。 (英语) Zbl 1484.62089号

摘要:数据分析中需要区间值变量,因为这类数据表示误差测量中存在的不确定性或数据的自然可变性。目前,非常需要以管理区间值数据为目标的方法和算法。因此,本文提出了一种区间值数据的中心和范围聚类非线性回归算法。该算法将k-means型算法与区间值数据的中心和区间线性和非线性回归方法相结合,目的是同时识别数据的划分以及拟合在区间中心和区间上的相关回归模型,每个聚类一个。该方法能够根据优化准则自动选择最佳的中心和范围(线性和/或非线性)函数对。为了评估该算法的参数估计和预测性能,对合成数据集进行了仿真研究。最后,在实际数据集上进行了应用,并将该方法的预测精度与线性情况进行了比较。结果表明,该方法在合成数据集和实际数据集上都表现良好。

MSC公司:

62J02型 一般非线性回归
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bagirov,A.M。;Ugon,J。;Mirzayeva,H.G.,基于平滑技术的聚类线性回归算法,Optim。莱特。,9, 375-390 (2015) ·Zbl 1311.90106号
[2] 布兰科·费尔南德斯,A。;科拉尔,N。;González-Rodríguez,G.,基于集合算法的区间数据的灵活简单线性模型估计,计算。统计数据分析。,55, 9, 2568-2578 (2011) ·Zbl 1464.62030号
[3] (Bock,H.-H.;Diday,E.,《符号数据分析,从复杂数据中提取统计信息的探索方法》(2000),施普林格出版社:施普林格-柏林,海德堡)·Zbl 1039.62501号
[4] Bougeard,S。;阿卜迪,H。;萨波尔塔,G。;Niang,N.,《随机过程的聚类回归》,高级数据分析。分类。,12, 285-313 (2018) ·Zbl 1414.62231号
[5] Boukezzoula,R。;Galichet,S。;Coquin,D.,《从模糊回归到逐步回归:基于区间的分析和扩展》,《信息科学》。,441, 18-40 (2018) ·Zbl 1440.62292号
[6] Breiman,L.,叠加回归,马赫数。学习。,第24页,第1页,第49-64页(1996年)·Zbl 0849.68104号
[7] 布里托,P。;Duarte Silva,A.P.,用正态和偏态分布建模区间数据,J.Appl。统计,39,1,3-20(2012)·Zbl 1514.62081号
[8] Carbonneau,R.A。;卡波罗西,G。;Hansen,P.,通过列生成增强启发式、排序和结束子集优化的全局最优聚类回归,J.Classif。,31, 219-241 (2014) ·Zbl 1360.62318号
[9] 塞尔尼,M。;Antoch,J。;Hladík,M.,《关于涉及不确定、不确定或区间数据的线性回归模型的可能性方法》,《信息科学》。,244, 26-47 (2013) ·Zbl 1357.62237号
[10] 陈,Y。;Miao,D.,梯度下降法颗粒回归,信息科学。,537, 246-260 (2020) ·Zbl 1479.68004号
[11] 西米诺,M.G.C.A。;拉泽里尼,B。;马塞洛尼,F。;Pedrycz,W.,颗粒数据回归的遗传区间神经网络,信息科学。,257, 313-330 (2014)
[12] 德卡瓦略,F.A.T。;布里托,P。;Bock,H.-H.,基于(l_2)距离的区间数据动态聚类,计算。统计,21,2,231-250(2006)·兹比尔1114.62070
[13] 德卡瓦略,F.A.T。;de Souza,R.M.C.R。;Chavent,M。;Lechevallier,Y.,《符号区间数据的自适应hausdorff距离和动态聚类》,模式识别。莱特。,27, 3, 167-179 (2006)
[14] F.A.T.de Carvalho,G.Saporta,D.N.Queiroz,区间值数据的聚类中心和区间回归模型,载于:Y.Lechevallier,G.Saporta,(编辑),《2010年COMPSTAT会议录》,Physica-Verlag HD,2010年,第461-468页·Zbl 1436.62371号
[15] de Souza,R.M.C.R。;de Carvalho,F.A.T.,基于城市街区距离的区间数据聚类,模式识别。莱特。,25, 3, 353-365 (2004)
[16] 德萨尔博,W.S。;Cron,W.L.,《聚类线性回归的最大似然方法》,J.Classif。,5, 2, 249-282 (1988) ·Zbl 0692.62052号
[17] Dias,S。;Brito,P.,《离经叛道:区间数据的新线性模型》,欧洲期刊Oper。第258号、第3号、第1118-1130号决议(2017年)·Zbl 1395.62199号
[18] Diday,E。;Noirhomme-Frature,M.,《符号数据分析和SODAS软件》(2007),威利父子:威利父女新泽西·Zbl 1275.62029号
[19] 迪迪,E。;Simon,J.C.,聚类分析,(Fu,K.S.,数字模式识别(1980),Springer),47-94·Zbl 0331.62043号
[20] 丁·W。;林,C.-T。;Liew,A.W.-C。;Triguero,I。;Luo,W.,生物医学数据分析中颗粒数据挖掘的当前趋势,信息科学。,510, 341-343 (2020) ·Zbl 1461.62187号
[21] Dong,X。;Yu,Z。;曹伟。;Shi,Y。;马奇,合奏学习调查,前沿。计算。科学。,14, 241-258 (2020)
[22] D’Urso,P。;马萨里,R。;Santoro,A.,一类模糊聚类回归模型,Inf.Sci。,180, 24, 4737-4762 (2010) ·兹比尔1204.62112
[23] Fagundes,R.A.A。;de Souza,R.M.C.R。;Cysneiros,F.J.A.,区间核回归,神经计算,128,371-388(2014)
[24] Lima Filho,洛杉矶医学硕士。;达席尔瓦,J.A.A。;Cordeiro,G.M。;Ferreira,R.L.C.,使用具有不同对称误差分布的查普曼-里查兹模型模拟桉树无性系的生长,Ciéncia Florestal,22,4,777-785(2012)
[25] 加西亚·埃斯库德罗兰,洛杉矶。;Gordaliza,A。;Mayo-Iscar,A。;San Martín,R.,通过修剪的稳健聚类线性回归,计算。统计数据分析。,54, 12, 3057-3069 (2010) ·Zbl 1284.62198号
[26] Giordani,P.,《区间值数据的拉索约束回归分析》,《高级数据分析》。分类。,9, 1, 5-19 (2015) ·Zbl 1414.62305号
[27] 郝,P。;Guo,J.,区间值符号数据回归的约束中心和范围联合模型,计算。统计数据分析。,116, 106-138 (2017) ·Zbl 1466.62087号
[28] 胡,Q。;米·J。;Chen,D.,大数据时代基于粒度计算的机器学习,信息科学。,378242-243(2017)·Zbl 1429.68008号
[29] Jeon,Y。;Ahn,J。;Park,C.,《区间值数据分析的非参数核方法》,《技术计量学》,57,4,566-575(2015)
[30] 柯克帕特里克,S。;盖拉特,C.D。;Vecchi,M.P.,《模拟退火优化》,《科学》,220,4598,671-680(1983)·Zbl 1225.90162号
[31] Lau,K。;Leung,P。;Tse,K.,《聚类回归模型及其扩展的数学规划方法》,欧洲期刊Oper。决议,116,3,640-652(1999)·Zbl 0993.62052号
[32] Di Mari,R。;Rocci,R。;Gattone,S.A.,带软尺度约束的聚类线性回归建模,国际期刊近似推理。,91, 160-178 (2017) ·Zbl 1429.62286号
[33] 马辛奇,M.R。;Selamat,A。;易卜拉欣,S。;Fujita,H.,使用颗粒盒回归消除离群值,Inf.Fusion,27,161-169(2016)
[34] A.Mazza,A.Punzo,多元污染正态回归模型的混合,《统计论文》61(2020)787-822·Zbl 1435.62238号
[35] 利马·内托,E.A。;Anjos,U.U.,基于连接函数的区间值变量回归模型,J.Appl。统计,422010-2029(2015)·Zbl 1514.62515号
[36] 利马·内托,E.A。;De Carvalho,F.A.T.,将线性回归模型拟合到符号区间数据的中心和范围方法,计算。统计数据分析。,521500-1515(2008年)·Zbl 1452.62493号
[37] 利马·内托,E.A。;De Carvalho,F.A.T.,符号区间值变量的约束线性回归模型,计算。统计数据分析。,54, 333-347 (2010) ·Zbl 1464.62055号
[38] 利马·内托,E.A。;Cordeiro,G.M。;De Carvalho,F.A.T.,区间值变量的双变量符号回归模型,J.Stat.Compute。模拟。,81, 1727-1744 (2011) ·Zbl 1431.62328号
[39] Eufrásio de A Lima Neto,Francisco de AT de Carvalho,应用于区间值数据的非线性回归,模式分析。申请。20(3) (2017) 809-824.
[40] Pedrycz,W.,《数据分析的粒度计算:以人为中心的计算宣言》,IEEE/CAA J.Autom。罪。,5, 1025-1034 (2018)
[41] 彼得斯,G。;Lacic,Z.,《颗粒盒回归中的异常值处理》,《信息科学》。,212, 44-56 (2012)
[42] Pimentel,B.A。;de Souza,R.M.C.R.,区间值科学生产数据中的加权多元模糊C-均值方法,专家系统。申请。,41, 3223-3236 (2014)
[43] Preda,C。;Saporta,G.,随机过程的聚类pls回归,计算。统计数据分析。,49, 99-108 (2005) ·Zbl 1429.62299号
[44] 邵彤,C。;康平,L。;Miin Shen,Y.,逐步可能性c-反应,信息科学。,334-335, 307-322 (2016)
[45] Späth,H.,《算法39聚类线性回归》,《计算》,22,4,367-373(1979)·Zbl 0387.65028号
[46] 苏,S.-F。;佩德里茨,W。;Hong,T.-P。;de Carvalho,F.A.T.,《颗粒/符号数据处理特刊》,IEEE Trans。赛博。,46, 342-343 (2016)
[47] 苏振国。;Wang,P.H。;Li,Y.G。;Zhou,Z.K.,使用期望最大化算法从区间值数据进行参数估计,J.Appl。统计,85,320-338(2015)·Zbl 1457.62232号
[48] 维卡里,D。;Vichi,M.,异质数据的多元线性回归,J.Appl。统计,40,6,1209-1230(2013)·Zbl 1514.62916号
[49] 吴琼。;Yao,W.,分位数回归的混合,计算。统计数据分析。,93, 162-176 (2016) ·Zbl 1468.62211号
[50] 左,H。;张,G。;佩德里茨,W。;Behbood,V.公司。;Lu,J.,高木关模糊模型中的粒度模糊回归域自适应,IEEE Trans。模糊系统。,26, 847-858 (2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。