×

具有直方图值变量的线性回归模型。 (英语) Zbl 07260426号

摘要:直方图值变量是在符号数据分析其中每个被分析的实体对应于可以由直方图或分位数函数表示的分布。这类数据的线性回归模型必然比经典模型的简单概括更复杂:参数不能为负;变量之间的线性关系必须允许是正的或逆的。在这项工作中,我们提出了一种新的直方图值变量线性回归模型来解决这个问题,命名为分布和对称分布回归模型为了确定该模型的参数,有必要求解一个二次优化问题,该问题受未知量的非负约束;预测分布和观测分布之间的误差测量使用马尔洛距离。与经典分析一样,该模型与一个良好的度量值相关,其值在0到1之间。利用该模型,给出了实际和模拟数据的应用。

MSC公司:

62至XX 统计
68倍 计算机科学

软件:

SODAS公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.Diday,《聚类中的符号方法和相关数据分析方法:基本选择》,《数据分析的分类和相关方法》,《国际船级社联合会会议记录》(IFCS’87),H.-H.Bock主编,荷兰阿姆斯特丹,1988年,673-684。
[2] J.Arroyo,M´etodos de Predicci´on para series temporales de Intervalos e Historgramas,Tesis para la obtenci´on del t´11 tulo de Doctor;科米拉天主教大学,马德里,2008年。
[3] L.Billard,E.Diday,《符号数据分析:概念统计和数据挖掘》,奇切斯特,约翰威利父子公司,2006年·Zbl 1117.62002号
[4] L.Billard和E.Diday,《从数据统计到知识统计:符号数据分析》,《美国统计协会杂志》98(2003),(462)470-487。
[5] H-H Bock,E.Diday编辑,《符号数据分析:从复杂数据中提取统计信息的探索方法》,柏林-海德堡,施普林格-弗拉格出版社,2000年·Zbl 1039.62501号
[6] E.Diday和M.Noirhomme Fraiture编辑,《符号数据分析和SODAS软件》,Chichester,John Wiley&Sons,Ltd.,2008年·Zbl 1275.62029号
[7] M.Noirhomme-Frature和P.Brito,《远远超越经典数据模型:符号数据分析》,《统计分析数据最小值》4(2011),(2)157-170·Zbl 07260275号
[8] L.Billard和E.Diday符号回归分析,《在分类、聚类和数据分析中》,国际分类协会联合会会议记录(IFCS’02),K.Jajuga、A.Sokolowski和H.-H.Bock编辑,海德堡,斯普林格,2002年,281-288·Zbl 1185.62129号
[9] A.Irpino和R.Verde,《直方图符号数据分层聚类的基于Wasserstein的新距离》,《分类和数据分析》,《国际分类协会联合会会议记录》(IFCS’06),V.Batagelj,H.-H.Bock和A.Ferligoj编辑,海德堡,斯普林格,2006,185-192。
[10] O.Rodriguez、E.Diday和S.Winsberg,直方图数据主成分分析的推广,第四届欧洲数据库知识发现原则与实践会议论文集,符号数据分析研讨会;法国里昂,2000年。
[11] O.Rodriguez和A.Pacheco,直方图主成分分析的应用,第十五届欧洲机器学习会议(ECML)和第八届欧洲数据库知识发现原则与实践会议(PKDD),意大利比萨,2004年。
[12] P.Brito和G.Polaillon,《按间隔进行概括的概念聚类》,《新技术评论》E.23(2012),35-40。
[13] P.Brito和M.Chavent,区间和直方图值数据的分割单值聚类,《第一届模式识别应用和方法国际会议论文集》(ICPRAM 2012),葡萄牙维拉莫拉,2012年。
[14] J.Arroyo和C.Mat´e,《用K近邻法预测直方图时间序列》,《国际预测杂志》第25期(2009年),192-207年。
[15] R.Verde和A.Irpino,基于Wasserstein距离的直方图数据的普通最小二乘法,《2010年COMPSTAT会议录》,Y.Lechevallier和G.Saporta编辑,海德堡,Physica Verlag,2010年,581-589·兹比尔1436.62334
[16] L.Billard和E.Diday关于阀间值数据的回归分析,In data analysis,Classification and Related Methods。《国际船级社联合会会议记录》(IFCS'00),H.A.L.Kiers、J.P.Rasson、P.J.F.Groenen和M.Schader编辑,海德堡,施普林格,2000年,369-374·Zbl 1026.62073号
[17] E.A.L.Neto和F.A.T.De Carvalho,符号区间值变量的约束线性回归模型,计算统计数据分析54(2010),333-347·Zbl 1464.62055号
[18] E.A.L.Neto和F.A.T.De Carvalho,将线性回归模型拟合到符号间隔数据的中心和范围方法,《计算统计数据分析》52(2008),1500-1515·Zbl 1452.62493号
[19] A.Irpino和R.Verde。数字符号变量的线性回归:基于Wasserstein距离的普通最小二乘法。《高级数据分析分类》9(2015),(1)81-106·Zbl 1414.62306号
[20] P.Brito和A.P.Duarte Silva,用正态和偏态分布建模区间数据,《应用统计杂志》39(2011),(1)3-20·Zbl 1514.62081号
[21] E.A.L.Neto、G.M.Cordeiro和F.A.T.De Carvalho,区间值变量的二元符号回归模型,J Stat Comput Simulation 81(2011),1727-1744·Zbl 1431.62328号
[22] R.Williamson,概率算术。1989年澳大利亚昆士兰大学电气工程系博士学位论文。
[23] R.Verde和A.Irpino,使用马哈拉诺比斯·瓦瑟斯坦距离比较直方图数据,《2008年COMPSTAT会议录》P.Brito主编,海德堡,Physica Verlag,2008年,77-89·Zbl 1147.62054号
[24] R.Verde和A.Irpino,直方图数据的动态聚类:使用正确的度量,《数据分析和分类的选定贡献》,P.Brito、P.Bertrand、G.Cucumel和F.De Carvalho编辑,海德堡,施普林格,2007年,123-134·Zbl 1151.62335号
[25] A.Colombo和R.Jaarsma,组合随机变量的强大数值方法,IEEE Trans Rel 29(1980),(2)126-129·Zbl 0432.65069号
[26] J.Case,《区间算术与分析》,《大学数学杂志》30(1999),(2)106-111·Zbl 0995.65504号
[27] A.Irpino和E.Romano,大数据集的最佳直方图表示:Fisher与分段线性近似。在《公民行为》(Actes des cinquièmes journ’ees Extraction et Gestion des Connaissances)中。M.Noirhomme-Frature和G.Venturini编辑的《Cèpadu´es》(2007),99-110。
[28] C.L.Mallows,关于渐近联合正态性的一个注记,Ann Math Stat 43(1972),(2)508-515·Zbl 0238.60017号
[29] W.Winston,《运营研究》。《应用与算法》(第三版),加利福尼亚州,达克斯伯里出版社,1994年·Zbl 0867.90079号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。