×

通过分数规划对分布数据进行判别分析。 (英语) Zbl 1487.62069号

摘要:我们讨论分布数据的分类,其中单位由直方图或区间值变量描述。该方法使用线性判别函数,其中在特定假设下,分布或区间由分位数函数表示。此判别函数允许以分位数函数的形式为每个单位定义分数,分位数函数用于使用Mallows距离将单位分为两个先验组。所提出的线性鉴别方法有多种应用领域。在这项工作中,我们使用全年航班,根据航班时间和到达/离开延误对在纽约机场运营的航空公司进行分类。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
90立方厘米 分数编程

软件:

SODAS公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿马拉,P。;Bomze,I.M。;Jüdice,J.,同位性与约束分数次二次型问题,数学规划,146,1325-350(2014)·Zbl 1312.90049号
[2] 安古洛,C。;Anguita博士。;González,L.,使用支持向量机的区间判别分析,《ESANN 2007年学报》。比利时布鲁日(2007)
[3] 阿罗约,J。;González-Rivera,G。;马特,C。;San Roque,A.M.,直方图值时间序列的平滑方法:风险值的应用,统计分析和数据挖掘,4,216-228(2011)·Zbl 07260279号
[4] 阿罗约,J。;Maté,C.,用k近邻法预测直方图时间序列,国际预测杂志,25,1192-207(2009)
[5] Bertrand,P。;Goupil,F.,符号数据的描述性统计,符号数据分析,106-124(2000),Springer·Zbl 0978.62005号
[6] Billard,L。;Diday,E.,《从数据统计到知识统计:符号数据分析》,《美国统计协会杂志》,98,462,470-487(2003)
[7] Billard,L。;Diday,E.,《符号数据分析:概念统计和数据挖掘》(2006),John Wiley&Sons,Ltd·Zbl 1117.62002号
[8] 博克,H.-H。;Diday,E.(编辑),《符号数据分析:从复杂数据中提取统计信息的探索性方法》(2000年),施普林格出版社:施普林格-柏林)·Zbl 1039.62501号
[9] Brito,P.,《符号数据分析:数据挖掘与统计互动的另一视角》,《WIREs DMKS》,第4期,第281-295页(2014年)
[10] Carrizosa,E。;J.Gordillo。;Plastia,F.,通过分离超平面实现不精确数据的分类问题,技术报告(2007年),布鲁塞尔Vrije大学MOSI部门
[11] Dias,S.,线性回归与经验分布(2014),波尔图大学:波尔图大学,葡萄牙,博士论文。
[12] 迪亚斯,S。;Brito,P.,带直方图值变量的线性回归模型,统计分析和数据挖掘,8,2,75-113(2015)·Zbl 07260426号
[13] Dias,S。;Brito,P.,《另类:区间数据的新线性模型》,《欧洲运筹学杂志》,2581118-1130(2017)·Zbl 1395.62199号
[14] 迪金森,P.J.C。;Gijben,L.,《关于完全正锥及其对偶的成员问题的计算复杂性》,《技术报告》(2011年),荷兰格罗宁根大学约翰伯努利数学与计算机科学研究所
[15] 杜阿尔特·席尔瓦,A.P。;Brito,P.,区间数据的线性判别分析,计算统计学,21,2,289-308(2006)·Zbl 1113.62080号
[16] 杜阿尔特·席尔瓦,A.P。;Brito,P.,区间数据的判别分析:对参数和基于距离的方法的评估,分类杂志,32,3511-541(2015)·Zbl 1331.62305号
[17] Gonzalez-Rivera,G。;Arroyo,J.,《直方图值数据的时间序列建模:标准普尔500指数日内收益的每日直方图时间序列》,《国际预测杂志》,第28、1、20-33页(2012年)
[18] Irpino,A.、De Carvalho,F.、Verde,R.和Balzanella,A.(2018年)。使用自适应距离对分布数据进行批量自组织映射。arXiv预印arXiv:1811.06980。
[19] 埃尔皮诺,A。;Verde,R.,《直方图符号数据分层聚类的基于Wasserstein的新距离》,(Batagelj,V.;Bock,H.-H.;Ferligoj,A.;Ziberna,A.,《数据科学与分类》,IFCS’06(2006),Springer Berlin Heidelberg),185-192年
[20] 埃尔皮诺,A。;Verde,R.,《分布符号变量的基本统计:一种新的基于度量的方法》,《数据分析和分类进展》,9,2,143-175(2015)·Zbl 1414.62017年
[21] Ishibuchi,H。;Tanaka,H。;Fukuoka,N.,多维区间数据的判别分析及其在化学传感中的应用。,国际通用系统杂志,16,4,311-329(1990)·兹比尔0701.62072
[22] 劳罗,N。;Verde,R。;Irpino,A.,因子判别分析,(Diday,E.;Noirhomme,M.,符号数据分析和苏打软件(2008),英国奇切斯特John Wiley&Sons),341-358
[23] Malaquias,P.,Modelos de regress-o linear para variáveis intervalares:Uma extensáo do modelo ID硕士论文(2017),波尔图大学:葡萄牙波尔图大学
[24] Mallows,C.,关于渐近联合正态性的一个注记,《数理统计年鉴》,43,2,508-515(1972)·Zbl 0238.60017号
[25] Murty,K.G。;卡巴迪,S.N.,二次规划和非线性规划中的一些NP-完全问题,数学规划,39,2,117-129(1987)·兹比尔0637.90078
[26] Nivlet,P。;Fournier,F。;Royer,J.,《区间判别分析:在监督模式识别中集成错误的一种有效方法》,《ISIPTA 2001年会议论文集》,康奈尔大学,ITHACA,纽约,美国(2001)
[27] Noirhomme-服装,M。;Brito,P.,《远远超越经典数据模型:符号数据分析、统计分析和数据挖掘》,4,2,157-170(2011)·Zbl 07260275号
[28] 罗西,F。;Conan Guez,B.,《关于区间数据的多层感知器》(Jajuga,K.;Sokolowski,A.;Bock,H.-H.,《分类、聚类和数据分析》(2002),英国奇切斯特John Wiley&Sons出版社)
[29] Tawarmalani,M。;Sahinidis,N.V.,《全局优化的多面体分枝切割方法》,《数学规划》,103,225-249(2005)·兹比尔1099.90047
[30] 乌特金。;Coolen,F.,机器学习框架下的区间值回归和分类模型,第七届不精确概率、理论和应用国际研讨会论文集,奥地利因斯布鲁克(2011)
[31] Verde,R。;Irpino,A.,基于Wasserstein距离的直方图数据的普通最小二乘法,(Lechevallier,Y.;Saporta,G.,《2010年COMPSTAT会议录》,法国巴黎(2010),Physica-Verlag HD),581-588·Zbl 1436.62334号
[32] Verde,R.和Irpino,A.(2018年)。分布数据的多因素分析。arXiv:1804.07192·Zbl 1414.62017年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。