索尼亚迪亚斯;保拉·布里托;宝拉阿玛拉尔 通过分数规划对分布数据进行判别分析。 (英语) Zbl 1487.62069号 欧洲药典。物件。 294,编号1,206-218(2021). 摘要:我们讨论分布数据的分类,其中单位由直方图或区间值变量描述。该方法使用线性判别函数,其中在特定假设下,分布或区间由分位数函数表示。此判别函数允许以分位数函数的形式为每个单位定义分数,分位数函数用于使用Mallows距离将单位分为两个先验组。所提出的线性鉴别方法有多种应用领域。在这项工作中,我们使用全年航班,根据航班时间和到达/离开延误对在纽约机场运营的航空公司进行分类。 引用于2文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 90立方厘米 分数编程 关键词:分类;数据科学;直方图数据;多元统计学;符号数据分析 软件:SODAS公司 PDF格式BibTeX公司 XML格式引用 \textit{S.Dias}等人,《欧洲药典》。第294号决议,第1号,206--218(2021;Zbl 1487.62069) 全文: 内政部 arXiv公司 参考文献: [1] 阿马拉,P。;Bomze,I.M。;Jüdice,J.,同位性与约束分数次二次型问题,数学规划,146,1325-350(2014)·Zbl 1312.90049号 [2] 安古洛,C。;Anguita博士。;González,L.,使用支持向量机的区间判别分析,《ESANN 2007年学报》。比利时布鲁日(2007) [3] 阿罗约,J。;González-Rivera,G。;马特,C。;San Roque,A.M.,直方图值时间序列的平滑方法:风险值的应用,统计分析和数据挖掘,4,216-228(2011)·Zbl 07260279号 [4] 阿罗约,J。;Maté,C.,用k近邻法预测直方图时间序列,国际预测杂志,25,1192-207(2009) [5] Bertrand,P。;Goupil,F.,符号数据的描述性统计,符号数据分析,106-124(2000),Springer·Zbl 0978.62005号 [6] Billard,L。;Diday,E.,《从数据统计到知识统计:符号数据分析》,《美国统计协会杂志》,98,462,470-487(2003) [7] Billard,L。;Diday,E.,《符号数据分析:概念统计和数据挖掘》(2006),John Wiley&Sons,Ltd·Zbl 1117.62002号 [8] 博克,H.-H。;Diday,E.(编辑),《符号数据分析:从复杂数据中提取统计信息的探索性方法》(2000年),施普林格出版社:施普林格-柏林)·Zbl 1039.62501号 [9] Brito,P.,《符号数据分析:数据挖掘与统计互动的另一视角》,《WIREs DMKS》,第4期,第281-295页(2014年) [10] Carrizosa,E。;J.Gordillo。;Plastia,F.,通过分离超平面实现不精确数据的分类问题,技术报告(2007年),布鲁塞尔Vrije大学MOSI部门 [11] Dias,S.,线性回归与经验分布(2014),波尔图大学:波尔图大学,葡萄牙,博士论文。 [12] 迪亚斯,S。;Brito,P.,带直方图值变量的线性回归模型,统计分析和数据挖掘,8,2,75-113(2015)·Zbl 07260426号 [13] Dias,S。;Brito,P.,《另类:区间数据的新线性模型》,《欧洲运筹学杂志》,2581118-1130(2017)·Zbl 1395.62199号 [14] 迪金森,P.J.C。;Gijben,L.,《关于完全正锥及其对偶的成员问题的计算复杂性》,《技术报告》(2011年),荷兰格罗宁根大学约翰伯努利数学与计算机科学研究所 [15] 杜阿尔特·席尔瓦,A.P。;Brito,P.,区间数据的线性判别分析,计算统计学,21,2,289-308(2006)·Zbl 1113.62080号 [16] 杜阿尔特·席尔瓦,A.P。;Brito,P.,区间数据的判别分析:对参数和基于距离的方法的评估,分类杂志,32,3511-541(2015)·Zbl 1331.62305号 [17] Gonzalez-Rivera,G。;Arroyo,J.,《直方图值数据的时间序列建模:标准普尔500指数日内收益的每日直方图时间序列》,《国际预测杂志》,第28、1、20-33页(2012年) [18] Irpino,A.、De Carvalho,F.、Verde,R.和Balzanella,A.(2018年)。使用自适应距离对分布数据进行批量自组织映射。arXiv预印arXiv:1811.06980。 [19] 埃尔皮诺,A。;Verde,R.,《直方图符号数据分层聚类的基于Wasserstein的新距离》,(Batagelj,V.;Bock,H.-H.;Ferligoj,A.;Ziberna,A.,《数据科学与分类》,IFCS’06(2006),Springer Berlin Heidelberg),185-192年 [20] 埃尔皮诺,A。;Verde,R.,《分布符号变量的基本统计:一种新的基于度量的方法》,《数据分析和分类进展》,9,2,143-175(2015)·Zbl 1414.62017年 [21] Ishibuchi,H。;Tanaka,H。;Fukuoka,N.,多维区间数据的判别分析及其在化学传感中的应用。,国际通用系统杂志,16,4,311-329(1990)·兹比尔0701.62072 [22] 劳罗,N。;Verde,R。;Irpino,A.,因子判别分析,(Diday,E.;Noirhomme,M.,符号数据分析和苏打软件(2008),英国奇切斯特John Wiley&Sons),341-358 [23] Malaquias,P.,Modelos de regress-o linear para variáveis intervalares:Uma extensáo do modelo ID硕士论文(2017),波尔图大学:葡萄牙波尔图大学 [24] Mallows,C.,关于渐近联合正态性的一个注记,《数理统计年鉴》,43,2,508-515(1972)·Zbl 0238.60017号 [25] Murty,K.G。;卡巴迪,S.N.,二次规划和非线性规划中的一些NP-完全问题,数学规划,39,2,117-129(1987)·兹比尔0637.90078 [26] Nivlet,P。;Fournier,F。;Royer,J.,《区间判别分析:在监督模式识别中集成错误的一种有效方法》,《ISIPTA 2001年会议论文集》,康奈尔大学,ITHACA,纽约,美国(2001) [27] Noirhomme-服装,M。;Brito,P.,《远远超越经典数据模型:符号数据分析、统计分析和数据挖掘》,4,2,157-170(2011)·Zbl 07260275号 [28] 罗西,F。;Conan Guez,B.,《关于区间数据的多层感知器》(Jajuga,K.;Sokolowski,A.;Bock,H.-H.,《分类、聚类和数据分析》(2002),英国奇切斯特John Wiley&Sons出版社) [29] Tawarmalani,M。;Sahinidis,N.V.,《全局优化的多面体分枝切割方法》,《数学规划》,103,225-249(2005)·兹比尔1099.90047 [30] 乌特金。;Coolen,F.,机器学习框架下的区间值回归和分类模型,第七届不精确概率、理论和应用国际研讨会论文集,奥地利因斯布鲁克(2011) [31] Verde,R。;Irpino,A.,基于Wasserstein距离的直方图数据的普通最小二乘法,(Lechevallier,Y.;Saporta,G.,《2010年COMPSTAT会议录》,法国巴黎(2010),Physica-Verlag HD),581-588·Zbl 1436.62334号 [32] Verde,R.和Irpino,A.(2018年)。分布数据的多因素分析。arXiv:1804.07192·Zbl 1414.62017年 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。