×

成分和区间值数据的稳健聚合:单位单纯形模式。 (英语) Zbl 1522.62059号

小结:我们考虑成分数据的计算模式,这些数据通过线性约束相互关联。合成数据产生于模糊集理论(2类区间值、直觉、犹豫模糊集)、生物医学(相对丰度、基因组测序、活动识别)和数据分析(各种财富指数、区间值观测、交通拥堵等)的各种扩展中。在单变量的情况下,Mode是一个预聚合函数,用作对异常值具有鲁棒性的经典估计器,但其多变量扩展面临着高计算复杂性和潜在的过度平滑的挑战。在这项工作中,我们提出了几种新的方法,用于对表示组合、区间值和一般向量值数据的单位单纯形进行模式估计。我们重点介绍了基于Choquet积分的2-可加模糊测度的加权最近邻算法,将其与基于空间划分的其他方法进行了性能比较,并说明了其在实际区间值数据集聚合中的应用。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62甲12 多元分析中的估计
62时86分 多元分析与模糊性
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahuja,N.,关于分层图像表示的多边形分解方法,计算。视觉。图表。图像处理。,26, 207-216 (1983)
[2] Aitchison,J.,《成分数据的统计分析》,J.R.Stat.Soc.,44,139-177(1982)·Zbl 0491.62017号
[3] 安吉洛娃,M。;Beliakov,G。;谢良格,S。;Zhu,Y.,单位单纯形的密度估计和样本模式的计算,Int.J.Intell。系统。,35, 850-868 (2020)
[4] 阿塔纳索夫,K。;Gargov,G.,区间值直觉模糊集,模糊集系统。,31, 343-349 (1989) ·Zbl 0674.03017号
[5] Beliakov,G.,基于接受-投影的通用非均匀随机向量发生器,ACM-Trans。模型。计算。模拟。,15, 205-232 (2005) ·Zbl 1390.65007号
[6] Beliakov,G.,全局优化的扩展切割角方法,太平洋。J.优化。,4, 153-176 (2008) ·Zbl 1192.90145号
[7] Beliakov,G.,《基于最近邻图的多元密度估计方法》,RUDN J.Math。通知。科学。物理。,26, 58-73 (2018)
[8] Beliakov,G。;Bustince,H。;Calvo,T.,《平均函数实用指南》(2016),Springer:Springer Berlin,纽约
[9] Beliakov,G。;巴斯廷斯,H。;Fernandez,J.,中位数及其扩展,模糊集系统。,175, 1, 36-47 (2011) ·Zbl 1217.62012年
[10] Beliakov,G。;卡尔沃,T。;Wilkin,T.,平均函数的三种单调性,Knowl-基于系统。,72, 114-122 (2014)
[11] Beliakov,G。;Pradera,A。;Calvo,T.,《聚合函数:从业者指南》(2007),施普林格:施普林格-海德堡·兹比尔1123.68124
[12] Beliakov,G。;斯皮尔科娃,J。;Calvo,T.,《关于OWA函数的扩展权重集》,Int.J.Gen.Syst。,49, 355-373 (2020)
[13] Beliakov,G。;Wilkin,T.,《关于变权加权平均的一些性质》,《信息科学》。,281, 1-7 (2014) ·Zbl 1360.62154号
[14] Belikov,V.V。;伊万诺夫·V·D。;康托洛维奇,V.K。;Korytnik,S.A。;Semenov,A.Y.,非ibsonian插值:一种在任意点集上插值函数值的新方法,计算。数学。数学。物理。,37, 9-15 (1997) ·Zbl 0948.65005号
[15] Boissonnat,J.-D。;Cazals,F.,通过距离函数的自然邻域插值进行光滑曲面重建,(第16届计算几何年会论文集(2000)),223-232·兹比尔1422.65049
[16] Bustince,H。;费尔南德斯,J。;Kolesárová,A。;Mesiar,R.,《融合函数和方向单调性》,(基于知识的系统中不确定性的信息处理和管理:第十五届国际会议(2014年7月),施普林格:施普林格-蒙彼利埃,法国),262-268·Zbl 1415.68227号
[17] Bustince,H。;费尔南德斯,J。;Kolesárová,A。;Mesiar,R.,《融合函数的方向单调性》,Eur.J.Oper。研究,244,1300-308(2015)·Zbl 1346.26004号
[18] Bustince,H。;Jurio,A。;Pradera,A。;梅西亚尔,R。;Beliakov,G.,使用通过忠实限制差异函数构造的惩罚函数的加权投票方法的推广,欧洲期刊Oper。研究,225,3472-478(2013)·Zbl 1292.91061号
[19] 成本,S。;Salzberg,S.,一种用于符号特征学习的加权最近邻算法,马赫。学习。,10, 57-78 (1993)
[20] Dasarathy,B.V.,《最近邻规范:NN模式分类技术》(1991),IEEE计算机学会出版社:IEEE计算机协会出版社,加利福尼亚州洛斯阿拉米托斯
[21] D'Errico,J.,使用网格拟合的曲面拟合(2006)
[22] 芬克尔,R.A。;Bentley,J.L.,复合键检索的数据结构,Acta Inform。,4, 1-9 (1974) ·Zbl 0278.68030号
[23] 菲克斯,E。;Hodges,J.L.,判别分析,非参数判别:一致性属性(1951年),美国空军航空医学院:美国空军航空医药学院,德克萨斯州伦道夫菲尔德,技术报告·Zbl 0715.62080号
[24] Gagolewski,M.,《数据融合:理论、方法和应用》(2015),波兰科学院计算机科学研究所:波兰华沙波兰科学院计算科学研究所
[25] 加戈列夫斯基,M。;佩雷斯·费尔南德斯(Pérez-Fernández),R。;De Baets,B.B.,多维数据聚合中的固有困难,IEEE Trans。模糊系统。,28, 602-606 (2020)
[26] 格洛尔,G.B。;Macklaim,J.M。;Pawlowsky Glahn,V.公司。;Egozcue,J.J.,微生物组数据集是组成的:这不是可选的,Front。微生物。,8, 2224 (2017)
[27] Grabisch,M.,k阶可加离散模糊测度及其表示,模糊集系统。,92, 167-189 (1997) ·Zbl 0927.28014
[28] (Grabisch,M.;Murofushi,T.;Sugeno,M.,《模糊测度与积分》,《理论与应用》(2000年),《物理-验证:物理-验证-海德堡》)·Zbl 0935.00014号
[29] 哈斯蒂,T。;蒂布希拉尼,R。;Friedman,J.,《统计学习的要素》(2001),斯普林格·弗拉格:斯普林格尔·弗拉格纽约,柏林,海德堡·Zbl 0973.62007号
[30] 希利,G.N。;Wijndaele,K。;邓斯坦,D.W。;肖·J·E。;沙门,J。;Zimmeter,P.Z.,客观测量久坐时间、体力活动和代谢风险:澳大利亚糖尿病、肥胖和生活方式研究(AusDiab),糖尿病护理,31369-371(2008)
[31] 亨德森,N。;Pena,L.,应用于特殊形式路径管方法的逆距离加权插值:不可压缩流中平流的理论和计算,应用。数学。计算。,304, 114-135 (2017) ·兹比尔1411.76099
[32] Hüllermier,E.,《Choquet-integral作为基于案例学习中的聚合算子》(Reusch,B.,计算智能、理论和应用(2006),Springer:Springer-Berlin,Heidelberg),615-627
[33] 琼斯,M.C。;Marron,J.S。;Sheather,S.J.,《密度估算中带宽选择的简要调查》,美国统计协会,91,433,401-407(1996)·Zbl 0873.62040号
[34] Klinger,A.,《模式和搜索统计》(Rustagi,J.S.,《统计学中的优化方法》(1971),学术出版社:纽约学术出版社),303-337·Zbl 0263.68059号
[35] Knuth,D.E.,最优二叉搜索树,信息学报。,1, 14-25 (1971) ·Zbl 0233.68010号
[36] Knuth,D.E.,《计算机编程的艺术》,第1卷,基本算法(1975),Addison-Wesley:Addison-Whesley Reading,马萨诸塞州·Zbl 0191.17903号
[37] 李,J。;Heap,A.D.,《环境科学中应用的空间插值方法:综述》,环境。模型。软质。,53, 173-189 (2014)
[38] 李,Z。;张,X。;朱,R。;Zhiang,Z。;Weng,Z.,《将数据对数据相关性集成到反距离加权中》,计算。地质科学。,203-216年4月24日(2020年)·Zbl 1434.86042号
[39] 卢卡,G。;桑兹,J.A。;迪穆罗,G.P。;Bedregal,B。;梅西亚尔,R。;Kolesárová,A。;Bustince,H.,《预聚集函数的概念,人工智能决策建模》。MDAI,第9321卷(2015年),施普林格·Zbl 1366.68328号
[40] 卢卡,G。;桑兹,J.A。;佩雷拉·迪穆罗,G。;Bedregal,B.R.C。;梅西亚尔,R。;Kolesárová,A。;Bustince,H.,《预聚合函数:构造和应用》,IEEE Trans。模糊系统。,24, 2, 260-272 (2016)
[41] Mayag,B。;格拉比施,M。;Labreuche,C.,《2-加法Choquet积分的表征》,(IPMU程序,IPMU的程序,西班牙马拉加(2008)),1512-1518
[42] Parzen,E.,《关于概率密度函数和模式的估计》,《数学年鉴》。Stat.,33,1065-1076(1962)·Zbl 0116.11302号
[43] Pearson,K.,《进化论的数学贡献》。当在器官测量中使用指数时,可能会出现一种虚假相关性,Proc。皇家学会,60489-498(1897)
[44] 佩雷斯·费尔南德斯(Pérez-Fernández),R。;De Baets,B.,《介于关系、单度量和惩罚函数在数据聚合中的作用》,(第17届国际模糊系统协会世界大会和第9届国际软计算与智能系统会议(IFSA-SCIS)的会议记录)。程序。第17届国际模糊系统协会世界大会和第9届软计算与智能系统国际会议(IFSA-SCIS),日本大津(2017年6月),1-6
[45] 佩雷斯·费尔南德斯(Pérez-Fernández),R。;De Baets,B.,《计量单位在基于惩罚的数据聚合中的作用》,IEEE Trans。模糊系统。,27, 1456-1468 (2019)
[46] Rosenblatt,M.,《关于密度函数的一些非参数估计的评论》,《数学年鉴》。Stat.,27832-837(1956年)·Zbl 0073.14602号
[47] Rousseeuw,P.J。;Leroy,A.M.,《稳健回归和异常值检测》(2003),威利出版社:威利纽约
[48] Samet,H.,《多维和度量数据结构基础》(2006),爱思唯尔:爱思唯尔波士顿·兹比尔1139.68022
[49] 沙普,W.E。;van de Weygaert,R.,《连续场和离散样本:通过Delaunay细分重建》,Astron。天体物理学。,363,L29-L32(2000)
[50] Shapley,L.S.,n人博弈的A值,Contrib.理论博弈,2,28,307-317(1953)·Zbl 0050.14404号
[51] Sibson,R.,《自然邻域插值的简要描述》(Barnett,V.,解释多元数据(1981),John Wiley and Sons:John Willey and Sons New York),21-36
[52] Stuetzle,W.,通过分析样本的最小生成树来估计密度的聚类树,J.Classif。,20, 25-47 (2003) ·兹比尔1055.62075
[53] 特雷尔,D.G。;Scott,D.W.,《可变核密度估计》,Ann.Stat.,201236-1265(1992)·Zbl 0763.62024号
[54] 汤普森,L.R。;桑德斯,J.G。;McDonald,D.,《揭示地球多尺度微生物多样性的公共目录》,《自然》,551457-463(2017)
[55] 瓦格纳,C。;米勒,S。;Garibaldi,J.,基于1型和2型模糊集的数据驱动概念和单词模型的相似性应用,(第十届IEEE模糊系统国际会议(FUZZ-IEEE)(2013年7月),IEEE计算智能学会:IEEE计算情报学会,印度海得拉巴)
[56] Watson,D.,《等高线:空间数据分析和显示指南》(1992),佩加蒙出版社:牛津佩加蒙出版公司
[57] Wilkin,T.,基于非单调平均函数的图像简化算子,(第十届IEEE模糊系统国际会议(FUZZ-IEEE)(2013年7月),IEEE计算智能学会:IEEE计算情报学会,印度海得拉巴)
[58] Wilkin,T。;Beliakov,G.,弱单调平均函数,Int.J.Intell。系统。,30, 144-169 (2015)
[59] Wilkin,T。;Beliakov,G.,区间值数据模式,(IEEE模糊系统国际会议(FUZZIEEE)(2019年6月),IEEE:IEEE新奥尔良,路易斯安那州),1-6
[60] Wilkin,T。;Beliakov,G。;Calvo,T.,弱单调平均函数,(基于知识的系统中不确定性的信息处理和管理:第15届国际会议(2014年7月),施普林格:施普林格-蒙彼利埃,法国),364-373·Zbl 1415.68244号
[61] Yager,R.,《使用模糊方法建模最近邻规则》,IEEE Trans。系统。人类网络。,32, 512-525 (2002)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。