×

稳健统计学习主题。 (英语。法语摘要) Zbl 07830294号

小结:介绍了鲁棒推理的一些最新贡献。首先,使用优化传输方法(采用专门设计的Wasserstein型距离)重新研究位置参数稳健M估计的经典问题,该方法降低了对连续性的鲁棒性。其次,描述了使用球的并集来估计紧集的距离函数的过程。这种方法起源于拓扑推理领域,并作为副产品提供了一种稳健的聚类方法。第三,使用中间人策略的bootstrap变体,构造了一个鲁棒的Lloyd型聚类算法。该算法具有强大的初始化功能。

MSC公司:

62至XX 统计
93至XX 系统论;控制

软件:

k平均值++
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.Al Hasan、V.Chaoji、S.Salem和M.J.Zaki。通过离群值和密度不敏感播种实现稳健的分区聚类。《模式识别快报》,30(11):994-1002,2009年。
[2] D.Arthur和S.Vassilvitskii。K-means++:谨慎播种的优点。第十八届ACM-SIAM离散算法年会论文集,SODA'07,第1027-1035页,2007年·Zbl 1302.68273号
[3] C.布列切托。基于高斯修剪对数似然的稀疏近似的稳健形状推断。预印本,2018年。
[4] C.布雷切托。基于强大各向异性幂函数的聚类过滤。第23:1-23:152020页·Zbl 07760152号
[5] C.布列切托、A.菲舍尔和C.列夫拉德。稳健Bregman聚类。统计年鉴,49(3):1679-17012021·Zbl 1475.62177号
[6] C.布列切托和C.列夫拉德。用于鲁棒几何推理的基于k点的距离。伯努利,26(4):3017-305020·Zbl 1469.62432号
[7] C.布鲁内特·索马尔、E.吉纳泰和A.索马尔。补充:“K-bMOM:基于bootstrap Median-of-Means的稳健Lloyd型聚类算法”。2020
[8] C.布鲁内特·索马尔、E.吉纳泰和A.索马尔。K-bMOM:一种基于bootstrap median-of-means的鲁棒Lloyd型聚类算法。计算。统计师。数据分析。,167:论文编号:107370、19、2022·Zbl 07464467号
[9] P.Bühlmann先生。为改进一些预测算法而进行的装袋、子装袋和吹嘘。非参数统计的最新进展和趋势,第19-34页。Elsevier B.V.,阿姆斯特丹,2003年。
[10] O.Catoni。挑战经验均值和经验方差:偏差研究。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。统计,48(4):1148-1185,2012年·Zbl 1282.62070号
[11] O.Catoni。挑战经验均值和经验方差:偏差研究。Ann.Inst.H.PoincaréProbab公司。统计人员。,48(4):1148-1185, 11 2012. ·Zbl 1282.62070号
[12] O.Catoni和I.Giulini。矩阵、向量和线性最小二乘回归的无量纲PAC-Baysian界,2017年。(https://arxiv.org/abs/1712.02747).
[13] F.Chazal、D.Cohen-Steiner和Q.Mérigot。概率测度的几何推断。计算数学基础,11(6):733-7512011·Zbl 1230.62074号
[14] F.Chazal、L.J.Guibas、S.Y.Oudot和P.Skraba。黎曼流形中基于持久性的聚类。美国医学会杂志,60(6):A:1-A:382013·Zbl 1281.68176号
[15] J.A.Cuesta-Albertos、A.Gordaliza和C.Matrán。修剪k均值:试图增强量化器的鲁棒性。《统计年鉴》,25:553-5761997年·Zbl 0878.62045号
[16] J.Depersin和G.Lecué。关于Stahel-Donoho中值对对抗性腐败和重尾数据的稳健性。arXiv预印arXiv:2101.091172021。
[17] L.Devroye、M.Lerasle、G.Lugosi和R.I.Oliveira。亚高斯平均估计量。安.统计师。,44(6):2695-2725, 2016. ·Zbl 1360.62115号
[18] I.Diakonikolas和D.M.Kane。2019年算法高维稳健统计的最新进展。
[19] L.A.GarcíA-Escudero、A.Gordaliza、C.Matrán和A.Mayo-Iscar。鲁棒聚类方法综述。高级数据分析。分类。,4(2-3):89-109, 2010. ·Zbl 1284.62375号
[20] F.R.汉佩尔。稳健性的一般定性定义。安。数学。统计人员。,42(6):1887-1896, 12 1971. ·Zbl 0229.62041号
[21] F.R.Hampel、E.M.Ronchetti、P.J.Rousseeuw和W.A.Stahel。稳健统计:基于影响函数的方法。概率统计威利级数。威利,第一版,1986年1月。缺少·Zbl 0593.62027号
[22] 弗兰克·汉佩尔。关于分类的一些想法。《分类、聚类和数据分析》(Cracow,2002),Stud.Classification data Anal。知识机构。,第5-26页。施普林格,柏林,2002年。
[23] P.J.Huber。位置参数的稳健估计。安。数学。统计人员。,35(1):73-101, 03 1964. ·Zbl 0136.39805号
[24] P.J.Huber和E.M.Ronchetti。稳健统计;《概率与统计学威利系列》第二版。新泽西州霍博肯威利,2009年·Zbl 1276.62022号
[25] Y.Klochkov、A.Kroshin和N.Zhivotovskiy。具有两个矩的分布的稳健k均值聚类。安.统计师。,49(4):2206-2230, 2021. ·Zbl 1487.62070号
[26] G.Lecué和M.Lerasle。学习MOM的原则:Le Cam的方法。随机过程。申请。,129(11):4385-4410, 2019. ·兹比尔1435.62175
[27] G.Lecué和M.Lerasle。中位数鲁棒机器学习:理论与实践。安.统计师。,48(2):906-931, 2020. ·Zbl 1487.62034号
[28] M.Lerasle和R.I.Oliveira。稳健的经验平均估值器。arXiv预印arXiv:1112.39142011。
[29] S.P.劳埃德。PCM中的最小二乘量化。IEEE传输。信息论,28(2):129-1361982·Zbl 0504.94015号
[30] G.Lugosi和S.Mendelson。重尾分布下的均值估计和回归:一项调查。已找到。计算。数学。,19(5):1145-1190, 2019. ·Zbl 1431.62123号
[31] G.Lugosi和S.Mendelson。随机向量平均值的次高斯估计。Ann.Statist.,《统计年鉴》。,47(2):783-794, 2019. ·Zbl 1417.62192号
[32] G.Lugosi和S.Mendelson。通过中位数比赛将风险降至最低。《欧洲数学杂志》。Soc.(JEMS),22(3):925-9652020年·Zbl 1436.62312号
[33] 蒂莫西·马蒂厄。M估计和均值中值应用于统计学习。巴黎萨克利大学论文,2021年1月。
[34] 蒂莫塞·马修。使用影响函数对M估计量进行集中研究。电子统计杂志,16(1):3695-3750,2022·Zbl 1493.62146号
[35] S.Minsker。稳健平均估计量的一致界。arXiv预印arXiv:1812.035232018。
[36] G.Peyré和M.Cuturi,《计算最优传输:数据科学应用》。机器学习基础与趋势®,11(5-6):355-6071919。
[37] 阿德·范德法特(Aad W Van der Vaart)。渐近统计,第3卷。剑桥大学出版社,2000年·Zbl 0943.6202号
[38] D.L.Vandev和N.Neykov。高斯情况下的稳健最大似然。数据分析和稳健新方向,1993年1月。
[39] 塞德里克·维拉尼。最佳交通:新旧,容量338。施普林格,2009年·Zbl 1156.53003号
[40] U.von Luxburg。光谱聚类教程。统计与计算,17:395-4162017。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。