×

具有分离条件的最优函数监督分类。 (英语) Zbl 1441.62930号

本文研究随机过程轨迹的二元监督分类。根据轨迹的有限训练集,我们必须确定观测到的轨迹与两个未知过程中的哪一个有关。本文作者考虑了随机微分方程解的轨迹\[ dX_t=\mu(t)dt+dW_t,\qquad t\in[0,1],\quad\mu\in\{f,g\},\]其中漂移\(f)和\(g)属于Sobolev-Hilbert空间\(H_s(0,1)\),\(s\geq 0 \),并且显著不同\(f-g \ |\geq\Delta>0 \)。
其目标是提供一个自然分类器,使其他分类器的性能在渐近上没有明显优于它。

MSC公司:

62兰特 功能数据分析
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
60 H10型 随机常微分方程(随机分析方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abraham,C.、Biau,G.和Cadre,B.(2006年)。关于函数分类的核心规则。Ann.Inst.统计。数学。58 619-633之间·Zbl 1100.62066号
[2] Audibert,J.-Y.和Tsybakov,A.B.(2007年)。插件分类器的快速学习率。安。统计师。35 608-633. ·Zbl 1118.62041号
[3] Baíllo,A.、Cuevas,A.和Cuesta-Albertos,J.A.(2011年)。高斯函数模型族的监督分类。扫描。《美国联邦法律大全》第38卷第480-498页·Zbl 1246.62155号
[4] Biau,G.和Devroye,L.(2015)。最近邻法讲座。数据科学中的Springer系列。查姆:斯普林格·Zbl 1330.68001号
[5] Biau,G.和Scornet,E.(2016)。随机森林导览。测试25 197-227·Zbl 1402.62133号
[6] Bickel,P.J.和Levina,E.(2004)。Fisher线性判别函数的一些理论,“朴素贝叶斯”,以及当变量比观测值多时的一些替代方法。伯努利10 989-1010·Zbl 1064.62073号
[7] Boucheron,S.、Bousquet,O.和Lugosi,G.(2005)。分类理论:对一些最新进展的综述。ESAIM概率。统计9 323-375·Zbl 1136.62355号
[8] Boucheron,S.、Lugosi,G.和Massart,P.(2013)。集中度不平等。牛津:牛津大学出版社。非交感独立理论,由米歇尔·勒杜(Michel Ledoux)引言·Zbl 1279.60005号
[9] 干部,B.(2013)。扩散路径的监督分类。数学。方法统计。22 213-225. ·Zbl 1293.62069号
[10] Cai,T.T.和Zhang,L.(2019年)。高维线性判别分析:最优化、自适应算法和缺失数据。J.R.统计社会服务。B.统计方法。81 675-705. ·兹比尔1428.62267
[11] Cérou,F.和Guyader,A.(2006年)。无限维最近邻分类。ESAIM概率。统计数字10 340-355·Zbl 1187.62115号
[12] Chaudhuri,K.和Dasgupta,S.(2014年)。最近邻分类的收敛速度。《神经信息处理系统进展》(Z.Ghahramani、M.Welling、C.Cortes、N.D.Lawrence和K.Q.Weinberger编辑)27 3437-3445。Curran Associates公司。
[13] Chonavel,T.(2002)。统计信号处理。纽约:斯普林格出版社·Zbl 1003.94001号
[14] Cover,T.M.和Hart,P.(1967年)。最近邻模式分类。IEEE传输。通知。理论13 21-27·Zbl 0154.44505号
[15] Delaigle,A.和Hall,P.(2012年)。实现功能数据的近乎完美的分类。J.R.统计社会服务。B.统计方法。74 267-286. ·Zbl 1411.62164号
[16] Devroye,L.、Györfi,L.和Lugosi,G.(1996)。模式识别的概率理论。数学应用(纽约)31。纽约:斯普林格·Zbl 0853.68150号
[17] Gadat,S.、Gerchinovitz,S.和Marteau,C.(2020)。补充“带分离条件的最优功能监督分类”https://doi.org/10.3150/19-BEJ1170SUPP。 ·兹比尔1441.62930
[18] Gadat,S.、Klein,T.和Marteau,C.(2016)。用(k)-最近邻规则对一般有限维空间进行分类。安。统计师。44 982-1009. ·Zbl 1338.62082号
[19] Győrfi,L.(1978)。关于最近邻规则的收敛速度。IEEE传输。通知。理论24 509-512·Zbl 0433.62027号
[20] Ibragimov,I.和Khasminski,R.(1981年)。统计估计:渐近理论。纽约:斯普林格·Zbl 0467.62026号
[21] 池田,N.和渡边,S.(1989)。随机微分方程和扩散过程,第二版,北霍兰德数学图书馆24。阿姆斯特丹:荷兰北部·Zbl 0684.60040号
[22] James,G.M.和Hastie,T.J.(2001)。不规则采样曲线的函数线性判别分析。J.R.统计社会服务。B.统计方法。63 533-550. ·Zbl 0989.62036号
[23] Kulkarni,S.R.和Posner,S.E.(1995年)。任意采样下最近邻估计的收敛速度。IEEE传输。通知。理论41 1028-1039·Zbl 0839.93070号
[24] Lamberton,D.和Lapeyre,B.(1996年)。金融应用随机微积分导论。伦敦:CRC出版社·Zbl 1167.60001号
[25] Lande,R.、Engen,S.和Saether(2003年)。生态学和保护中的随机种群动力学。纽约:牛津大学出版社·Zbl 1087.92064号
[26] Laurent,B.和Massart,P.(2000年)。通过模型选择对二次函数进行自适应估计。安。统计师。28 1302-1338. ·兹比尔1105.62328
[27] Lepskiĭ,O.V.(1990)。高斯白噪声中的自适应估计问题。特奥。维罗亚特。Primen公司。35 459-470·Zbl 0725.62075号
[28] Li,T.、Yi,X.、Carmanis,X.和Ravikumar,P.(2017)。Minimax-Gaussian分类与聚类。第20届国际人工智能与统计会议论文集。机器学习研究论文集54 1-9。
[29] Mammen,E.和Tsybakov,A.B.(1999年)。平滑判别分析。安。统计师。27 1808-1829. ·Zbl 0961.62058号
[30] Massart,P.和Nédélec,É。(2006年)。统计学习的风险边界。安。统计师。34 2326-2366. ·Zbl 1108.62007号
[31] Rakhlin,A.、Sridharan,K.和Tsybakov,A.B.(2017年)。经验熵、极大极小后悔和极大极小风险。伯努利23 789-824·Zbl 1380.62176号
[32] Rossi,F.和Villa,N.(2008年)。支持向量机用于功能数据分类的最新进展。在功能和操作统计中。Contrib.统计。273-280. 海德堡:Physica-Verlag/Springer。
[33] Samworth,R.J.(2012)。最优加权最近邻分类器。安。统计师。40 2733-2763. ·Zbl 1373.62317号
[34] Shao,J.、Wang,Y.、Deng,X.和Wang,S.(2011)。高维数据的阈值稀疏线性判别分析。安。统计师。39 1241-1265. ·Zbl 1215.62062号
[35] Steinwart,I.和Christmann,A.(2008年)。支持向量机。信息科学与统计。纽约:斯普林格·Zbl 1203.68171号
[36] Wang,J.L.、Chiou,J.M.和Müller,H.G.(2016)。功能数据分析。年。修订状态申请。3 257-295。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。