×

再生核Hilbert空间上核岭回归的诊断测度。 (英文) Zbl 1428.62349号

摘要:本文的目的是定义和开发再生核希尔伯特空间(RKHS)中的核岭回归的诊断方法。为了确定有影响的观测值,我们为RKHS中的核岭回归模型定义了一个特定版本的库克距离,这与经典回归模型中的库克距在概念上是一致的。然后,通过使用RKHS中结果的正则化条件期望的扰动公式,我们开发了RKHS中Cook距离的近似版本,因为原始定义需要密集的计算。这样一个近似的库克距离用基本构造块表示,例如核岭回归的残差和杠杆。仿真和实际应用的结果表明,我们的诊断方法成功地检测出了核岭回归中对估计量有潜在影响的观测值。

MSC公司:

62J20型 诊断、线性推理和回归
62J07型 岭回归;收缩估计器(拉索)
46 E22型 具有再生核的希尔伯特空间(=(适当的)函数希尔伯特空间,包括de Branges-Rovnyak和其他结构空间)

软件:

全球供应链
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bae,W。;黄,S。;Kim,C.,用纵向数据对变系数模型的影响诊断,计算统计,23185-196(2008)·兹比尔1223.62113
[2] 贝尔斯利,D.A。;Kuh,E。;Welsch,R.E.,《回归诊断:确定有影响力的数据和共线性来源》(2005),John Wiley&Sons:John Willey&Sons纽约·Zbl 0479.62056号
[3] 库克,R.D.,《线性回归中影响观察的检测》,《技术计量学》,第19期,第15-18页(1977年)·Zbl 0371.62096号
[4] 库克·R·D。;Weisberg,S.,《检验回归中影响案例的经验影响函数特征》,技术计量学,22495-508(1980)·Zbl 0453.62051号
[5] 库克·R·D。;Weisberg,S.,《回归中的残差和影响》(1982),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0564.62054号
[6] Eubank,R.,平滑样条曲线的诊断,皇家统计学会杂志。B系列,47,332-341(1985)·Zbl 0605.62031号
[7] Fukumizu,K。;巴赫,F.R。;Gretton,A.,核典型相关分析的统计一致性,机器学习研究杂志(JMLR),8,361-383(2007)·兹比尔1222.62063
[8] 冯,W.-K。;朱Z.-Y。;魏,B.-C。;He,X.,《半参数混合模型的影响诊断和离群值检验》,《皇家统计学会杂志》。B系列,64,565-579(2002)·Zbl 1090.62039号
[9] Gu,C.,平滑样条方差分析模型(2013),Springer:Springer New York·Zbl 1269.62040号
[10] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.J.H.,《统计学习的要素》(2009),施普林格:施普林格纽约·Zbl 1273.62005年
[11] 霍尔,A.E。;Kennard,R.W.,《岭回归:非正交问题的有偏估计》,《技术计量学》,第12期,第55-67页(1970年)·Zbl 0202.17205号
[12] 霍夫曼,T。;Schölkopf,B。;Smola,A.J.,《机器学习中的内核方法》,《统计年鉴》,361171-1220(2008)·Zbl 1151.30007号
[13] Kim,C。;Lee,Y。;Park,B.U.,局部多项式回归中的库克距离,《统计与概率快报》,54,33-40(2001)·Zbl 1052.62040号
[14] Kim,C。;Lee,J。;Yang,H。;Bae,W.,《套索回归中的病例影响诊断》,《韩国统计学会杂志》,44,271-279(2015)·Zbl 1328.62479号
[15] Kim,C。;Storer,B.E.,库克距离的参考值,《统计学中的通信》。模拟与计算,25,691-708(1996)·Zbl 0937.62619号
[16] Pregibon,D.,Logistic回归诊断,《统计年鉴》,9705-724(1981)·Zbl 0478.62053号
[17] Schölkopf,B。;Smola,A.J.,《使用内核学习:支持向量机、正则化、优化和超越》(自适应计算和机器学习)(2001年),麻省理工学院出版社
[18] Silverman,B.W.,《统计和数据分析的密度估计》(1986年),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0617.62042号
[19] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会杂志》。B系列,58267-288(1996)·Zbl 0850.62538号
[20] Wahba,G.,观测数据的样条模型(1990年),暹罗·Zbl 0813.62001号
[21] Walker,E。;Birch,J.B.,岭回归中的影响度量,技术计量学,30,221-227(1988)
[22] Yang,H.,基于高维特征再现Kernel Hilbert空间的学习方法(2016),北卡罗来纳大学教堂山分校
[23] Yang,H。;朱,H。;易卜拉欣,J.G.,基于高维特征的多指标潜在因素模型,生物统计学,74834-844(2018)·Zbl 1414.62482号
[24] 朱,H。;易卜拉欣,J.G。;Chen,M.-H.,缺失协变量的cox回归模型的诊断措施,Biometrika,102907-923(2015)·Zbl 1372.62043号
[25] 朱,H。;易卜拉欣,J.G。;Shi,X.,缺失协变量的广义线性模型的诊断措施,《斯堪的纳维亚统计杂志》,36686-712(2009)·兹比尔1224.62017
[26] 朱,H。;Lee,S.-Y。;魏,B.-C。;Zhou,J.,不完全数据模型的案例删除措施,Biometrika,88,727-737(2001)·Zbl 1006.62021号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。