×

基于无噪训练数据构造的Nadaraya-Watson估计器的噪声输入贝叶斯核回归。 (英语) Zbl 1462.62513号

摘要:在噪声输入的回归中,如果可能的话,通常会从给定的噪声输入中去除噪声,然后将得到的无噪声输入提供给回归函数。然而,在某些情况下,没有可用的时间或方法来消除噪音。本文提出的回归方法使用无噪分量的估计后验值确定有噪输入的回归函数,无噪解释值的非参数估计是由无噪训练数据构造的。此外,还提出了一种概率生成模型来估计噪声分布。这使我们能够利用训练数据集估计的噪声输入的无噪声成分的分布作为先验,从单个噪声输入参数确定噪声分布。使用人工和实际数据集进行的实验表明,该方法抑制了噪声输入下回归函数的过拟合,预测的均方根误差(RMSE)与现有方法相比更小。

MSC公司:

2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
62G08号 非参数回归和分位数回归
60小时40 白噪声理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bishop,C.M.(1995年)。用于模式识别的神经网络。牛津大学出版社·Zbl 0868.68096号
[2] Bishop,C.M.(2007)。模式识别和机器学习。纽约州施普林格·Zbl 1107.68072号
[3] Boss,G.R.和Seegmiller,J.E.(1981年)。年龄相关的生理变化及其临床意义。西部。《医学杂志》,135:434-440。
[4] Cai,T.T.和Wang,L.(2011)。带噪声稀疏信号恢复的正交匹配追踪。IEEE传输。信息论,57:4680-4688·兹比尔1365.94058
[5] Carrolland,R.J.、Ruppert,D.、Stefanski,L.A.和Crainiceanu,C.M.(2006)。非线性模型中的测量误差:现代观点。CRC出版社·Zbl 1119.62063号
[6] Chase,H.P.和Maahs,D.M.(2011年)。《了解糖尿病:糖尿病患者手册》,第12版。儿童糖尿病基金会。
[7] Chen,Y.和Caramanis,C.(2013)。噪音和缺失数据回归:分布式支持恢复。程序。国际Conf.机器学习(ICML'13),第383-391页,JMLR.org,https://dl.acm.org/doi/proceedings/10.5555/3042817。
[8] Duda,R.O.、Hart,P.E.和Stork,D.G.(2001)。图案分类,第2版。约翰·威利父子公司·Zbl 0968.68140号
[9] 冯萍,L.,于青,Z.和魏,X.(2016)。小样本Nadaraya-Watson核回归方法的参数优化。国际高级研究杂志。智力。,5: 1-6.
[10] Fuller,W.A.(2009年)。测量误差模型。约翰·威利父子公司。
[11] Gillard,J.W.(2014)。具有两个变量误差的线性回归中的矩估计方法。Commun公司。统计理论方法,43:3208-3222·Zbl 1297.62149号
[12] Grasbeck,R.(1990)。参考值、原因和方式。扫描。临床杂志。实验室投资。,50: 45-53.
[13] Kahn,M.(1994年)。糖尿病数据集。UCI机器学习库。可用:https://archive.ics.uci.edu/ml/datasets/diabetes。
[14] Kamatani,Y.、Matsuda,K.、Okada,Y.,Kubo,M.、Hosono,N.、Daigo,Y.和Nakamura,Y.(2010)。日本人群血液学和生物化学特征的全基因组关联研究。自然遗传学。,42: 210-215.
[15] Koul,H.L.和Song,W.(2008)。使用Berkson测量误差进行回归模型检查。J.统计计划。Inf.,138:1615-1628·Zbl 1131.62036号
[16] Li,T.(2002)。非线性变量误差模型的稳健一致估计。《经济学杂志》。,110: 1-16. ·Zbl 1030.62034号
[17] Loh,P.-L.和Wainwright,M.J.(2011)《含噪声和缺失数据的高维回归:非凸性的可证明保证》。程序。神经信息处理系统进展(NIPS’11)Curran Associates Inc.,57 Morehouse Lane,Red Hook,NY,United States,pp.2726-2734,https://dl.acm.org/doi/proceedings/10.5555/2986459。
[18] McHutchon,A.和Rasmussen,C.E.(2011年)。带输入噪声的高斯过程训练。程序。神经信息处理系统进展(NIPS’11),第1341-1349页。
[19] Mohanty,B.和Basu,S.(2006年)。实用临床生物化学基础。B.I.出版私人有限公司。
[20] Nadaraya,E.A.(1964年)。关于估计回归。西奥。普罗巴伯。申请。,9: 141-142.
[21] Schennach,S.M.(2004)。存在测量误差的非参数回归。经济。理论,20:1046-1093·Zbl 1069.62037号
[22] Scott,D.W.(2015)。多元密度估计:理论、实践和可视化。牛津大学出版社·Zbl 1311.62004号
[23] Shapiai,M.I.、Ibrahim,Z.、Khalid,M.、Jau,L.W.和Pavlovich,V.(2010年)。基于Nadaraya-Watson核回归的小样本非线性函数逼近。程序。计算智能、通信系统和网络(CICSyN'10),2010年第二次国际会议,Curran Associates Inc.,第28-32页,http://www.proceedings.com/09674.html。
[24] Shapiai,M.I.、Ibrahim,Z.、Khalid,M.、Jau,L.W.和Pavlovich,V.(2011年)。增强Nadaraya-Watson核回归:极小样本的曲面近似。程序。2011年第五届亚洲建模研讨会(AMS’11),Curran Associates Inc.,第7-12页,http://www.proceedings.com/12383.html。
[25] Snoek,J.、Larochelle,H.和Adams,R.P.(2012)。机器学习算法的实用贝叶斯优化。程序。神经信息处理系统进展(NIPS’12),Curran Associates Inc.,57 Morehouse Lane,Red Hook,NY,United States,pp.2951-2959,https://dl.acm.org/doi/proceedings/10.5555/2986459。
[26] Vogenberg,F.R.、Barash,C.I.和Pursel,M.(2010年)。个性化医学:第1部分:演变和发展到热疗学。药学理论。,35: 560-576.
[27] Wagner,J.A.(2002)。医学中的替代终点。IOS出版社。
[28] Waller,D.G.(2016)。急性医学电子书:医学杂志的关键文章。爱思唯尔健康科学公司。
[29] Watson,G.S.(1964年)。平滑回归分析。塞尔·桑克亚。A、 26时359-372分·Zbl 0137.13002号
[30] Webb,A.R.(1994)。前馈网络的函数逼近:推广的最小二乘法。IEEE传输。神经网络。,5: 363-371.
[31] Zhang,X.,Brooks,R.D.和King,M.L.(2009)。多元核回归带宽选择的贝叶斯方法及其在状态-概率密度估计中的应用。《经济学杂志》。,153: 21-32. ·Zbl 1431.62176号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。