×

非参数回归和分类与功能,分类,和混合协变量。 (英语) Zbl 07702491号

摘要:我们考虑使用多个协变量的非参数预测,特别是分类或功能预测,或两者的混合。该方法基于Nadaraya-Watson估计量的扩展,其中核函数应用于距离度量的线性组合,每个距离度量都是基于单个协变量计算的,权重是从训练数据中估计的。因变量可以是范畴变量(二元或多类)或连续变量,因此我们同时考虑分类和回归问题。提出的方法是在人工和真实数据上进行说明和评估的。特别是可以观察到,预测精度可以提高,并且可以通过以完全数据驱动的方式“降级”相应的距离度量来识别/删除无关的噪声变量。

MSC公司:

62G08号 非参数回归和分位数回归
62甲12 多元分析中的估计
62H30型 分类和区分;聚类分析(统计方面)
第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aneiros,G。;新南威尔士州诺沃。;Vieu,P.,函数回归模型中的变量选择:综述,多元分析杂志,188(2022)·doi:10.1016/j.jmva.2021.104861
[2] Baranzini,东南部;穆萨维,P。;J.里约。;Caillier,SJ;斯蒂尔曼,A。;维洛斯拉达,P。;怀亚特,MM;科马贝拉,M。;格雷勒,LD;Somogyi,R。;蒙塔尔班,X。;Oksenberg,JR,使用监督计算方法基于转录的IFN反应预测,《公共科学图书馆·生物》,3,1(2004)·doi:10.1371/journal.pbio.0030002
[3] Brier,GW,以概率表示的预测验证,《月度天气评论》,78,1,1-3(1950)·doi:10.1175/1520-0493(1950)078<0001:VOFEIT>2.0.CO;2
[4] Fernández-Fontelo A、Henninger F、Kieslich PJ、Kreuter F、Greven S(2021)《预测网络调查中的问题难度:基于鼠标移动特征的机器学习方法》。《社会科学计算机评论》第1-22页
[5] 费拉蒂,F。;Vieu,P.,非参数函数数据分析(2006),纽约:Springer统计系列,Springer,纽约·Zbl 1119.62046号
[6] Fuchs,K。;Gerthiss,J。;Tutz,G.,《具有可解释特征选择的功能数据的最近邻系综》,化学计量学和智能实验室系统,146186-197(2015)·doi:10.1016/j.chemolab.2015.04.019
[7] Gneiting,T。;Raftery,AE,《严格正确的评分规则、预测和估计》,美国统计协会杂志,102,477,359-378(2007)·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[8] Goldsmith J、Scheipl F、Huang L、Wrobel J、Di C、Gellar J、Harezlak J、McLean MW、Swihart B、Xiao L、Crainiceanu C、Reiss PT(2021)退款:功能数据回归。https://CRAN.R-project.org/package=退款,r包版本0.1-24
[9] Górecki,T。;Łuczak,M.,具有参数导数动态时间扭曲的多变量时间序列分类,具有Appl的专家系统,422305-2312(2015)·doi:10.1016/j.eswa.2014.11.007
[10] Górecki T,SmagaŁ(2017)mfds:多元函数数据集。波兹南Adam Mickiewicz大学,https://github.com/Halmaris/mfds网址,r软件包版本0.1.0·Zbl 1516.62307号
[11] 居尔,A。;Perperoglou,A。;Z.Khan。;O.马哈茂德。;米夫塔赫丁,M。;阿德勒,W。;Lausen,B.,kNN分类器子集的集合,《数据分析和分类中的高级》,12827-840(2018)·Zbl 1416.62338号 ·doi:10.1007/s11634-015-0227-5
[12] 霍尔,P。;李强。;Racine,JS,在不相关回归变量存在的情况下对回归函数的非参数估计,《经济与统计评论》,89,4784-789(2007)·doi:10.1162/rest.89.4.784
[13] Härdle W,Müller M(2000)多元和半参数核回归。收录:Schimek MG(ed)平滑与回归:方法、计算和应用。《概率统计威利级数》,威利,纽约(第12章)·Zbl 0979.62023号
[14] 哈斯蒂,T。;Tibshiranie,R。;Friedman,J.,《统计学习的要素——数据挖掘、推断和预测》(2009),纽约:Springer Series in Statistics,Springer,New York·Zbl 1273.62005年
[15] Hirose,O。;吉田,R。;山口,R。;Imoto,S。;Higuchi,T。;Miyano,S.,使用混合状态空间模型以时间进程基因表达谱为特征的聚类样本,Genome Inf,18,258-266(2007)
[16] 卡亚诺,M。;松井,H。;山口,R。;Imoto,S。;Miyano,S.,通过功能logistic模型中的稀疏估计对时间进程表达谱进行基因集差异分析,应用于时间相关生物标记检测,Biostat,17,2,235-248(2016)·doi:10.1093/biostatistics/kxv037
[17] Kokoszka P、Reimherr M(2017)《功能数据分析导论》。统计科学课文。纽约CRC出版社·Zbl 1411.62004号
[18] Koolagudi SG、Rastogi D、Rao KS(2012)《使用mel-frequency倒谱系数(mfcc)识别语言》。在:Rajesh R,Ganesh K,Koh SCL(编辑)Procedia Engineering 38:国际建模、优化和计算会议(ICMOC)。阿姆斯特丹爱思维尔,第3391-3398页
[19] Krzy Shi-ko,M。;斯马加。,函数多元回归模型在多类分类中的应用,Trans New Ser统计,18,3,433-442(2017)
[20] Liaw A,Wiener M(2002)随机森林分类与回归。R新闻2(3):18-22。https://CRAN.R-project.org/doc/Rnews/
[21] 姆比纳,AM;总经理Nkiet;Obiang,FE,混合连续二元变量和多组判别分析中的变量选择,《数据分析和分类进展》,13,773-795(2019)·Zbl 1474.62239号 ·doi:10.1007/s11634-018-0343-0
[22] Möller A,Gerthiss J(2018)功能数据的分类树。收录于:第33届国际统计建模研讨会论文集。统计建模学会,第219-224页
[23] Nadaraya,EA,关于密度函数和回归曲线的非参数估计,Probab理论及其应用,186-190年10月(1964年)·Zbl 0134.36302号 ·数字对象标识代码:10.1137/1110024
[24] R核心团队(2020)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/
[25] 拉辛,JS;李琼,分类数据和连续数据回归函数的非参数估计,经济杂志,11999-130(2004)·Zbl 1337.62062号 ·doi:10.1016/S0304-4076(03)00157-X
[26] 拉辛,JS;Hart,JD;Li,Q.,检验非参数回归模型中分类预测变量的重要性,经济理论,25,1-42(2006)
[27] Ramsay,J。;Silverman,B.,《功能数据分析》(2005),纽约:Springer统计系列,Springer,纽约·Zbl 1079.62006号 ·doi:10.1007/b98888
[28] Revelle W(2021)《心理工具:陪伴心理的工具》;心理研究包。伊利诺伊州埃文斯顿西北大学,https://CRAN.R-project.org/package=psychTools,r包版本2.1.6
[29] Selten,R.,二次评分规则的公理化表征,《实验经济学》,143-62(1998)·Zbl 0919.90003号 ·doi:10.1023/A:1009957816843
[30] Shang,HL,带混合回归元和未知误差密度的函数非参数回归模型的贝叶斯带宽估计,非参数统计杂志,26,3,599-615(2014)·Zbl 1305.62176号 ·doi:10.1080/10485252.2014.916806
[31] Vahle NM,Tomasik MJ(2021年),当年轻人在虚拟现实中体验到变老时,他们的记忆力和身体机能会下降。预印本,储存库:OSFhttps://osf.io/h53rk/
[32] Venables WN,Ripley BD(2002)《现代应用统计学与S》,第4版。纽约州施普林格。http://www.stats.ox.ac.uk/pub/MASS4网站/,国际标准书号0-387-95457-0·Zbl 1006.62003号
[33] 沃格尔,F。;新墨西哥州瓦勒;格特斯,J。;Tomasik,MJ,《虚拟现实实验中分析运动模式的监督学习》,皇家社会科学院开放科学,9(2022)·doi:10.1098/rsos.211594
[34] Watson,GS,平滑回归分析,Sankhya Ser A,26,359-372(1964)·Zbl 0137.13002号
[35] 姚,F。;穆勒,HG;Wang,JL,稀疏纵向数据的功能数据分析,美国统计协会杂志,100470577-590(2005)·Zbl 1117.62451号 ·doi:10.1198/0162145000001745
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。