IDEAS主页打印自https://ideas.repec.org/p/hal/journl/hal-01954386.html
  我的参考书目  保存此纸张

回归分析中变量选择的研究进展

作者

上市的:
  • Loann David Denis Desboulets贷款

    (AMSE-Aix-Marseille Sciences Economiques-EHESS-埃科尔高等科学社-AMU-Aix-马赛大学-ECM-埃科尔·马赛中心-CNRS-国家科学研究中心)

摘要

在本文中,我们调查了39个变量的选择过程,以概述现有的1个文献,供从业者使用。自从数据量显著增长以来,“让数据为自己说话”已成为许多应用研究人员的座右铭。很长一段时间以来,数据驱动理论的搜索3提出了自动模型选择。然而,尽管在4个理论方面进行了很大的扩展,但大多数实证工作仍使用基本程序,例如逐步回归。文献中已经有一些综述5可用于变量选择,但总是关注特定的主题,如线性6回归、变量组或平滑变化系数。在这里,我们回顾了主要方法和7种最先进的扩展,以及它们在各种模型结构(线性、分组、8种可加性、部分线性和非参数)上的拓扑结构。我们解释了用于不同9种模型目的的方法以及它们之间的关键差异。我们还回顾了两种在一般意义上改进变量10选择的方法。11

建议引用

  • Loann David Denis Desboulets,2018年。"回归分析中变量选择的研究进展,"打印后hal-01954386,哈尔。
  • 手柄:RePEc:哈尔:日:哈尔-01954386
    DOI:10.3390/计量经济学6040045
    注:在HAL open archive server上查看原始文档:https://amu.hal.science/hal-01954386
    作为

    从出版商下载全文

    文件URL: https://amu.hal.science/hal-01954386/document网站
    下载限制:

    文件URL: https://libkey.io/10.3390/economometrics6040045?utm_source=ideas
    LibKey链接:如果访问受到限制,并且您的库使用此服务,LibKey会将您重定向到可以使用库订阅访问此项目的位置
    ---><---

    此项目的其他版本:

    IDEAS上列出的参考文献

    作为
    1. Radchenko,Peter&James,Gareth M.,2010年。"基于自适应非线性交互结构的高维变量选择,"美国统计协会杂志,美国统计协会,第105卷(492),第1541-1553页。
    2. 李润泽、钟伟、朱丽萍,2012。"基于距离相关学习的特征筛选,"美国统计协会杂志《泰勒与弗朗西斯杂志》,第107卷(499),第1129-1139页,9月。
    3. 黄健(Jian Huang)、马双禾(Shuang e Ma)、谢慧良(Huiliang Xie)和张存辉(Cun-Hui Zhang),2009年。"一种用于变量选择的群桥方法,"生物特征《Biometrika信托》,第96卷(2),第339-355页。
    4. Fan J.&Li R.,2001年。"基于非冲突惩罚似然的变量选择及其Oracle性质,"美国统计协会杂志,美国统计协会,第96卷,第1348-1360页,12月。
    5. Jennifer L.Castle和David F.Hendry,2010年。"非线性的低维portmanteau检验,"计量经济学杂志爱思唯尔,第158(2)卷,第231-245页,10月。
    6. 王,韩生,夏,应村,2009。"变系数模型的收缩率估计,"美国统计协会杂志,美国统计协会,第104卷(486),第747-757页。
    7. 卡米拉·埃普雷希特(Camila Epprecht)、多米尼克·盖根(Dominique Guegan)、阿尔瓦罗·维加(Alvaro Veiga)和乔尔·科雷亚·达罗莎(Joel Correa da Rosa),2017年。"通过线性模型的自动化方法进行变量选择和预测:LASSO/adaLASSO和Autometrics,"打印后哈尔什-00917797,哈尔。
    8. 倪,肖&张,郝海伦&张,道文,2009。"部分线性模型的自动模型选择,"多元分析杂志爱思唯尔,第100卷(9),第2100-2111页,10月。
    9. 卡洛斯·桑托斯(Carlos Santos)、大卫·亨德里(David Hendry)和索伦·约翰森(Soren Johansen),2008年。"完全饱和回归中指标的自动选择,"计算统计学《施普林格》,第23卷(2),第317-335页,4月。
    10. 张,静&刘,燕燕&吴,袁山,2017。"超高维生存数据的相关秩筛选,"计算统计与数据分析爱思唯尔,第108卷(C),第121-132页。
    11. Choi,Nam Hee&Li,William&Zhu,Ji,2010年。"强遗传约束变量选择及其Oracle性质,"美国统计协会杂志,美国统计协会,第105卷(489),第354-364页。
    12. 亨德利·D.F.和理查德·J.F.,1987年。"包容理论的最新发展,"LIDAM讨论文件核心1987022年,卢万天主教大学,运营研究和计量经济中心(CORE)。
    13. 邹辉,2006。"自适应套索及其Oracle特性,"美国统计协会杂志,美国统计协会,第101卷,第1418-1429页,12月。
    14. Friedman,Jerome H.&Hastie,Trevor&Tibshirani,Rob,2010年。"广义线性模型的坐标下降正则化路径,"统计软件杂志《开放获取统计基金会》,第33卷(i01)。
    15. 范建清,冯,杨,宋,芮,2011。"稀疏超高维可加模型中的非参数独立筛选,"美国统计协会杂志,美国统计协会,第106卷(494),第544-557页。
    16. 广诚、张浩、尚左凤,2015。"增维部分样条模型的稀疏有效估计,"统计数学研究所年鉴,施普林格;统计数学研究所,第67卷(1),第93-127页,2月。
    17. Kim,Yongdai&Choi,Hosik&Oh,Hee-Seok,2008年。"高维上的平滑剪裁绝对偏差,"美国统计协会杂志美国统计协会,第103卷(484),第1665-1673页。
    18. Robert Tibshirani、Michael Saunders、Saharon Rosset、Ji Zhu和Keith Knight,2005年。"通过融合套索实现稀疏和流畅,"英国皇家统计学会学报B辑皇家统计学会,第67卷(1),第91-108页,2月。
    19. Castle Jennifer L.和Doornik Jurgen A&Hendry David F.,2011年。"评估自动模型选择,"时间序列计量经济学杂志De Gruyter,第3卷(1),第1-33页,2月。
    20. Byeong U.Park&Enno Mammen&Young K.Lee&Eun Ryung Lee,2015年。"变系数回归模型:综述与新进展,"国际统计评论国际统计局,第83卷(1),第36-64页,4月。
    21. 卡米拉·埃普雷希特(Camila Epprecht)、多米尼克·盖根(Dominique Guegan)、阿尔瓦罗·维加(Alvaro Veiga)和乔尔·科雷亚·达罗萨(Joel Correa da Rosa),2013年。"通过线性模型的自动化方法进行变量选择和预测:LASSO/adaLASSO和Autometrics,"索邦经济中心劳动文件索邦大学(巴黎1号),索邦经济中心,13080r,2017年10月修订。
    22. Rajen D.Shah和Richard J.Samworth,2013年。"误差控制变量选择:稳定性选择的另一种观点,"英国皇家统计学会学报B辑英国皇家统计学会,第75卷(1),第55-80页,1月。
    23. 范建清,吕金驰,2008。"超高维特征空间的确定独立筛选,"英国皇家统计学会学报B辑,皇家统计学会,第70卷(5),第849-911页,11月。
    24. Hui Zou和Trevor Hastie,2005年。"补遗:通过弹性网进行规则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(5),第768-768页,11月。
    25. McIlhagga,William,2016年。"惩罚:用于拟合带惩罚的广义线性模型的MATLAB工具箱,"统计软件杂志开放获取统计基金会,第72卷(i06)。
    26. 王汉生,2009。"超高维变量筛选的正向回归,"美国统计协会杂志,美国统计协会,第104卷(488),第1512-1524页。
    27. Hui Zou和Trevor Hastie,2005年。"基于弹性网络的正则化与变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(2),第301-320页,4月。
    28. Ming Yuan和Yi Lin,2006年。"分组变量回归中的模型选择与估计,"英国皇家统计学会学报B辑皇家统计学会,第68卷(1),第49-67页,2月。
    完整参考文献 (包括与IDEAS上的项目不匹配的项目)

    引文

    引文由CitEc项目,订阅其RSS源用于此项目。
    作为


    引用人:

    1. Fakhri J.Hasanov、Elchin Suleymanov、Heyran Aliyeva、Hezi Eynalov和Sa’d Shannak,2022年。"是什么推动了阿塞拜疆的农业增长?超饱和Autometrics的见解,"文莱大学学报孟德尔大学出版社,第70卷(3),第147-174页。
    2. Kimia Keshanian&Daniel Zantedeschi&Kaushik Dutta,2022年。"特征选择作为纳什讨价还价解决方案:在在线广告和信息系统中的应用,"信息计算杂志《信息》,第34卷(5),第2485-2501页,9月。
    3. Rahi Jain和Wei Xu,2021年。"HDSI:高维选择与特征选择和测试的交互算法,"PLOS ONE系列,公共科学图书馆,第16卷(2),第1-17页,2月。
    4. Fakhri J.Hasanov、Muhammad Javid和Frederick L.Joutz,2022年。"新冠肺炎前后沙特非石油出口:决定因素的历史影响和情景分析,"持续性,MDPI,第14卷(4),第1-38页,2月。
    5. 爱德华多·科雷亚(Eduardo Correia)、罗德里戈·卡利(Rodrigo Calili)、何塞·弗朗西斯科·佩桑哈(JoséFrancisco Pessanha)和玛丽亚·法蒂玛·阿尔梅达(Maria Fatima Almeida),2023年。"电力非技术损失监管目标的定义:面板数据回归自动模型选择技术的提出,"能源,MDPI,第16卷(6),第1-22页,3月。
    6. Aneiros,Germanán&Novo,Silvia&Vieu,Philippe,2022年。"函数回归模型中的变量选择:综述,"多元分析杂志爱思唯尔,第188(C)卷。
    7. Berndt Jesenko和Christian Schlögl,2021年。"科学主题类别网络对聚类的影响:以商业和经济科学中的数据驱动方法为例,"科学计量学,施普林格;Akadémiai Kiadó,第126卷(8),第6785-6801页,八月。
    8. Marcin Błażejowski&Jacek Kwiatkowski&Pawe \322»Kufel,2020年。"BACE和BMA使用Gretl对英国货币需求和通货膨胀的变量选择和预测,"计量经济学,MDPI,第8卷(2),第1-29页,5月。
    9. Gonzalo García-Donato和María Eugenia Castellanos&Alicia Quirós,2021年。"贝叶斯变量选择及其在健康科学中的应用,"数学,MDPI,第9卷(3),第1-16页,1月。
    10. 高旺(Gao Wang)、阿比谢克·萨卡尔(Abhishek Sarkar)、彼得·卡博内托(Peter Carbonetto)和马修·斯蒂芬斯(Matthew Stephens),2020年。"回归中变量选择的一种简单新方法及其在遗传精细作图中的应用,"英国皇家统计学会学报B辑英国皇家统计学会,第82(5)卷,第1273-1300页,12月。
    11. Iztok Podbregar和GoranŠimić&Mirjana Radovanović和Sanja Filipović&PolonaŠprajc,2020年。"国际能源安全风险指数——方法设置分析,"能源,MDPI,第13卷(12),第1-15页,6月。
    12. Robert Giel和Alicja Dąbrowska,2021年。"用多元回归模型估算垃圾车在垃圾收集点花费的时间,"持续性,MDPI,第13卷(8),第1-14页,4月。

    最相关的项目

    这些是最常引用与本书相同作品的项目,也被与本书同样的作品引用。
    1. 王祥宇,冷晨雷,2016。"筛选变量的高维普通最小二乘投影,"英国皇家统计学会学报B辑英国皇家统计学会,第78卷(3),第589-611页,6月。
    2. 王培(Pei Wang)、陈顺杰(Shunjie Chen)和杨思嘉(Sijia Yang),2022年。"生物数据惩罚回归模型的最新进展,"数学,MDPI,第10卷(19),第1-24页,10月。
    3. Li Yun和O'Connor George T.&Dupuis Josée&Kolaczyk Eric,2015年。"基于群体结构的稀疏回归模型用于全基因组关联研究,"遗传学和分子生物学中的统计应用De Gruyter,第14卷(3),第265-277页,6月。
    4. Min Chen&Yimin Lian&Zhao Chen&Zhengjun Zhang,2017年。"明确解释了变异性和独立性筛选,"非参数统计杂志《泰勒与弗朗西斯杂志》,第29卷(4),第849-883页,10月。
    5. Dai,Linlin&Chen,Kani&Sun,Zhihua&Liu,Zhenqiu&Li,Gang,2018年。"断裂自适应岭回归及其渐近性质,"多元分析杂志爱思唯尔,第168(C)卷,第334-351页。
    6. 王黎明、李兴祥、王晓庆、赖鹏,2022年。"超高维回归的统一均值-方差特征筛选,"计算统计学施普林格,第37卷(4),第1887-1918页,9月。
    7. Diego Vidaurre、Concha Bielza和Pedro Larrañaga,2013年。"L1回归综述,"国际统计评论国际统计局,第81(3)卷,第361-387页,12月。
    8. 王明秋和田国亮,2016。"高维部分线性模型的鲁棒群非凸估计,"非参数统计杂志《泰勒与弗朗西斯杂志》,第28卷(1),第49-67页,3月。
    9. Howard D.Bondell和Brian J.Reich,2012年。"基于惩罚可信域的一致高维贝叶斯变量选择,"美国统计协会杂志《泰勒与弗朗西斯杂志》,第107卷(500),1610-1624页,12月。
    10. Tutz,Gerhard&Pößnecker,Wolfgang&Uhlmann,Lorenz,2015年。"一般多项式logit模型中的变量选择,"计算统计与数据分析爱思唯尔,第82(C)卷,第207-222页。
    11. Wang、Christina Dan和Chen、Zhao和Lian、Yimin和Chen,Min,2022年。"基于高频夏普比率的资产选择,"计量经济学杂志爱思唯尔,第227(1)卷,第168-188页。
    12. 卡帕努、马里内拉和朱尔卡努、米海和贝格、科林·B·哥宁、米塔特,2023年。"基于子抽样的广义线性模型变量选择,"计算统计与数据分析爱思唯尔,第184(C)卷。
    13. TomášPlíhal,2021年。"预定宏观经济新闻公告和外汇波动预测,"预测杂志,John Wiley&Sons,Ltd.,第40卷(8),第1379-1397页,12月。
    14. 罗靖萱、岳丽丽和李高荣,2023年。"高维测量误差回归模型综述,"数学,MDPI,第11卷(14),第1-22页,7月。
    15. Takumi Saegusa和Tianzhou Ma和Gang Li、Ying Qing Chen和Mei Ling Ting Lee,2020。"阈值回归模型中的变量选择及其在HIV药物依从性数据中的应用,"生物科学统计,施普林格;国际中国统计协会,第12卷(3),第376-398页,12月。
    16. 里卡多·马西尼(Ricardo P.Masini)、马塞洛·梅德罗斯(Marcelo C.Medeiros)和爱德华多·门德斯(Eduardo F.Mendes),2023年。"时间序列预测的机器学习进展,"经济调查杂志Wiley Blackwell,第37卷(1),第76-111页,2月。
    17. Massimiliano Caporin和Francesco Poli,2017年。"从文本数据构建新闻度量及其在波动性预测中的应用,"计量经济学,MDPI,第5卷(3),第1-46页,8月。
    18. Justin B.Post和Howard D.Bondell,2013年。"交互方差分析模型中的因子选择和结构识别,"生物计量学国际生物识别学会,第69卷(1),第70-79页,3月。
    19. 张树聪,周勇,2018。"基于条件分位数相关的超高维异质数据变量筛选,"多元分析杂志,爱思唯尔,第165卷(C),第1-13页。
    20. Jonathan Boss、Alexander Rix、Yin‐Hsiu Chen、Naveen N.Narisetty、Zhenke Wu、Kelly K.Ferguson、Thomas F.McElrath、John D.Meeker和Bhramar Mukherjee,2021年。"用于环境混合物分析的层次综合群最小绝对收缩和选择算子,"环境计量学,John Wiley&Sons,Ltd.,第32卷(8),12月。

    有关此项目的更多信息

    关键词

    自动建模;变量选择;稀疏模型;
    所有这些关键字.

    JEL公司分类:

    • B23型-经济思想和方法学派——1925年以来的经济思想史——计量经济学;定量与数学研究
    • C类-数学和定量方法
    • 二氧化碳-数学和定量方法——概述——概述
    • 二氧化碳-数学和定量方法--一般--计量经济学
    • C1类-数学和定量方法——计量经济和统计方法与方法:概述
    • 指挥与控制-数学与定量方法——单方程模型;单个变量
    • C3级-数学与定量方法——多重或联立方程模型;多个变量
    • 补体第四成份-数学和定量方法——计量经济学和统计方法:专题
    • C5级-数学和定量方法——计量经济学建模
    • C8-数学和定量方法——数据收集和数据估计方法;计算机程序

    统计

    访问和下载统计

    更正

    本网站上的所有材料均由各自的出版商和作者提供。您可以帮助纠正错误和遗漏。请求更正时,请提及此项目的句柄:RePEc:hal:journl:hal-01954386。请参阅一般信息关于如何更正RePEc中的材料。

    如果您编写了此项目,但尚未在RePEc注册,我们鼓励您这样做在这里。这允许将您的个人资料链接到此项目。它还允许您接受我们不确定的该项目的潜在引用。

    如果CitEc公司识别了书目参考,但没有将RePEc中的项目链接到它,您可以帮助这个表格.

    如果你知道引用这一条的缺失条目,你可以通过以与上述相同的方式为每个引用条目添加相关引用来帮助我们创建这些链接。如果您是此项目的注册作者,您可能还需要检查您的RePEc作者服务个人资料,因为可能有一些引文等待确认。

    有关此项目的技术问题,或更正其作者、标题、摘要、书目或下载信息,请联系:CCSD(以下电子邮件可用)。供应商的一般联系方式:https://hal.archives-ouvertes.fr/.

    请注意,更正可能需要几周时间才能筛选出来各种RePEc服务。

    思想是一个经济学研究论文服务。RePEc使用各出版商提供的书目数据。