IDEAS主页打印自https://ideas.repec.org/a/bpj/sagmbi/v10y2011i1n34.html
  我的参考书目  保存此文章

利用CAR得分进行高维回归和变量选择

作者

上市的:
  • 祖伯·维雷纳

    (莱比锡大学)

  • 前锋科尔比尼安

    (莱比锡大学)

摘要

变量选择是一个困难的问题,在高维基因组数据分析中尤其具有挑战性。在这里,我们介绍了CAR评分,这是一种基于解释变量马氏去相关的线性回归中变量排序的新颖且高效的标准。CAR评分提供了一个标准排序,鼓励将相关预测因子和向下的对抗变量分组。它分解了所解释的方差比例,是边际相关和标准化回归系数之间的中间值。作为一个总体数量,任何优选的推理方案都可以用于其估计。通过仿真,我们证明了通过CAR分数进行变量选择是非常有效的,并且产生了预测误差和真、假阳性率,与弹性网和boosting等现代回归技术相比,这些误差和假阳性率都是有利的。我们通过分析与糖尿病进展和衰老对人脑基因表达的影响有关的数据来说明我们的方法。CRAN提供了实施CAR评分回归的R包“护理”。

建议引用

  • Zuber Verena和Strimmer Korbinian,2011年。"利用CAR得分进行高维回归和变量选择,"遗传学和分子生物学中的统计应用De Gruyter,第10卷(1),第1-27页,7月。
  • 手柄:RePEc:bpj:sagmbi:v:10:y:2011:i:1:n:34
    内政部:10.2202/1544-6115.1730
    作为

    从出版商下载全文

    文件URL: https://doi.org/10.2202/1544-6115.1730
    下载限制:要访问全文,需要订阅期刊或支付单个文章的费用。

    文件URL: https://libkey.io/10.2202/1544-6115.1730?utm_source=ideas
    LibKey链接:如果访问受到限制,并且您的库使用此服务,LibKey会将您重定向到可以使用库订阅访问此项目的位置
    ---><---

    由于此文档的访问受到限制,您可能希望搜索换一个不同的版本。

    IDEAS上列出的参考文献

    作为
    1. Tao Lu、Ying Pan、Shyan Yuan Kao、Cheng Li、Isaac Kohane、Jennifer Chan和Bruce A.Yankner,2004年。"衰老人脑中的基因调控与DNA损伤,"自然《自然》,第429卷(6994),第883-891页,6月。
    2. Schäfer Juliane&Strimmer Korbinian,2005年。"大尺度协方差矩阵估计的收缩方法及其在功能基因组学中的应用,"遗传学和分子生物学中的统计应用De Gruyter,第4卷(1),第1-32页,11月。
    3. Howard D.Bondell和Brian J.Reich,2008年。"用OSCAR同时进行回归收缩、变量选择和预测的监督聚类,"生物计量学国际生物识别学会,第64卷(1),第115-123页,3月。
    4. Hui Zou和Trevor Hastie,2005年。"补遗:通过弹性网进行规则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(5),第768-768页,11月。
    5. Hui Zou和Trevor Hastie,2005年。"通过弹性网进行正则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(2),第301-320页,4月。
    完整参考文献 (包括与IDEAS上的项目不匹配的项目)

    引文

    引文由CitEc项目,订阅其RSS源用于此项目。
    作为


    引用人:

    1. 魏鹏飞、卢振洲、宋景文,2015。"变量重要性分析:综述,"可靠性工程与系统安全爱思唯尔,第142(C)卷,第399-432页。
    2. PawełTeisseyre&Robert A.K \322»opotek&Jan Mielniczuk,2016年。"R包regRSM高维回归的随机子空间方法,"计算统计学,施普林格,第31卷(3),第943-972页,9月。
    3. 姓名1 Dieter Wang Email 1&Iman(I.P.P.)van Lelyveld&Julia(J.)Schaumburg,2018年。"信息传染和商业模式的相似性能解释银行信贷风险的共性吗?,"廷伯根研究所讨论文件18-100/IV,廷伯根研究所。
    4. Kirchner,Mathias&Schönhart,Martin&Schmid,Erwin,2016年。"2013年后CAP和气候变化情景对奥地利农业集约化和环境的空间影响,"生态经济学爱思唯尔,第123(C)卷,第35-56页。
    5. Vicente Rios,2017年。"是什么推动了欧洲地区的失业差距?动态空间面板方法,"区域研究《泰勒和弗朗西斯杂志》,第51卷(11),第1599-1611页,11月。
    6. 米里亚姆·霍塔斯·里科和维森特·里奥斯,2022年。"女性的政治权力对收入不平等有影响吗?,"工作文件。A辑:公共经济学、治理和权力下放2206,维戈大学,GEN-治理和经济研究网络。
    7. Tasadduq Imam&Kevin Tickle&Abdullahi Ahmed&William Guo,2012年。"澳元/美元汇率与相关股市指数之间的线性关系:计算金融视角,"会计、财务和管理智能系统,John Wiley&Sons,Ltd.,第19卷(1),第19-42页,1月。
    8. 阿兰·查尼(Alain Chaney)和马丁·霍斯利(Martin Hoesli),2015年。"基于交易和基于评估的资本化率决定因素,"《国际房地产评论》全球社会科学研究所,第18卷(1),第1-43页。
    9. Wang Chamont&Gevertz Jana L.,2016年。"从高维数据中寻找致病基因:对统计和机器学习方法的评估,"遗传学和分子生物学中的统计应用De Gruyter,第15卷(4),第321-347页,8月。
    10. 巴雷托、伊卡洛·丹尼尔·德·卡瓦略和多尔、路易斯·亨利克和斯托西奇、塔季亚纳和斯托西克、博尔科·D·巴雷托,2021年。"扩展基于DFA的多元线性回归推理:在声阻抗模型中的应用,"物理学A:统计力学及其应用爱思唯尔,第582(C)卷。
    11. Vicente Rios和Lisa Gianmoena,2021年。"气温与地区疫情严重程度的关系:来自意大利的证据,"区域科学政策与实践Wiley Blackwell,第13卷(S1),第109-137页,11月。
    12. Michael R.Crager,2020年。"绝对标准化危险比的扩展以及与解释变异和变量重要性度量的联系,"终身数据分析:一本致力于时间到事件数据统计方法和应用的国际期刊施普林格,第26卷(4),第872-892页,10月。

    最相关的项目

    这些是最常引用与本书相同作品的项目,也被与本书同样的作品引用。
    1. 穆斯塔法·雷扎伊(Mostafa Rezaei)、科特迪瓦·克里本(Ivor Cribben)和米歇尔·萨莫拉尼(Michele Samorani),2021年。"一种基于聚类的关系属性自动生成特征选择方法,"运筹学年鉴施普林格,第303(1)卷,第233-263页,8月。
    2. Wang,Christina Dan&Chen,Zhao&Lian,Yimin&Chen,Min,2022。"基于高频夏普比率的资产选择,"计量经济学杂志爱思唯尔,第227(1)卷,第168-188页。
    3. Ander Wilson和Brian J.Reich,2014年。"通过惩罚可信区域选择混淆器,"生物计量学国际生物识别学会,第70卷(4),第852-861页,12月。
    4. 曲文涛、秀贤超、陈黄岳、孔凌晨,2023年。"高维子空间聚类研究综述,"数学,MDPI,第11卷(2),第1-39页,1月。
    5. Jorge A Chan-Lau先生,2017年。"方差分解网络:潜在缺陷和简单解决方案,"国际货币基金组织工作文件2017/107,国际货币基金组织。
    6. Diebold,Francis X.&Shin,Minchul,2019年。"正则化调查预测组合的机器学习:部分伽利略LASSO及其衍生物,"国际预测杂志,爱思唯尔,第35卷(4),第1679-1691页。
    7. Aderhold Andrej&Husmeier Dirk&Grzegorczyk Marco,2014年。"昼夜节律调控网络的统计推断,"遗传学和分子生物学中的统计应用De Gruyter,第13卷(3),第1-47页,6月。
    8. Marius Arend、Yichong Yuan和M.águila Ruiz-Sola、Nooshin Omranian、Zoran Nikoloski和Dimitris Petroutsos,2023年。"拓宽绿藻光保护转录调控领域,"自然通信《自然》,第14卷(1),第1-15页,12月。
    9. 王培(Pei Wang)、陈顺杰(Shunjie Chen)和杨思嘉(Sijia Yang),2022年。"生物数据惩罚回归模型的最新进展,"数学,MDPI,第10卷(19),第1-24页,10月。
    10. Justin B.Post和Howard D.Bondell,2013年。"交互方差分析模型中的因子选择和结构识别,"生物计量学国际生物识别学会,第69卷(1),第70-79页,3月。
    11. Mihee Lee和Haipeng Shen&Jianhua Z.Huang&J.S.Marron,2010年。"基于稀疏奇异值分解的双聚类,"生物计量学国际生物识别学会,第66卷(4),第1087-1095页,12月。
    12. 蒋丽文、邦德尔、霍华德·D·王、惠霞·朱迪,2014年。"分位数回归中的分位数间收缩和变量选择,"计算统计与数据分析爱思唯尔,第69卷(C),第208-219页。
    13. Pei Wang&Dennis L.Chao&Li Hsu,2011年。"从二元基因组不稳定性数据中学习致癌途径,"生物计量学国际生物识别学会,第67卷(1),第164-173页,3月。
    14. Xing,Xin&Hu,Jinjin&Yang,Yaning,2014年。"具有L无穷约束的稳健最小方差投资组合,"银行与金融杂志,爱思唯尔,第46卷(C),第107-117页。
    15. Philip Kostov、Thankom Arun和Samuel Annim,2014年。"非银行金融服务:南非Mzansi干预案,"当代经济学华沙经济与人文科学大学。,第8卷(2),6月。
    16. Charbonnier Camille&Chiquet Julien&Ambroise Christophe,2010年。"基于时间历程数据的结构化网络推断的加权最小二乘法,"遗传学和分子生物学中的统计应用De Gruyter,第9卷(1),第1-29页,2月。
    17. Kremer,Philipp J.&Lee,Sangkyun&Bogdan,Małgorzata&Paterlini,Sandra,2020年。"通过排序的▽1-范数选择稀疏投资组合,"银行与金融杂志爱思唯尔,第110(C)卷。
    18. Sunkyung Kim、Wei Pan和Xiaotong Shen,2013年。"基于网络的惩罚回归及其在基因组数据中的应用,"生物计量学国际生物识别学会,第69卷(3),第582-593页,9月。
    19. Howard D.Bondell和Brian J.Reich,2009年。"方差分析中的同时因子选择和崩溃水平,"生物计量学国际生物识别学会,第65卷(1),第169-177页,3月。
    20. Guibert,Quentin&Lopez,Olivier&Piette,Pierrick,2019年。"用高维VAR预测死亡率的改善,"保险:数学与经济学爱思唯尔,第88卷(C),第255-272页。

    有关此项目的更多信息

    统计

    访问和下载统计

    更正

    本网站上的所有材料均由各自的出版商和作者提供。你可以帮助纠正错误和遗漏。请求更正时,请提及此项目的句柄:RePEc:bpj:sagmbi:v:10:y:2011:i:1:n:34。请参阅一般信息关于如何更正RePEc中的材料。

    如果您编写了此项目,但尚未在RePEc注册,我们鼓励您这样做在这里。这允许将您的个人资料链接到此项目。它还允许您接受我们不确定的该项目的潜在引用。

    如果CitEc公司识别了书目参考,但没有将RePEc中的项目链接到它,您可以帮助这个表格.

    如果你知道引用这一条的缺失条目,你可以通过以与上述相同的方式为每个引用条目添加相关引用来帮助我们创建这些链接。如果您是此项目的注册作者,您可能还需要检查您的RePEc作者服务个人资料,因为可能有一些引文等待确认。

    有关此项目的技术问题,或更正其作者、标题、摘要、书目或下载信息,请联系:Peter Golla(以下电子邮件可用)。供应商的一般联系方式:网址:https://www.degruyter.com.

    请注意,更正可能需要几周时间才能筛选出来各种RePEc服务。

    思想是一个经济学研究论文服务。RePEc使用各出版商提供的书目数据。