IDEAS主页打印自https://ideas.repec.org/a/eee/eneeco/v120y2023ics014098832301196.html
  我的参考书目  保存此文章

在数据包络分析中使用机器学习选择变量:使用配电数据的模拟和应用

作者

上市的:
  • 托尼·杜拉斯
  • 法鲁克·贾维德
  • 克里斯托弗·马森
  • 帕尔Sjölander
  • 马格纳斯·Söderberg

摘要

监管电力供应商的机构通常采用非参数数据包络分析(DEA)来评估每家公司的相对效率。DEA的可靠性和有效性取决于相关输入变量的选择。在大(宽)数据时代,由于高维数据及其标准经验属性的挑战,传统变量选择技术的假设经常被违背。目前,监管机构可以获得大量潜在的输入变量。因此,我们的目标是为能源市场监管机构引入新的机器学习方法。我们还提出了一种新的两步分析方法,在第一步中,使用基于机器学习的自适应最小绝对收缩和选择算子(ALASSO)选择变量,在第二步中,在DEA模型中使用选定的变量。与之前的研究相比,我们发现,通过使用生产函数常见的更现实的数据生成过程(即Cobb–Douglas和Translog),不同机器学习技术的性能在不同的经验相关情况下存在显著差异。仿真还表明,当共线性度较低或适中时,ALASSO方法优于其他基于机器学习和回归的方法。然而,在多重共线性的情况下,LASSO方法表现出最好的性能。我们还使用瑞典配电市场的实际数据来说明选择最合适的变量选择方法的经验相关性。

建议引用

  • Duras、Toni&Javed、Farrukh&Mánsson、Kristofer&Sjölander、Pär&Söderberg、Magnus,2023年。"使用机器学习选择数据包络分析中的变量:使用配电数据的模拟和应用,"能源经济学爱思唯尔,第120(C)卷。
  • 手柄:RePEc:eee:eneeco:v:120:y:2023:i:c:s014098832301196
    内政部:10.1016/j.eneco.2023.106621
    作为

    从出版商下载全文

    文件URL: http://www.sciencedirect.com/science/article/pii/S0140988323001196
    下载限制:全文仅供ScienceDirect用户使用

    文件URL: https://libkey.io/10.1016/j.eeneco.2023.106621?utm_source=想法
    LibKey链接:如果访问受到限制,并且您的库使用此服务,LibKey会将您重定向到可以使用库订阅访问此项目的位置
    ---><---

    由于此文档的访问受到限制,您可能希望搜索换一个不同的版本。

    IDEAS上列出的参考文献

    作为
    1. Agrell,Per J.和Bogetoft,Peter,2017年。"监管基准:模型、分析和应用,"数据包络分析杂志,现为出版商,第3卷(1-2),第49-91页,11月。
    2. 邹慧,2006年。"自适应套索及其Oracle特性,"美国统计协会杂志,美国统计协会,第101卷,第1418-1429页,12月。
    3. Haney,Aoife Brophy和Pollitt,Michael G.,2009年。"能源网络效率分析:监管机构的国际调查,"能源政策Elsevier,第37卷(12),第5814-5830页,12月。
    4. Oleg Baduneko和Daniel J.Henderson以及Subal C.Kumbhakar,2012年。"何时何地如何进行效率评估,"英国皇家统计学会期刊A辑英国皇家统计学会,第175(4)卷,第863-892页,10月。
    5. Lee,Chia-Yen和Cai,Jia-Ying,2020年。"小数据集数据包络分析中LASSO变量的选择,"欧米茄《爱思唯尔》,第91卷(C)。
    6. 科斯塔(Costa)、亚历山大·博内特(Alexandre Bonnet R.)和费雷拉(Ferreira)、佩德罗·卡瓦尔坎蒂(Pedro Cavalcanti G.)和加格利亚诺(Gaglianone)、瓦格纳(Wagner P.)和吉伦(Guillén)、奥斯马尼·泰西拉(Osmani Teixeira C.)和伊斯。"机器学习与油价点和密度预测,"能源经济学爱思唯尔,第102(C)卷。
      • 亚历山大·博内特·科斯塔(Alexandre Bonnet R.Costa)、佩德罗·卡瓦尔坎蒂·G·费雷拉(Pedro Cavalcanti G.Ferreira)、瓦格纳·P·加格利亚诺(Wagner P.Gaglianone)、奥斯马尼·泰西拉·古利安(Osmani Teixeira C.Guillén)、。"机器学习与油价点和密度预测,"工作文件系列544,巴西中央银行,研究部。
    7. Andor,Mark A.和Parmeter,Christopher和Sommer,Stephan,2019。"将不确定性与不确定性结合起来以获得确定性?出于监管目的的效率分析,"欧洲运筹学杂志爱思唯尔,第274(1)卷,第240-252页。
    8. 塞巴斯蒂安·科尔(Sebastian Kohl)、扬·舍恩费尔德(Jan Schoenfelder)、安德烈亚斯·福格纳(Andreas Fügener)和延斯·奥·布伦纳(Jens O.Brunner),2019年。"数据包络分析(DEA)在以医院为重点的医疗保健中的应用,"卫生保健管理科学施普林格,第22卷(2),第245-286页,6月。
    9. Ghoddusi、Hamed&Creamer、German G.&Rafizadeh、Nima,2019年。"能源经济和金融中的机器学习:综述,"能源经济学,爱思唯尔,第81卷(C),第709-727页。
    10. Bennedsen、Mikkel和Hillebrand、Eric和Koopman,暹罗,2021年1月。"使用许多宏观经济预测工具对美国二氧化碳排放量进行建模、预测和预测,"能源经济学《爱思唯尔》,第96卷(C)。
    11. Hung-jen Wang和Peter Schmidt,2002年。"外生变量对技术效率水平影响的一步和两步估计,"生产力分析杂志,施普林格,第18卷(2),第129-144页,9月。
    12. Charnes,A.&Cooper,W.W.&Rhodes,E.,1978年。"衡量决策单元的效率,"欧洲运筹学杂志爱思唯尔,第2卷(6),第429-444页,11月。
    13. 蒂莫·库奥斯曼(Timo Kuosmanen),2012年。"配电网的随机半非参数前沿估计:StoNED方法在芬兰监管模型中的应用,"能源经济学爱思唯尔,第34卷(6),第2189-2109页。
    14. Nataraja,Niranjan R.&Johnson,Andrew L.,2011年。"数据包络分析中变量选择技术的使用指南,"欧洲运筹学杂志爱思唯尔,第215(3)卷,第662-669页,12月。
    15. 乔普尼、奥扎恩和古普塔、兰根和皮纳尔、丹尼尔和皮尔季奥赫、克里斯蒂安,2022年。"使用机器学习预测石油价格回报的已实现方差:美国州一级的不确定性有影响吗?,"能源经济学爱思唯尔,第114(C)卷。
    16. Chen,Ya&Tsionas,Mike G.&Zelenyuk,Valentin,2021年。"LASSO+DEA,适用于小型和大型数据,"欧米茄爱思唯尔,第102(C)卷。
    17. 蒂莫·库奥斯曼(Timo Kuosmanen),2006年。"数据的随机非参数包络:在统一框架中结合SFA和DEA的优点,"讨论文件11864,芬兰MTT Agrifood Research。
    18. Timo Kuosmanen和Andrew L.Johnson,2010年。"数据包络分析作为非参数最小二乘回归,"运筹学,INFORMS,第58(1)卷,第149-160页,2月。
    19. Per J.Agrell&Pontus Mattsson&Jonas Mánsson,2020年。"合并瑞典地区法院对效率的影响,"运筹学年鉴,施普林格,第288(2)卷,第653-679页,5月。
    20. Banker,Rajiv&Natarajan,Ram&Zhang,Daqun,2019年。"使用数据包络分析对随机前沿生产函数模型中上下文变量影响的两阶段估计:第二阶段OLS与bootstrap方法,"欧洲运筹学杂志爱思唯尔,第278(2)卷,第368-384页。
    21. Jenkins,Larry&Anderson,Murray,2003年。"减少数据包络分析中变量数量的多元统计方法,"欧洲运筹学杂志,爱思唯尔,第147卷(1),第51-61页,5月。
    22. Hui Zou和Trevor Hastie,2005年。"附录:通过弹性网的正则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(5),第768-768页,11月。
    23. 彼得·史密斯,1997年。"数据包络分析中的模型错误指定,"运筹学年鉴《施普林格》,第73卷(0),第233-252页,10月。
    24. 理查德·米德和索德伯格,马格纳斯,2020年。"当公用事业由客户而不是投资者拥有时,福利会更高吗?新西兰配电的证据,"能源经济学爱思唯尔,第86卷(C)。
    25. Hui Zou和Trevor Hastie,2005年。"通过弹性网进行正则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(2),第301-320页,4月。
    26. 瓦伦丁Zelenyuk,2020年。"大数据下数据包络分析之前的输入和输出汇总,"欧洲运筹学杂志爱思唯尔,第282(1)卷,第172-187页。
    完整参考文献 (包括与IDEAS上的项目不匹配的项目)

    引文

    引文由CitEc项目,订阅其RSS源用于此项目。
    作为


    引用人:

    1. 劳尔·莫拉格斯(Raul Moragues)、胡安·阿帕里西奥(Juan Aparicio)和米里亚姆·埃斯特夫(Miriam Esteve),2023年。"使用无监督机器学习技术对非参数前沿分析中变量的重要性进行排序,"数学,MDPI,第11卷(11),第1-24页,6月。

    最相关的项目

    这些是最常引用与本书相同作品的项目,也被与本书同样的作品引用。
    1. Chen,Ya&Tsionas,Mike G.&Zelenyuk,Valentin,2021年。"适用于小型和大型数据的LASSO+DEA,"欧米茄爱思唯尔,第102(C)卷。
    2. Ya Chen、Mike Tsionas和Valentin Zelenyuk,2020年。"小数据和大数据的LASSO DEA,"CEPA工作文件系列WP092020,澳大利亚昆士兰大学经济学院。
    3. Imad Bou-Hamad和Abdel Latef Anouze以及Ibrahim H.Osman,2022年。"选择输入和输出变量用于数据包络分析的认知分析管理框架使用随机森林和信息熵对银行绩效效率进行建模,"运筹学年鉴,施普林格,第308卷(1),第63-92页,1月。
    4. Esteve,Miriam&Aparicio,Juan&Rodriguez-Sala,Jesus J.&Zhu,Joe,2023年。"随机森林和自由处置船体下的超效率测量,"欧洲运筹学杂志爱思唯尔,第304(2)卷,第729-744页。
    5. 劳尔·莫拉格斯(Raul Moragues)、胡安·阿帕里西奥(Juan Aparicio)和米里亚姆·埃斯特夫(Miriam Esteve),2023年。"使用无监督机器学习技术对非参数前沿分析中变量的重要性进行排序,"数学,MDPI,第11卷(11),第1-24页,6月。
    6. 戴盛,2023。"凸分位数回归中的变量选择:L1-模还是L0-模正则化?,"欧洲运筹学杂志爱思唯尔,第305(1)卷,第338-355页。
    7. 库奥斯曼、蒂莫·约翰逊和安德鲁·约翰逊,2017年。"StoNED中多输出联合生产建模:方向距离函数法,"欧洲运筹学杂志爱思唯尔,第262(2)卷,第792-801页。
    8. Mark Andor和Frederik Hesse,2014年。"StoNED时代:进入效率分析新时代?StoNED和“老歌”(SFA和DEA)的蒙特卡罗比较,"生产力分析杂志,施普林格,第41卷(1),第85-109页,2月。
    9. Johnson,Andrew L.和Kuosmanen,Timo,2012年。"背景变量影响的一阶段和两阶段DEA估计,"欧洲运筹学杂志爱思唯尔,第220(2)卷,第559-570页。
    10. Amir Moradi-Motlagh和Ali Emrouznejad,2022年。"非参数前沿模型中统计方法的起源和发展:对前二十年学术文献的调查(1998-2020),"运筹学年鉴,施普林格,第318(1)卷,第713-741页,11月。
    11. Kosycarz,Ewa&Dędys,Monika&Ekes,Maria&Wranik,Wiesława Dominika,2023年。"供应商合同类型和财政分权对波兰医院部门效率的影响:16个卫生地区的数据包络分析,"健康政策爱思唯尔,第129(C)卷。
    12. Agrell,Per J.&Brea-Solís,Humberto,2017年。"捕获配电操作中的异质性:潜在类建模的批判性回顾,"能源政策,爱思唯尔,第104卷(C),第361-372页。
    13. 安娜·奥佐威卡和巴特·奥米耶·拉赫,2022年。"CI-DEA:一种提高DEA鉴别能力的方法——以50一代数字化生活效率评估为例+,"可持续性,MDPI,第14(6)卷,第1-22页,3月。
    14. Zangin Zeebari&Kristofer Mánsson&Pär Sjölander&Magnus Söderberg,2023年。"随机前沿分析中机组效率的正则条件估计及其在配电市场中的应用,"生产力分析杂志,施普林格,第59卷(1),第79-97页,2月。
    15. 廖志强(Liao,Zhiqiang)和戴(Dai),盛(Sheng)和库奥斯曼(Kuosmanen),蒂姆(Timo),2024年。"凸支持向量回归,"欧洲运筹学杂志爱思唯尔,第313(3)卷,第858-870页。
    16. Araujo,Gustavo Silva&Gaglianone,Wagner Piazza,2023年。"巴西通货膨胀预测的机器学习方法:新竞争者与经典模型,"拉丁美洲中央银行杂志(前Monetaria)爱思唯尔,第4卷(2)。
    17. Cordero、JoséManuel和Santín、Daniel和Sicilia、Gabriela,2015年。"通过蒙特卡罗模拟检验内生性条件下DEA估计的准确性,"欧洲运筹学杂志爱思唯尔,第244(2)卷,第511-518页。
    18. Andor,Mark A.&Parmeter,Christopher&Sommer,Stephan,2019年。"将不确定性与不确定性结合起来以获得确定性?出于监管目的的效率分析,"欧洲运筹学杂志爱思唯尔,第274(1)卷,第240-252页。
    19. Nataraja,Niranjan R.&Johnson,Andrew L.,2011年。"数据包络分析中变量选择技术的使用指南,"欧洲运筹学杂志爱思唯尔,第215(3)卷,第662-669页,12月。
    20. Waidelich,Paul&Haug,Tomas&Wieshammer,Lorenz,2022年。"德国效率出了问题:天然气TSO基准测试产生的意外激励,"能源政策爱思唯尔,第160(C)卷。

    更正

    本网站上的所有材料均由各自的出版商和作者提供。您可以帮助纠正错误和遗漏。请求更正时,请提及此项目的句柄:RePEc:eee:eneeco:v:120:y:2023:i:c:s014098832301196。请参阅一般信息关于如何更正RePEc中的材料。

    如果您编写了此项目,但尚未在RePEc注册,我们鼓励您这样做在这里。这允许将您的个人资料链接到此项目。它还允许您接受我们不确定的该项目的潜在引用。

    如果CitEc公司识别了书目参考,但没有将RePEc中的项目链接到它,您可以帮助这个表格.

    如果你知道引用这一条的缺失条目,你可以通过以与上述相同的方式为每个引用条目添加相关引用来帮助我们创建这些链接。如果您是该项目的注册作者,您可能还想查看您的RePEc作者服务个人资料,因为可能有一些引文等待确认。

    有关本项目的技术问题,或更正作者、标题、摘要、参考书目或下载信息,请联系:Catherine Liu(电子邮件地址如下)。供应商的一般联系方式:http://www.elsevier.com/locate/eneco.

    请注意,更正可能需要几周时间才能筛选出来各种RePEc服务。

    想法是一个经济学研究论文服务。RePEc使用各出版商提供的书目数据。