×

利用机器学习对个体概率密度函数进行需求预测。 (英语) Zbl 1473.62319号

摘要:需求预测是零售商补货流程的核心组成部分,因为它为后续决策(如订购流程)提供了关键输入。与点估计(如潜在概率分布的条件平均值或置信区间)相反,预测完整的概率密度函数允许调查在整个预期需求范围内对运营指标的影响,这些指标对定义业务战略很重要。虽然评估点估计的指标被广泛使用,但评估预测分布准确性的方法却很少,这项工作为定性和定量评估方法提出了新技术。使用有监督机器学习方法“循环升压”,可以预测完整的个体概率密度函数,从而使每个预测都是完全可解释的。这对从业者来说尤其重要,因为它可以避免“黑盒”模型,并了解每个预测的影响因素。就需求预测方法的可解释性和可推广性而言,另一个关键方面是限制时间混淆的影响,这在大多数最先进的方法中都很普遍。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62M20型 随机过程推断和预测
62第20页 统计学在经济学中的应用
90磅05 库存、储存、水库
60欧元 概率分布:一般理论
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Edgeworth F(1888)银行业的数学理论。J R Stat Soc公司
[2] Khouj,M(1999)单周期(新闻供应商)问题:文献综述和未来研究建议。欧米茄27(5):537-553。doi:10.1016/S0305-0483(99)00017-1http://www.sciencedirect.com/science/article/pii/S0305048399000171(上次访问时间:2020-Dec-01)
[3] Wick F,Kerzel U,Feindt M(2019)循环增压-一种可解释的监督机器学习算法。2019年IEEE第18届机器学习与应用国际会议(ICMLA)。IEEE,第358-363页。doi:10.1109/icmla.2019.0067
[4] 统计:2013年至2015年利得服务的利润率。https://www.statistia.com/statistics/779146/profim-margin-of-lidl-sverige/(上次访问时间:2020-Dec-01)
[5] Statista:2012年至2018年Hemköp在瑞典的营业利润率。https://www.statistia.com/statistics/734370/operating-margin-of-hemkoep-in-sweden/(上次访问时间:2020-Dec-01)
[6] Statista:2012年至2018年威利斯在瑞典的营业利润率。https://www.statistia.com/statistics/734261/operating-margin-of-millys-in-sweden/(上次访问时间:2020-Dec-01)
[7] 统计:2017年至2019年美国公共超级市场的营业利润率。https://www.statistia.com/statistics/1167301/publix-operating-profit-us网站/(上次访问时间:2020-Dec-01)
[8] Beheshti-Kashi,S。;人力资源部卡里米;托本,KD;Lütjen,M。;Teucke,M.,《时尚市场零售销售预测调查》,《系统科学控制工程》,3,1,154-161(2015)·doi:10.1080/21642583.2014.999389
[9] Box GEP、Jenkins GM、Reinsel GC、Ljungl GM(2015)《时间序列分析:预测与控制》,第5版。威利
[10] Brown RG(1963)离散时间序列的平滑预测和预测。Prentice-Hall International,Inc.,英国伦敦
[11] Croston,JD,《间歇需求的预测和库存控制》,《运营研究社会杂志》,23,3,289-303(1972)·兹比尔0238.90021 ·doi:10.1057/jor.1972.50
[12] Gardner,ES,指数平滑:最新技术,J预测,4,1-28(1985)·doi:10.1002/用于3980040103
[13] Holt CC(1957)通过指数加权移动平均值预测趋势和季节。ONR备忘录52
[14] De Gooijer,JG;RJ Hyndman,《25年时间序列预测》,《国际J预测》,22,3,443-473(2006)·doi:10.1016/j.ijforecast.2006.01.01
[15] 法塔赫,J。;Ezzine,L。;阿曼,Z。;El Moussami,H。;Lachhab,A.,《使用arima模型预测需求》,国际工程巴士管理杂志,10184797901880867(2018)·doi:10.1177/1847979018808673
[16] 胡贝尔,J。;戈斯曼,A。;Stuckenschmidt,H.,易腐货物基于集群的层次需求预测,专家系统应用,76,140-151(2017)·doi:10.1016/j.eswa.2017.01.022
[17] Kalchschmidt M,Verganti R,Zotteri G(2006)预测异质客户的需求。国际J运营产品管理
[18] Permatasari CI、Sutopo W、Hisjam M(2018)《Arima销售预测报:案例研究》。收录于:AIP会议记录,第1931卷。AIP出版有限责任公司,p 030017
[19] 《线性滤波和预测问题的新方法》,《基础工程杂志》,82,1,35-45(1960)·数字对象标识代码:10.1115/1.3662552
[20] 莫里森,GW;Pike,DH,卡尔曼滤波在统计预测中的应用,《管理科学》,23,7,768-774(1977)·Zbl 0356.62071号 ·doi:10.1287/mnsc.23.7.68
[21] Jacobi M,Karimanzira D,Ament C(2007),使用卡尔曼滤波进行需水量预测。摘自:第16届IASTED国际应用模拟与建模会议论文集,第199-202页
[22] Kandananond K(2014)将卡尔曼滤波应用于相关需求预测。收录于:《应用力学与材料》,第619卷。Trans-Tech出版物第381-384页
[23] Mitropoulos,C。;Samouilidis,J。;《使用卡尔曼滤波进行能源预测》,国际会计师联合会会议论文集,13,5,317-324(1980)·doi:10.1016/S1474-6670(17)64888-2
[24] Tegene,A.,《卡尔曼过滤器与香烟需求》,《应用经济学》,23,7,1175-1182(1991)·doi:10.1080/0036849100000155
[25] Hyndman R,Koehler AB,Ord JK,Snyder RD(2008)指数平滑预测:状态空间方法。施普林格科学与商业媒体·Zbl 1211.62165号
[26] 拉莫斯,P。;Santos,N。;Rebelo,R.,《消费者零售额预测的状态空间和arima模型性能》,机器人计算集成制造,34151-163(2015)·doi:10.1016/j.rcim.2014.12.015
[27] A.哈维。;Peters,S.,《结构时间序列模型的估计程序》,《J Forecast》,第9期,第89-108页(1990年)·doi:10.1002/用于3980090203
[28] SJ泰勒;Letham,B.,《规模预测》,美国统计局,72,1,37-45(2018)·Zbl 07663916号 ·doi:10.1080/00031305.2017.1380080
[29] 科克,AG;Fisher,ML,《替代下的需求估计和产品组合优化:方法论和应用》,Oper Res,55,6,1001-1021(2007)·Zbl 1167.91386号 ·doi:10.1287/opre.1070.0409
[30] 王,HJ;Chien,CF;Liu,CF,使用非齐次泊松过程模型的贝叶斯试验进行需求预测,国际运营研究杂志,2,1,21-29(2005)·Zbl 1109.62126号
[31] Remus W,O’Connor M(2001)时间序列预测的神经网络。In:预测原理。施普林格,第245-256页
[32] Zhang G(2012)时间序列预测的神经网络。施普林格·柏林,海德堡,第461-477页
[33] Breiman L、Friedman J、Stone CJ、Olshen RA(1984)分类和回归树。CRC出版社·Zbl 0541.62042号
[34] 费雷拉,KJ;李,BHA;Simchi-Levi,D.,《在线零售商分析:需求预测和价格优化》,Manuf Serv Oper Manag,18,1,69-88(2016)·doi:10.1287/msom.2015.0561
[35] Rumelhart,D。;辛顿,G。;Williams,R.,《通过反向传播错误学习表征》,《自然》,323533-536(1986)·Zbl 1369.68284号 ·数字对象标识代码:10.1038/323533a0
[36] 霍克雷特,S。;Schmidhuber,J.,长短期记忆,神经计算机,9,8,1735-1780(1997)·doi:10.1116/neco.1997.9.8.1735
[37] Vaswani A、Shazeer N、Parmar N、Uszkoreit J、Jones L、Gomez AN、Kaiser LU、Polosukhin I(2017)关注是你所需要的。发表于:Guyon I、Luxburg UV、Bengio S、Wallach H、Fergus R、Vishwanathan S、Garnett R(编辑)《神经信息处理系统进展》30。Curran Associates,Inc.,第5998-6008页。http://papers.nips.cc/paper/7181-antertation-is-all-you-need.pdf(上次访问时间:2020-Dec-01)
[38] Bandara K、Shi P、Bergmeir C、Hewamarage H、Tran Q、Seaman B(2019)使用长短记忆神经网络方法预测电子商务中的销售需求。摘自:神经信息处理国际会议。施普林格,第462-474页
[39] Golkabek M、Senge R、Neumann R(2020)使用长短记忆神经网络进行需求预测。arXiv预打印arXiv:2008.08522(上次访问时间:2020-Dec-01)
[40] Goyal A、Kumar R、Kulkarni S、Krishnamurthy S、Vartak M(2018)使用长短记忆递归神经网络进行时间序列预测的需求预测解决方案。参加:中西部决策科学研究所会议
[41] Helmini S、Jihan N、Jayasinghe M、Perera S(2019)使用多元长短期记忆网络模型进行销售预测。Peer J预印本7:e27712v1
[42] Yu Q,Wang K,Strandhagen JO,Wang Y(2017)长短期记忆神经网络在零售业销售预测中的应用——案例研究。参加:先进制造与自动化国际研讨会。施普林格,第11-17页
[43] Längkvist,M。;卡尔森,L。;Loutfi,A.,《非监督特征学习和时间序列建模深度学习综述》,Pattern Recogn Lett,42,11-24(2014)·doi:10.1016/j.patrec.2014.01.008
[44] Dixon MF(2020)指数平滑递归神经网络的工业预测。arXiv预打印arXiv:2004.04717(上次访问时间:2020-Dec-01)
[45] Goodfellow I、Pouget-Abadie J、Mirza M、Xu B、Warde-Farley D、Ozair S、Courville A、Bengio Y(2014)《生成对抗网》。主题:神经信息处理系统的进展。第2672-2680页
[46] Haas M,Richter S(2020)《wasserstein gans的统计分析及其在时间序列预测中的应用》。arXiv预打印arXiv:2011.03074(上次访问时间:2020-Dec-01)
[47] Ramponi G,Protopapas P,Brambilla M,Janssen R(2018)T-CGAN:在不规则采样的噪声时间序列中用于数据增强的条件生成对抗网络。arXiv预打印arXiv:1811.08295(上次访问时间:2020-Dec-01)
[48] Smith KE,Smith AO(2020)时间序列生成的条件GAN。arXiv预打印arXiv:2006.16477(上次访问时间:2020-Dec-01)
[49] Malinsky D,Spirtes P(2018),在未测量混杂情况下从多变量时间序列中学习因果结构。摘自:2018年ACM SIGKDD因果发现研讨会论文集,第23-47页
[50] Runge J(2018)《从时间序列重构因果网络:从理论假设到实际估计》。混沌国际期刊非线性科学28(7):075310·兹比尔1396.62218
[51] Runge J、Nowack P、Kretschmer M、Flaxman S、Sejdinovic D(2019),大型非线性时间序列数据集中因果关系的检测和量化。科学版Adv 5(11):第4996页。doi:10.1126/sciadv.aau4996
[52] Bica I,Alaa A,Van Der Schaar M(2020)时间序列解构:在存在潜在混杂因素的情况下估计治疗效果。参加:机器学习国际会议。PMLR,第884-895页
[53] Perrakis,K。;Gryparis,A。;施瓦茨,J。;阿拉巴马州特雷;Katsouyanni,K。;Forastiere,F。;斯塔福吉亚,M。;Samoli,E.,《控制时间序列流行病学模型中的季节模式和时变混杂因素:模拟研究》,Stat Med,33,28,4904-4918(2014)·doi:10.1002/sim.6271
[54] 布罗德森,KH;Gallusser,F。;Koehler,J。;雷米,N。;Scott,SL,《使用贝叶斯结构时间序列模型推断因果影响》,《Ann Appl Stat》,9,247-274(2015)·Zbl 1454.62473号 ·doi:10.1214/14-AOAS788
[55] Brodersen KH(2015)豪泽A因果影响:时间序列因果推断的R包。http://google.github.io/CausalImpact网站/(上次访问时间:2020-12-19年12月)
[56] Chatfield,C.,计算区间预测,《公共汽车经济统计杂志》,11,2,121-135(1993)
[57] Angus,JE(1994)概率积分变换及相关结果。SIAM评论36(4):652-654。http://www.jstor.org/stable/2132726(上次访问时间:2020-Dec-01)·Zbl 0808.62013.号
[58] 克莱门茨议员;Taylor,N.,自回归模型的Bootstrapping预测区间,Int J for Eng,17,2,247-267(2001)
[59] Grigoletto,M.,《自回归的Bootstrap预测区间:一些替代方法》,《国际J预测》,第14、4、447-456页(1998年)·doi:10.1016/S0169-2070(98)00004-1
[60] Masarotto,G.,自回归的Bootstrap预测区间,国际J预测,6,2,229-239(1990)·doi:10.1016/0169-2070(90)90008-Y
[61] McCullough,B.,Bootstrapping预测区间:ar(p)模型的应用,J forecast,13,1,51-66(1994)·doi:10.1002/用于3980130107
[62] McCullough,B.,预测期外生变量为随机时的一致预测区间,J预测,15,4293-304(1996)·doi:10.1002/(SICI)1099-131X(199607)15:4<293::AID-FOR611>3.0.CO;2-6
[63] 帕斯夸尔。;罗莫,J。;Ruiz,E.,参数估计对预测密度的影响:自举方法,国际J预测,17,1,83-103(2001)·doi:10.1016/S0169-2070(00)00069-8
[64] Pascual,L。;罗莫,J。;Ruiz,E.,arima过程的Bootstrap预测推断,《Time-Ser-Anal杂志》,25,4,449-465(2004)·Zbl 1062.62199号 ·文件编号:10.1111/j.1467-9892.2004.01713.x
[65] Pascual,L。;罗莫,J。;Ruiz,E.,电力转换时间序列的Bootstrap预测区间,国际J预测,21,2,219-235(2005)·doi:10.1016/j.ijforecast.2004.09.006
[66] 洛杉矶汤姆斯;Schucany,WR,自回归的Bootstrap预测区间,美国统计协会杂志,85,410,486-492(1990)·Zbl 0705.62089号 ·网址:10.1080/01621459.1990.10476225
[67] Koenker,R。;Hallock,KF,分位数回归,《经济展望杂志》,15,4,143-156(2001)·doi:10.1257/jep.15.4.143
[68] Feindt M,Kerzel U(2006)神经贝叶斯神经网络包。NIM A 559(1):190-194。http://www.sciencedirect.com/science/article/pii/S0168900205022679(上次访问时间:2020-Dec-01)
[69] Hyndman,RJ,非线性和非正态时间序列模型的最高密度预测区域,J forecast,14,5,431-441(1995)·doi:10.1002/用于3980140503
[70] 泰,AS;Wallis,KF,密度预测:一项调查,J Forecast,19,4,235-254(2000)·doi:10.1002/1099-131X(200007)19:4<235::AID-FOR772>3.0.CO;2-升
[71] Wen R、Torkkola K、Narayanaswamy B、Madeka D(2017)多时段分位数回归预测。arXiv预打印arXiv:1711.11053(上次访问时间:2020-Dec-01)
[72] Lim B、Arik SO、Loeff N、Pfister T(2019)用于可解释多时段时间序列预测的时间融合变压器。arXiv预打印arXiv:1912.09363(上次访问时间:2020-Dec-01)
[73] Rasul K、Sheikh AS、Schuster I、Bergmann U、Vollgraf R(2020)通过条件归一化流进行多变量概率时间序列预测。arXiv预打印arXiv:2002.06103(上次访问时间:2020-Dec-01)
[74] Rezende DJ,Mohamed S(2015)《归一化流的变分推断》。arXiv预打印arXiv:1505.05770(上次访问时间:2020-Dec-01)
[75] Bishop CM(1994)混合密度网络。http://publications.aston.ac.uk/id/eprint/373/(上次访问时间:2020年12月01日)
[76] Salinas D,Flunkert V,Gasthaus J,Januschowski T(2020)Deepar:使用自回归回归网络的概率预测。国际J预测36(3):1181-1191。doi:10.1016/j.ijforecast.2019.07.001。http://www.sciencedirect.com/science/article/pii/S0169207019301888(上次访问时间:2020-Dec-01)
[77] 阿丹,I。;van Eenige,M。;Resing,J.,《前两个矩的离散分布拟合》,Probab Eng Inf Sci,9,4,623-632(1995)·Zbl 1336.60035号 ·doi:10.1017/S0269964800004101
[78] Chatfield C,Goodhardt GJ(1973)具有erlang跨采购时间的消费者购买模型。美国统计协会杂志68(344):828-835。http://www.jstor.org/stable/2284508(上次访问时间:2020-Dec-01)
[79] Ehrenberg A(1972)重复购买;理论和应用。北荷兰公社。公司。
[80] 埃伦伯格ASC(1959)《消费者购买模式》。J R Stat Soc C系列(1):26-41。http://search.ebscohost.com.pxz.iubh.de:8080/login.aspx?direct=true&db=edsrep&AN=edsrep.a.bla.jorssc.v8y1959i1p26.41&site=eds-live&scope=站点(上次访问时间:2020-Dec-01)
[81] GJ Goodhardt;Ehrenberg,A.,条件趋势分析:按初始购买水平细分,J Mark Res,4155-161(1967)·doi:10.1177/0022243776700400206
[82] Schmittlein DC、Bemmaor AC、Morrison DG(1985)技术说明-为什么NBD模型有效?表现产品购买、品牌购买和记录不完整的购买的稳健性。《科学标记》4(3):255-266。doi:10.1287/mksc.4.3.255
[83] Ban,GY;Rudin,C.,《大数据新闻供应商:机器学习的实践见解》,Oper Res,67,1,90-108(2019)·Zbl 1443.90093号 ·doi:10.1287/opre.2018.1757
[84] Bertsimas,D。;Kallus,N.,《从预测到规定分析》,《管理科学》,66,3,1025-1044(2020)·doi:10.1287/mnsc.2018.3253
[85] 亚利桑那州贝特尔;Minner,S.,因果需求预测下的安全库存规划,Int J Prod Econ,140,2637-645(2012)·doi:10.1016/j.jpe.2011.04.017
[86] 胡贝尔,J。;缪勒,S。;弗莱什曼,M。;Stuckenschmidt,H.,《数据驱动的新闻供应商问题:从数据到决策》,《欧洲运营研究杂志》,278,3,904-915(2019)·Zbl 1430.90021号 ·doi:10.1016/j.ejor.2019.04.043
[87] Oroojlooyjadid,A。;斯奈德,LV;Takáć,M.,《将深度学习应用于报童问题》,IISE Transactions,52,4,444-463(2020)·doi:10.1080/24725854.2019.1632502
[88] Pearl J(2009)《因果关系:模型、推理和推断》,第2版。剑桥大学出版社·Zbl 1188.68291号
[89] Rubin,DB,在随机和非随机研究中估计治疗的因果效应,《教育心理学杂志》,66,5,688-701(1974)·doi:10.1037/h0037350
[90] Granger CWJ(1969)通过计量经济学模型和交叉谱方法研究因果关系。《计量经济学》37(3):424。doi:10.2307/1912791·Zbl 1366.91115号
[91] Hilbe J(2011)负二项回归。剑桥大学出版社,英国剑桥,纽约·Zbl 1269.62063号
[92] Casella G(2002)统计推断。加利福尼亚州Pacific Grove的Duxbury/Thomson Learning
[93] Diebold FX、Gunther TA、Tay AS(1998)《评估密度预测及其在金融风险管理中的应用》。摘自:《宏观经济和金融预测和实证方法研讨会》,第39卷。第863-883页
[94] 奥尔金,I。;Pukelsheim,F.,具有给定离散矩阵的两个随机向量之间的距离,线性代数应用,48,257-263(1982)·Zbl 0527.60015号 ·doi:10.1016/0024-3795(82)90112-4
[95] Kullback S,Leibler RA(1951)《信息与充分性》。数学统计年鉴22(1):79-86。doi:10.1214/aoms/1177729694·Zbl 0042.38403号
[96] Dagan I,Lee L,Pereira F(1997)基于相似性的词义消歧方法。摘自:计算语言学协会第35届年会和计算语言学协会欧洲分会第八届会议记录,ACL'98/EACL'98。美国计算语言学协会,第56-63页。doi:10.3115/976909.979625
[97] Székely GJ,Rizzo ML(2013)《能源统计:基于距离的一类统计》。J Stat Plan推断143(8):1249-1272。doi:10.1016/j.jspi.2013.03.018。http://www.sciencedirect.com/science/article/pii/S0378375813000633(上次访问时间:2020年12月01日)·兹比尔1278.62072
[98] https://www.kaggle.com/cm5-预测准确性/数据(上次访问时间:2020-Dec-01)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。