×

设计实验和机器学习以提高预测维护的鲁棒性,并应用于实际案例研究。 (英语) Zbl 1524.62366号

摘要:在大数据环境中部署预测分析时,可能会对所获得结果的有效性产生一些担忧。其原因与大数据分析方法本身固有的缺陷有关。本文提出了一种新方法,旨在缓解出现的新问题。这种新方法包括两步工作流程,在通常的大数据分析和机器学习建模阶段之前,先进行实验设计(DOE)研究。介绍了新方法的优点,并详细描述了该方法在预测维修中的工业应用。

理学硕士:

62K05美元 最佳统计设计
62兰特 大数据和数据科学的统计方面
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Clarke,R.,《负责任应用数据分析指南》,《计算机法律与安全评论》,34、3、467-76(2017)·doi:10.1016/j.clsr.2017.11.002
[2] Cybenko,G.,S形函数的叠加逼近,控制、信号和系统数学,2,4303-14(1989)·兹伯利0679.94019 ·doi:10.1007/BF02551274
[3] Drovandi,C.C。;C.C.福尔摩斯。;McGree,J.M。;蒙格森,K。;理查森,S。;Ryan,E.G.,《大数据分析的实验设计原则》,《统计科学》,32,3,385(2017)·Zbl 1442.62174号 ·doi:10.1214/16-STS604
[4] 邓森,D.,《大数据时代的统计:机器故障》,《统计与概率快报》,136,4-9(2018)·Zbl 1489.62411号 ·doi:10.1016/j.spl.2018.02.028
[5] Faraway,J.J。;新罕布什尔州奥古斯丁,《当小数据战胜大数据时,统计与概率快报》,136,C,142-5(2018)·Zbl 1489.62412号 ·doi:10.1016/j.spl.2018.02.031
[6] Hornik,K.,多层前馈网络的逼近能力,神经网络,4,2,251-7(1991)·doi:10.1016/0893-6080(91)90009-T
[7] 卢扬·莫雷诺,G.A。;P.R.霍华德。;O.G.罗哈斯。;Montgomery,D.C.,《利用随机森林案例研究调整机器学习超参数的实验和响应面方法设计》,《应用专家系统》,109195-205(2018)·doi:10.1016/j.eswa.2018年5月24日
[8] McFarland,D.A。;McFarland,H.R.,《大数据与精确不准确的危险》,大数据与社会,2,2(2015)·doi:10.1177/2053951715602495
[9] Oshiro,T.M.、Perez,P.S.和Baranauskas,J.A.,2012年。一片随机的森林里有多少棵树?计算机科学课堂讲稿(包括人工智能子系列课堂讲稿和生物信息学课堂讲稿)。
[10] 里德米勒,M。;Braun,H.,快速反向传播学习的直接自适应方法:RPROP算法(1993)
[11] 希拉,K.G。;Deepa,S.N.,《神经网络中隐藏神经元数量固定方法综述》,《工程中的数学问题》,2013年11月(2013)·doi:10.1155/2013/425740
[12] Shiffrin,R.M.,从大数据中得出因果推断,《美国国家科学院院刊》,113,27,7308-9(2016)·doi:10.1073/pnas.1608845113
[13] 辛格,S。;刘,Y。;丁·W。;Li,Z.,使用实验设计对大数据分析进行实证评估:电信数据案例研究,大数据服务交易,3,2,1-20(2016)
[14] Specht,D.F.,概率神经网络,神经网络,3,1,109-18(1990)·doi:10.1016/0893-6080(90)90049-Q
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。