×

通过拓扑数据分析和一类分类遵守数据驱动模型的有效性限制。 (英语) Zbl 1494.90088号

摘要:数据驱动模型在工程中越来越流行,无论是单独使用还是与机械模型结合使用。通常,经过训练的模型随后用于基于模型的工艺设计和/或操作优化。因此,在流程优化过程中,确保数据驱动模型的评估不超出其有效域是至关重要的。我们提出了一种学习有效域的方法,并将其编码为过程优化中的约束。我们首先使用持久同源性进行拓扑数据分析,以识别训练数据中的潜在漏洞或分离簇。在识别出簇或洞的情况下,我们在训练数据域上训练一个单类分类器,即单类支持向量机,并在随后的过程优化中将其编码为约束。否则,我们构造数据的凸包并将其编码为约束。最后,我们对数据驱动模型进行确定性全局过程优化,使其服从各自的有效性约束。为了确保计算的可处理性,我们为经过训练的单类支持向量机开发了一种简化的空间公式,并表明我们的公式比常见的全空间公式优越3000倍以上,使其成为工程应用的可行工具。作为我们MeLOn工具箱的一部分,该方法是现成可用的开源方法(https://git.rwth-aachen.de/avt.svt/public/MeLOn网站).

MSC公司:

90C26型 非凸规划,全局优化
90摄氏度 数学规划的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Asprion,N.,精馏塔建模、模拟和优化4.0,化学工业技术,92,7,879-889(2020)
[2] Asprion,N。;Böttcher,R。;帕克,R。;斯塔夫鲁,ME;Höller,J。;Schwientek,J。;Bortz,M.,《化工过程优化的灰箱建模》,化学工业技术,91,3,305-313(2019)
[3] Bhosekar A,Ierepatritou M(2018)基于代理的建模、可行性分析和优化进展:综述。计算机化学工程108:250-267
[4] Binchi,J。;梅雷利,E。;Rucco,M。;佩特里,G。;Vaccarino,F.,jholes:通过团权重秩持久同源性理解生物复杂网络的工具,电子注释Theor Compute Sci,306,5-18(2014)·Zbl 1337.92073号
[5] Bongartz D(2020)能源转换过程设计的确定性全球流程优化。亚琛RWTH大学博士论文
[6] Bongartz,D。;Mitsos,A.,《使用McCormick松弛法在缩减空间内对工艺流程进行确定性全局优化》,《全球优化杂志》,20,9,419(2017)·Zbl 1386.90112号
[7] Bongartz D,Najman J,Sass S,Mitsos A(2018)MAiNGO:基于McCormick的混合整数非线性全局优化算法。亚琛工业大学工艺系统工程(AVTSVT)技术报告。http://permalink.avt.rwth-aachen.de/?id=729717
[8] 布库瓦拉,F。;Ierepatritou,MG,使用基于自适应采样克里金法的黑盒工艺可行性分析,计算化学工程,36,358-368(2012)
[9] Cavanna NJ、Jahanseir M、Sheehy DR(2015)《稀疏过滤的几何透视》。arXiv公司:1506.03797·Zbl 1378.68163号
[10] Chachuat,B。;辛格,AB;Barton,PI,动态优化和混合整数动态优化的全局方法,工业工程化学研究,45,25,8373-8392(2006)
[11] Chachuat,B。;Houska,B。;Paulen,R。;佩里克,N。;Rajyaguru,J。;Villanueva,ME,非线性系统分析、估计和控制中的集合理论方法,IFAC-PapersOnLine,48,8,981-995(2015)·doi:10.1016/j.ifacol.2015.09.097
[12] Chambers EW,Letscher D(2018)有向无环图的持久同源性。In:计算拓扑研究。施普林格,第11-32页·Zbl 1419.55009号
[13] V·钱多拉。;Banerjee,A。;Kumar,V.,《异常检测:一项调查》,ACM Comput Sur(CSUR),41,3,1-58(2009)
[14] Charnes,A。;库珀,WW,机会约束编程,管理科学,6,1,73-79(1959)·兹比尔0995.90600
[15] Chazal F,Michel B(2017)《拓扑数据分析导论:数据科学家的基本和实用方面》。arXiv:1710.04019
[16] 陈,Q。;保拉维奇乌斯,R。;阿奇曼,CS;García-Muñoz,S.,将可操作空间最大化与实验设计相结合的优化框架,AIChE J,64,11,3944-3957(2018)
[17] Chollet F等人(2015)Keras。https://keras.io。2020年5月访问
[18] MK钟;Hanson,JL;Ye,J。;戴维森,RJ;Pollak,SD,稀疏回归中的持续同源性及其在脑形态计量学中的应用,IEEE Trans-Med Imaging,34,9,1928-1939(2015)
[19] 科尔特斯,C。;Vapnik,V.,《支持向量网络》,《Mach Learn》,第20、3、273-297页(1995年)·Zbl 0831.68098号
[20] Courrieu,P.,估计前馈神经网络有效域的三种算法,神经网络,7,1,169-174(1994)
[21] 丁,X。;李,Y。;Belatreche,A。;Maguire,LP,《新颖性检测方法的实验评估》,神经计算,135,313-327(2014)
[22] Doncevic DT,Schweidtmann AM,Vaupel Y,Schäfer P,Caspari A,Mitsos A(2020)嵌入递归神经网络的确定性全局非线性模型预测控制。In:IFAC会议记录(新闻稿)
[23] Dreiseitl S,Osl M,Scheibböck C,Binder M(2010)使用一类svms进行异常检测:在黑色素瘤预后中的应用。摘自:AMIA年度研讨会记录,第2010卷。美国医学信息学协会,172页
[24] Epperly,TGW公司;Pistikopoulos,EN,用于全局优化的简化空间分枝定界算法,《全球优化杂志》,11,3,287-311(1997)·Zbl 1040.90567号
[25] Evangelista PF,Embrechts MJ,Szymanski BK(2007),单班学习高斯核的一些性质。在:人工神经网络国际会议。施普林格,第269-278页
[26] 福图纳,L。;A.里佐。;西纳特拉,M。;Xibilia,M.,《硫磺回收装置的软分析仪》,Control Eng Pract,11,12,1491-1500(2003)
[27] Fortuna L、Graziani S、Rizzo A、Xibilia MG(2007)《工业过程监控软传感器》。施普林格·Zbl 1136.93001号
[28] Glassey J、Von Stosch M(2018)《过程工业的混合建模》。出版社
[29] Hart WE、Laird CD、Watson JP、Woodruff DL、Hackebeil GA、Nicholson BL、Siirola JD(2017)Pyomo-optimization modeling in python,第67卷。施普林格·Zbl 1370.90003号
[30] 平冈,Y。;Nakamura,T。;平田,A。;Escolar,EG公司;Matsue,K。;Nishiura,Y.,《以持久同源性为特征的非晶固体的层次结构》,《国家科学院学报》,113,26,7035-7040(2016)
[31] Hüllen,G。;翟,J。;Kim,SH;辛哈,A。;雷尔夫,MJ;Boukouvala,F.,《管理基于数据驱动模拟的优化中的不确定性》,计算化学工程(2019年)·doi:10.1016/j.compchemeng.2019.106519
[32] Jin W,Barzilay R,Jaakkola T(2018)用于分子图生成的连接树变分自动编码器。arXiv:1802.04364号
[33] O.卡尔斯。;Marquardt,W.,混合模型的有效域及其在过程优化中的应用,化学工程过程,46,11,1054-1066(2007)
[34] O.卡尔斯。;Marquardt,W.,混合过程模型的增量识别,计算化学工程,32,4-5,694-705(2008)
[35] Kappatou CD、Bongartz D、Najman J、Sass S、Mitsos A(2020)嵌入hammerstein-wiener模型的全局动态优化。http://www.optimization-online.org/DB_HTML/2020/09/8018.HTML
[36] Khan SS,Madden MG(2009)一类分类的近期趋势调查。参加:爱尔兰人工智能和认知科学会议。施普林格,第188-197页
[37] 汗,党卫军;Madden,MG,《一级分类:技术研究的分类和回顾》,《Knowl Eng Rev》,29,3,345-374(2014)
[38] 木村,Y。;Imai,K.,使用SDSS字段中的持久同源性量化LSS,Adv Space Res,60,3,722-736(2017)
[39] Knudde N、Couckuyt I、Shintani K、Dhaene T(2019年)《可行区域发现的主动学习》。2019年IEEE第18届机器学习和应用国际会议(ICMLA)。IEEE,第567-572页
[40] JN库马尔;李强。;唐,肯塔基州;Buonassisi,T。;阿拉巴马州Gonzalez-Oyarce;Ye,J.,《机器学习通过逆向设计实现聚合物云点工程》,NPJ Compute Mater,5,1,1-6(2019)
[41] Larson BJ,Mattson CA(2012),用于量化系统模型可行域的设计空间探索。ASME机械设计杂志134(4):041010。doi:10.1115/1.4005861
[42] Leonard,J。;马萨诸塞州克莱默;Ungar,L.,计算自身可靠性的神经网络架构,Comput Chem Eng,16,9819-835(1992)
[43] Letscher,H.等人。;Edelsbrunner,D。;Zomordian,A.,拓扑持久性和简化,离散计算几何,28511-533(2002)·Zbl 1011.68152号
[44] Malak RJ Jr,Paredis CJJ(2010)使用支持向量机形式化系统设计问题中预测模型的有效输入域。ASME机械设计杂志132(10):101001。数字对象标识代码:10.1115/1.4002151
[45] McBride,K。;Sundmacher,K.,《化学过程工程中替代建模概述》,化学工业技术,91,3,228-239(2019)·doi:10.1002/cite.201800091
[46] Mistry M,Letsios D,Krennrich G,Lee RM,Misener R(2018)嵌入梯度树的混合整数凸非线性优化。arXiv:1803.00952
[47] 米索斯,A。;Chachuat,B。;Barton,PI,基于McCormick的算法松弛,SIAM J Optim,20,2,573-601(2009)·Zbl 1192.65083号 ·doi:10.1137/080717341
[48] Mogk G,Mrziglod T,Schuppert A(2002)混合模型在化学工业中的应用。摘自:计算机辅助化学工程,第10卷。Elsevier,第931-936页
[49] Otter,N。;马萨诸塞州波特;蒂尔曼,美国。;研磨棒,P。;Harrington,HA,持久同源性计算路线图,EPJ Data Sci,6,1,17(2017)
[50] 帕帕佐普洛斯,G。;爱德华兹,PJ;Murray,AF,《神经网络的置信度估计方法:实际比较》,IEEE Trans neural Netw,12,6,1278-1287(2001)
[51] Patania,A。;Vaccarino,F。;Petri,G.,数据的拓扑分析,EPJ数据科学,6,1-6(2017)·Zbl 1440.55004号
[52] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A。;米歇尔,V。;蒂里昂,B。;O.格栅。;布隆德尔,M。;普雷滕霍弗,P。;韦斯,R。;Dubourg,V.,《Scikit-learn:python中的机器学习》,《J Mach learn Res》,第12期,第2825-2830页(2011年)·Zbl 1280.68189号
[53] 马萨诸塞州皮门特尔;DA克利夫顿;克利夫顿,L。;Tarassenko,L.,《新颖性检测综述》,Sig Process,99,215-249(2014)
[54] 平托,J。;de Azevedo,CR;奥利维拉,R。;von Stosch,M.,生物过程开发的bootstrap聚合混合半参数建模框架,生物过程生物技术工程,42,11,1853-1865(2019)
[55] 夸格里奥,M。;弗拉加,ES;曹,E。;Gavriilidis,A。;Galvanin,F.,用于确定近似模型有效域的基于模型的数据挖掘方法,化学计量学智能实验室系统,172,58-67(2018)
[56] 奎克,C。;Balasubramanian,R。;Rangaiah,G.,考虑使用软分析仪改善SRU控制,碳氢化合物处理,79,1,101-106(2000)
[57] Rall,D。;Menne,D。;Schweidtmann,AM;坎普,J。;von Kolzenberg,L。;米索斯,A。;Wessling,M.,离子分离膜的合理设计,J Membr Sci,569209-219(2019)
[58] Roach,E。;RR帕克;Malak,RJ Jr,《工程设计问题中建模有效搜索域的改进支持向量域描述方法》,国际设计工程技术委员会计算信息工程委员会,54822,741-751(2011)
[59] Saadatfar,M。;Takeuchi,H。;罗宾斯,V。;弗朗索瓦,N。;Hiraoka,Y.,《颗粒结晶的孔隙结构景观》,Nat Commun,8,1,1-11(2017)
[60] Schölkopf B(2001)距离的核心技巧。主题:神经信息处理系统的进展,第301-307页
[61] Schölkopf B,Williamson RC,Smola AJ,Shawe-Taylor J,Platt JC(2000),新颖性检测的支持向量方法。主题:神经信息处理系统的进展,第582-588页
[62] Schweidtmann AM、Bongartz D、Grothe D、Kerkenhoff T、Lin X、Najman J、Mitsos A(2020a)高斯过程的全局优化。arXiv:2005.10902号·Zbl 1476.90270号
[63] Schweidtmann AM、Netze L、Mitsos A(2020b)《甜瓜:优化的机器学习模型》。https://git.rwth-aachen.de/avt.svt/public/MeLOn网站/
[64] Schweidtmann AM、Rittig JG、König A、Grohe M、Mitsos A、Dahman M(2020c)预测燃料点火质量的图形神经网络。ChemRxiv预印本ChemRxiv:12280325
[65] Schweidtmann,AM;Mitsos,A.,《嵌入人工神经网络的确定性全局优化》,《最优化理论应用杂志》,180,3,925-948(2019)·Zbl 1407.90263号
[66] 沙赫里亚里,B。;瑞典斯威斯基。;王,Z。;亚当斯,RP;de Freitas,N.,将人类从循环中剔除:贝叶斯优化综述,Proc IEEE,104,1148-175(2016)·doi:10.1010/JPROC.2015.2494218
[67] 西穆提斯,R。;哈夫利克,I。;施耐德,F。;多尔斯,M。;Lübbert,A.,《工业过程监督可靠性改进的人工神经网络》,IFAC Proc Vol,28,3,59-65(1995)
[68] Smith AD、Dlotko P、Zavala VM(2020)《拓扑数据分析:概念、计算和在化学工程中的应用》,arXiv:2006.03173
[69] 斯莫拉,AJ;Schölkopf,B.,支持向量回归教程,统计计算,14,3,199-222(2004)
[70] Tawarmalani,M。;内华达州萨希尼迪斯,《全局优化的多面体分枝切割法》,《数学程序》,103,2,225-249(2005)·Zbl 1099.90047号 ·doi:10.1007/s10107-005-0581-8
[71] Tax DMJ(2001)《一类分类:缺乏反例的概念学习》。代尔夫特理工大学博士论文
[72] 税务,DM;Duin,RP,使用支持向量的数据域描述,ESANN,99,251-256(1999)
[73] 美联社Teixeira;克莱门特,JJ;库尼亚,AE;卡隆多,MJ;Oliveira,R.,基于混合参数/非参数模型的生物过程迭代批到批优化,生物技术计划,22,1,247-258(2006)
[74] Tralie,C。;Saul,N。;Bar-On,R.,Ripser.py:一个精简的python持久同源库,J Open Source Softw,3,29,925(2018)
[75] Venkatasubramanian,V.,《化学工程中人工智能的前景:最后,它在这里吗》,AIChE J,65,2,466-78(2019)
[76] Virtanen,P。;Gommers,R。;奥列芬特,TE;哈伯兰,M。;Reddy,T。;库纳波,D。;Burovski,E。;彼得森,P。;Weckesser,W。;Bright,J.,Scipy 1.0:python中科学计算的基本算法,Nat Methods,17,3,261-272(2020)
[77] 冯·斯托什,M。;奥利维拉,R。;佩雷斯,J。;de Azevedo,SF,《过程系统工程中的混合半参数建模:过去、现在和未来》,《计算化学工程》,60,86-101(2014)·doi:10.1016/j.com.pchemeng.2013.08.008
[78] 冯·斯托施,M。;申肯多夫,R。;盖尔霍夫,G。;Varsakelis,C。;Mariti,M。;Dessoy,S.公司。;Vandercammen,A。;Pysik,A。;Sanders,M.,《在设计空间内工作:我们的静态过程表征方法足够吗?》?,药剂学,12,6,562(2020)
[79] Wasserman,L.,拓扑数据分析,Ann Rev Stat Appl,5501-532(2018)
[80] Wilhelm ME,Stuber MD(2020)EAGO.jl:Julia中的简单高级全局优化。Optim方法软件。doi:10.1080/10556788.2020.1786566·Zbl 1501.90077号
[81] Xia,K.,离子聚集和氢键网络的持久同源性分析,物理化学化学物理,20,19,13448-13460(2018)
[82] Xia,K。;阿南德,DV;Shikhar,S。;Mu,Y.,渗透分子聚集及其氢键网络的持久同源性分析,物理化学化学物理,21,37,21038-21048(2019)
[83] Xiao,Y。;Wang,H。;Xu,W.,一类支持向量机高斯核的参数选择,IEEE Trans-Cybern,45,5,941-953(2014)
[84] Xiao,Y。;Wang,H。;张,L。;Xu,W.,为一类支持向量机选择高斯核参数的两种方法及其在故障检测中的应用,基于知识的系统,59,75-84(2014)
[85] 张,Q。;格罗斯曼,IE;Sundaramoorthy,A。;Pinto,JM,凸区域代理模型的数据驱动构建,Optim Eng,17,2,289-332(2016)·Zbl 1364.90231号 ·doi:10.1007/s11081-015-9288-8
[86] Zomordian,A。;Carlsson,G.,《计算持久同源性》,离散计算几何,33,2,249-274(2005)·Zbl 1069.55003号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。