跳到主要内容
10.1145/3365365.3382220高级会议文章/章节视图摘要出版物页面cpsweek公司会议记录会议集合
短纸
开放式访问
再现结果/v1.1

dtControl:用于控制器表示的决策树学习算法

出版:2020年4月22日出版历史

摘要

决策树学习是机器学习应用中最常用的一种分类技术。最近的工作表明,决策树可以用来简洁地表示可证明正确的控制器。与使用查找表或二进制决策图的表示相比,决策树更小,更易于解释。我们提出了dtControl,这是一个易于扩展的工具,用于将无记忆控制器表示为决策树。我们对各种决策树学习算法进行了综合评估,这些算法应用于10个由正确构造控制器综合引起的案例研究。这些算法包括两种新技术,一种用于在决策树学习中使用任意线性二元分类器,另一种用于确定决策树构建期间控制器的新方法。尤其是后者被证明是非常有效的,在5个案例研究中生成决策树,决策节点的数量为一位数。

参考文献

  1. P.Ashok、T.Brázdil、K.Chatterjee、J.Křetínsk‖、C.H.Lampert和V.Toman。2019.用带有线性分类器的决策树表示策略。QEST(1)。施普林格,109-128。谷歌学者谷歌学者
  2. 普拉纳夫·阿肖克(Pranav Ashok)、马蒂亚斯·杰克米耶(Mathias Jackermeier)、普什帕克·贾格塔普(Pushpak Jagtap)、扬·K·埃因斯克(Jan Křetínsk \345])、马克西米利安·维宁格(Maximilian Weini。dtControl:控制器表示的决策树学习算法。arX输入:cs。LG/2002.04991号谷歌学者谷歌学者
  3. P.Ashok、J.Křetínsk \345]、K.G.Larsen、A.Le Coönt、J.H.Taankvist和M.Weininger。2019.SOS:混合马尔可夫决策过程的安全、最优和小型策略。QEST(1)D.Parker和V.Wolf(编辑)。施普林格,147-164。谷歌学者谷歌学者
  4. R.Iris Bahar、Erica A.Frohm、Charles M.Gaona、Gary D.Hachtel、Enrico Macii、Abelardo Pardo和Fabio Somenzi。代数决策图及其应用。系统设计中的形式化方法10, 2/3 (1997), 171--206.谷歌学者谷歌学者数字图书馆数字图书馆
  5. C.Belta、B.Yordanov和E.A.Gol。2017离散时间动力系统的形式化方法。第89卷。斯普林格。谷歌学者谷歌学者
  6. C.M.Bishop。2007模式识别和机器学习,第5版。斯普林格。谷歌学者谷歌学者
  7. T.Brázdil、K.Chatterjee、M.Chmelik、A.Fellner和J.Kretínsk。2015.马尔可夫决策过程中学习小策略的反例解释。CAV(1)(计算机科学课堂讲稿)第9206卷。斯普林格,158--177。谷歌学者谷歌学者
  8. T.Brázdil、K.Chatterjee、J.Kretínsk和V.Toman。2018.反应合成中决策树的策略表示。TACAS(1)(计算机科学讲义)第10805卷。施普林格,385--407。谷歌学者谷歌学者
  9. L.Breiman、J.H.Friedman、R.A.Olshen和C.J.Stone。1984分类和回归树。华兹华斯。谷歌学者谷歌学者
  10. R.E.布莱恩特。1986。布尔函数操作的基于图形的算法。IEEE传输。计算。100,8(1986),677-691。谷歌学者谷歌学者数字图书馆数字图书馆
  11. Ioannis T.Christou和Sofoklis Efremidis。2007.持续学习应用程序的不断发展的倾斜决策树集成架构。AIAI(IFIP),第247卷。施普林格,3-11。谷歌学者谷歌学者
  12. A.David、P Gjöl Jensen、K.Guldstrand Larsen、M.Mikucionis和J.H.Taankvist。2015年,Uppaal Stratego。TACAS(计算机科学讲稿),第9035卷。施普林格,206-211。谷歌学者谷歌学者
  13. 安托万·吉拉德。2013.使用近似互模拟的低复杂性量化开关控制器。非线性分析:混合系统10 (2013), 34--44.谷歌学者谷歌学者交叉引用交叉引用
  14. 普什帕克·贾格塔普(Pushpak Jagtap)、法丁·阿卜迪(Fardin Abdi)、马蒂亚斯·伦格(Matthias Rungger)、马吉德·扎马尼(Majid Zamani)和马可·卡卡莫(Marco Caccamo)。2018.通过完全系统重启实现网络物理系统的软件容错。CoRR公司abs/1812.03546(2018)。谷歌学者谷歌学者
  15. Pushpak Jagtap和Majid Zamani。2017.QUEST:符号控制器的状态空间无量化合成工具。QEST(计算机科学课堂讲稿)第10503卷。施普林格,309-313。谷歌学者谷歌学者
  16. 小曼纽尔·马佐(Manuel Mazo Jr.)、安娜·戴维蒂安(Anna Davitian)和保罗·塔布阿达(Paulo Tabuada)。2010年,PESSOA:嵌入式控制器合成工具。CAV(计算机科学课堂讲稿)第6174卷。斯普林格,566-569。谷歌学者谷歌学者
  17. Kyle D.Julian、Mykel J.Kochenderfer和Michael P.Owen。2018.飞机防撞系统的深度神经网络压缩。CoRR公司abs/1810.04240(2018)。谷歌学者谷歌学者
  18. 马哈茂德·哈立德和马吉德·扎马尼。2019.pFaces:符号控制加速生态系统。HSCC公司。美国医学会,252--257。谷歌学者谷歌学者
  19. 尼尔斯·兰德威尔(Niels Landwehr)、马克·A·霍尔(Mark A.Hall)和艾比·弗兰克(Eibe Frank)。2003.逻辑模型树。ECML(计算机科学课堂讲稿),第2837卷。施普林格,241-252。谷歌学者谷歌学者
  20. Kim Guldstrand Larsen、Adrien Le Coönt、Marius Mikucionis和Jakob Haahr Taankvist。2018年,Uppaal Tiga连续系统的保证控制综合。CyPhy/WESE(计算机科学课堂讲稿)第11615卷。施普林格,113--133。谷歌学者谷歌学者
  21. Kim Guldstrand Larsen、Marius Mikucionis和Jakob Haahr Taankvist。2015.安全和最佳自适应巡航控制。正确的系统设计(计算机科学课堂讲稿)第9360卷。施普林格,260-277。谷歌学者谷歌学者
  22. 菲利普·梅耶(Philipp J.Meyer)、马蒂亚斯·伦格(Matthias Rungger)、迈克尔·卢滕伯格(Michael Luttenberger)、哈维尔·埃斯帕尔扎(Javier Esparza)和马吉德·扎马尼(Majid Zamani)。2017.安全控制员定量实施策略。CoRR公司abs/1712.05278(2017)。谷歌学者谷歌学者
  23. T·M·米切尔。1997机器学习。麦格劳·希尔。谷歌学者谷歌学者数字图书馆数字图书馆
  24. 塞布蒂·穆埃利、安托万·吉拉德和格雷戈·格勒。2013年CoSyMA:使用多尺度抽象进行控制器合成的工具。HSCC。美国医学会,83-88。谷歌学者谷歌学者
  25. S.K.Murthy、S.Kasif、S.Salzberg和R.Beigel。1993.OC1:斜决策树的随机归纳。AAAI公司。AAAI出版社/麻省理工学院出版社,322--327。谷歌学者谷歌学者
  26. G.N.Nair、F.Fagnani、S.Zampieri和R.J.Evans。2007.数据速率约束下的反馈控制:概述。程序。IEEE标准95, 1 (2007), 108--137.谷歌学者谷歌学者交叉引用交叉引用
  27. Daniel Neider、Shambwaditya Saha和P.Madhusudan。2016.通过学习分类器合成分段函数。TACAS(计算机科学讲稿)第9636卷。施普林格,186-203。谷歌学者谷歌学者
  28. F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay。2011年,Scikit学习:Python中的机器学习。机器学习研究杂志12 (2011), 2825--2830.谷歌学者谷歌学者数字图书馆数字图书馆
  29. 拉里·皮亚特(Larry D.Pyeat)和阿黛尔·豪(Adele E.Howe)。1998强化学习中的决策树函数逼近。技术报告。科罗拉多州立大学计算机科学系。谷歌学者谷歌学者数字图书馆数字图书馆
  30. J.R.昆兰。1993C4.5:机器学习程序。摩根·考夫曼。谷歌学者谷歌学者
  31. G.Reissig、A.Weber和M.Rungger。2016.符号控制器合成的反馈细化关系。IEEE传输。自动化。控制62, 4 (2016), 1781--1796.谷歌学者谷歌学者交叉引用交叉引用
  32. M.Rungger和Zamani M.2016年。SCOTS:符号控制器合成工具。HSCC。美国医学会,99-104。谷歌学者谷歌学者数字图书馆数字图书馆
  33. 马蒂亚斯·伦格(Matthias Rungger)、亚历山大·韦伯(Alexander Weber)和冈特·雷西格(Gunther Reissig)。2015年,国家低复杂性抽象空间网格。疾病预防控制中心。IEEE,6139--6146。谷歌学者谷歌学者
  34. 马蒂亚斯·伦格和马吉德·扎马尼。2017.不确定控制系统的不变反馈熵。CoRR公司abs/1706.05242(2017)。谷歌学者谷歌学者
  35. A.Swikir和M.Zamani。2019.交换系统网络符号模型的合成。IEEE控制系统信件3, 4 (2019), 1056--1061.谷歌学者谷歌学者交叉引用交叉引用
  36. P.塔布阿达。2009混合系统的验证和控制:符号方法。施普林格科技与商业媒体。谷歌学者谷歌学者数字图书馆数字图书馆
  37. 保罗·厄特戈夫(Paul E.Utgoff)。1988.感知器树:混合概念表征的案例研究。AAAI公司。AAAI出版社/麻省理工学院出版社,601-606。谷歌学者谷歌学者数字图书馆数字图书馆
  38. Ivan S.Zaprev、Cees Verdier和Manuel Mazo Jr.2018年。BDD存储的最佳符号控制器确定。ADHS(IFAC-PapersOnLine),第51卷。爱思唯尔,1-6。谷歌学者谷歌学者
  39. 哈里·张。2004年,朴素贝叶斯的最优性。FLAIRS会议。AAAI出版社,562-567。谷歌学者谷歌学者

索引术语

  1. dtControl:用于控制器表示的决策树学习算法

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器