dtControl：用于控制器表示的决策树学习算法

作者：
普拉纳夫·阿肖克

德国慕尼黑慕尼黑技术大学

德国慕尼黑慕尼黑技术大学
查看配置文件

,
马蒂亚斯·杰克米耶

德国慕尼黑慕尼黑技术大学

德国慕尼黑慕尼黑技术大学
查看配置文件

,
Pushpak Jagtap公司

德国慕尼黑慕尼黑技术大学

德国慕尼黑慕尼黑技术大学
查看配置文件

,
简·K·埃因斯克

德国慕尼黑慕尼黑技术大学

德国慕尼黑慕尼黑技术大学
查看配置文件

,
马克西米利安·魏宁格

德国慕尼黑慕尼黑技术大学

德国慕尼黑慕尼黑技术大学
查看配置文件

,
马吉德·扎马尼

科罗拉多大学博尔德分校和德国慕尼黑路德维希·马克西米利安大学

科罗拉多大学博尔德分校和德国慕尼黑路德维希·马克西米利安大学
查看配置文件

作者信息和声明

HSCC’20：第23届混合系统国际会议论文集：计算与控制2020年4月条款编号：17第1-7页https://doi.org/10.1145/3365365.3382220

出版：2020年4月22日出版历史

HSCC’20：第23届混合系统国际会议论文集：计算与控制

第1-7页

摘要

决策树学习是机器学习应用中最常用的一种分类技术。最近的工作表明，决策树可以用来简洁地表示可证明正确的控制器。与使用查找表或二进制决策图的表示相比，决策树更小，更易于解释。我们提出了dtControl，这是一个易于扩展的工具，用于将无记忆控制器表示为决策树。我们对各种决策树学习算法进行了综合评估，这些算法应用于10个由正确构造控制器综合引起的案例研究。这些算法包括两种新技术，一种用于在决策树学习中使用任意线性二元分类器，另一种用于确定决策树构建期间控制器的新方法。尤其是后者被证明是非常有效的，在5个案例研究中生成决策树，决策节点的数量为一位数。

参考文献

P.Ashok、T.Brázdil、K.Chatterjee、J.Křetínsk‖、C.H.Lampert和V.Toman。2019.用带有线性分类器的决策树表示策略。在QEST（1）。施普林格，109-128。谷歌学者
普拉纳夫·阿肖克（Pranav Ashok）、马蒂亚斯·杰克米耶（Mathias Jackermeier）、普什帕克·贾格塔普（Pushpak Jagtap）、扬·K·埃因斯克（Jan Křetínsk \345]）、马克西米利安·维宁格（Maximilian Weini。dtControl：控制器表示的决策树学习算法。arX输入：cs。LG/2002.04991号谷歌学者
P.Ashok、J.Křetínsk \345]、K.G.Larsen、A.Le Coönt、J.H.Taankvist和M.Weininger。2019.SOS：混合马尔可夫决策过程的安全、最优和小型策略。在QEST（1）D.Parker和V.Wolf（编辑）。施普林格，147-164。谷歌学者
R.Iris Bahar、Erica A.Frohm、Charles M.Gaona、Gary D.Hachtel、Enrico Macii、Abelardo Pardo和Fabio Somenzi。代数决策图及其应用。系统设计中的形式化方法10, 2/3 (1997), 171--206.谷歌学者数字图书馆
C.Belta、B.Yordanov和E.A.Gol。2017离散时间动力系统的形式化方法。第89卷。斯普林格。谷歌学者
C.M.Bishop。2007模式识别和机器学习，第5版。斯普林格。谷歌学者
T.Brázdil、K.Chatterjee、M.Chmelik、A.Fellner和J.Kretínsk。2015.马尔可夫决策过程中学习小策略的反例解释。在CAV（1）（计算机科学课堂讲稿）第9206卷。斯普林格，158--177。谷歌学者
T.Brázdil、K.Chatterjee、J.Kretínsk和V.Toman。2018.反应合成中决策树的策略表示。在TACAS（1）（计算机科学讲义）第10805卷。施普林格，385--407。谷歌学者
L.Breiman、J.H.Friedman、R.A.Olshen和C.J.Stone。1984分类和回归树。华兹华斯。谷歌学者
R.E.布莱恩特。1986。布尔函数操作的基于图形的算法。IEEE传输。计算。100，8（1986），677-691。谷歌学者数字图书馆
Ioannis T.Christou和Sofoklis Efremidis。2007.持续学习应用程序的不断发展的倾斜决策树集成架构。在AIAI（IFIP），第247卷。施普林格，3-11。谷歌学者
A.David、P Gjöl Jensen、K.Guldstrand Larsen、M.Mikucionis和J.H.Taankvist。2015年，Uppaal Stratego。在TACAS（计算机科学讲稿），第9035卷。施普林格，206-211。谷歌学者
安托万·吉拉德。2013.使用近似互模拟的低复杂性量化开关控制器。非线性分析：混合系统10 (2013), 34--44.谷歌学者交叉引用
普什帕克·贾格塔普（Pushpak Jagtap）、法丁·阿卜迪（Fardin Abdi）、马蒂亚斯·伦格（Matthias Rungger）、马吉德·扎马尼（Majid Zamani）和马可·卡卡莫（Marco Caccamo）。2018.通过完全系统重启实现网络物理系统的软件容错。CoRR公司abs/1812.03546（2018）。谷歌学者
Pushpak Jagtap和Majid Zamani。2017.QUEST：符号控制器的状态空间无量化合成工具。在QEST（计算机科学课堂讲稿）第10503卷。施普林格，309-313。谷歌学者
小曼纽尔·马佐（Manuel Mazo Jr.）、安娜·戴维蒂安（Anna Davitian）和保罗·塔布阿达（Paulo Tabuada）。2010年，PESSOA:嵌入式控制器合成工具。在CAV（计算机科学课堂讲稿）第6174卷。斯普林格，566-569。谷歌学者
Kyle D.Julian、Mykel J.Kochenderfer和Michael P.Owen。2018.飞机防撞系统的深度神经网络压缩。CoRR公司abs/1810.04240（2018）。谷歌学者
马哈茂德·哈立德和马吉德·扎马尼。2019.pFaces：符号控制加速生态系统。在HSCC公司。美国医学会，252--257。谷歌学者
尼尔斯·兰德威尔（Niels Landwehr）、马克·A·霍尔（Mark A.Hall）和艾比·弗兰克（Eibe Frank）。2003.逻辑模型树。在ECML（计算机科学课堂讲稿），第2837卷。施普林格，241-252。谷歌学者
Kim Guldstrand Larsen、Adrien Le Coönt、Marius Mikucionis和Jakob Haahr Taankvist。2018年，Uppaal Tiga连续系统的保证控制综合。在CyPhy/WESE（计算机科学课堂讲稿）第11615卷。施普林格，113--133。谷歌学者
Kim Guldstrand Larsen、Marius Mikucionis和Jakob Haahr Taankvist。2015.安全和最佳自适应巡航控制。在正确的系统设计（计算机科学课堂讲稿）第9360卷。施普林格，260-277。谷歌学者
菲利普·梅耶（Philipp J.Meyer）、马蒂亚斯·伦格（Matthias Rungger）、迈克尔·卢滕伯格（Michael Luttenberger）、哈维尔·埃斯帕尔扎（Javier Esparza）和马吉德·扎马尼（Majid Zamani）。2017.安全控制员定量实施策略。CoRR公司abs/1712.05278（2017）。谷歌学者
T·M·米切尔。1997机器学习。麦格劳·希尔。谷歌学者数字图书馆
塞布蒂·穆埃利、安托万·吉拉德和格雷戈·格勒。2013年CoSyMA：使用多尺度抽象进行控制器合成的工具。在HSCC。美国医学会，83-88。谷歌学者
S.K.Murthy、S.Kasif、S.Salzberg和R.Beigel。1993.OC1：斜决策树的随机归纳。在AAAI公司。AAAI出版社/麻省理工学院出版社，322--327。谷歌学者
G.N.Nair、F.Fagnani、S.Zampieri和R.J.Evans。2007.数据速率约束下的反馈控制：概述。程序。IEEE标准95, 1 (2007), 108--137.谷歌学者交叉引用
Daniel Neider、Shambwaditya Saha和P.Madhusudan。2016.通过学习分类器合成分段函数。在TACAS（计算机科学讲稿）第9636卷。施普林格，186-203。谷歌学者
F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay。2011年，Scikit学习：Python中的机器学习。机器学习研究杂志12 (2011), 2825--2830.谷歌学者数字图书馆
拉里·皮亚特（Larry D.Pyeat）和阿黛尔·豪（Adele E.Howe）。1998强化学习中的决策树函数逼近。技术报告。科罗拉多州立大学计算机科学系。谷歌学者数字图书馆
J.R.昆兰。1993C4.5：机器学习程序。摩根·考夫曼。谷歌学者
G.Reissig、A.Weber和M.Rungger。2016.符号控制器合成的反馈细化关系。IEEE传输。自动化。控制62, 4 (2016), 1781--1796.谷歌学者交叉引用
M.Rungger和Zamani M.2016年。SCOTS：符号控制器合成工具。在HSCC。美国医学会，99-104。谷歌学者数字图书馆
马蒂亚斯·伦格（Matthias Rungger）、亚历山大·韦伯（Alexander Weber）和冈特·雷西格（Gunther Reissig）。2015年，国家低复杂性抽象空间网格。在疾病预防控制中心。IEEE，6139--6146。谷歌学者
马蒂亚斯·伦格和马吉德·扎马尼。2017.不确定控制系统的不变反馈熵。CoRR公司abs/1706.05242（2017）。谷歌学者
A.Swikir和M.Zamani。2019.交换系统网络符号模型的合成。IEEE控制系统信件3, 4 (2019), 1056--1061.谷歌学者交叉引用
P.塔布阿达。2009混合系统的验证和控制：符号方法。施普林格科技与商业媒体。谷歌学者数字图书馆
保罗·厄特戈夫（Paul E.Utgoff）。1988.感知器树：混合概念表征的案例研究。在AAAI公司。AAAI出版社/麻省理工学院出版社，601-606。谷歌学者数字图书馆
Ivan S.Zaprev、Cees Verdier和Manuel Mazo Jr.2018年。BDD存储的最佳符号控制器确定。在ADHS（IFAC-PapersOnLine），第51卷。爱思唯尔，1-6。谷歌学者
哈里·张。2004年，朴素贝叶斯的最优性。在FLAIRS会议。AAAI出版社，562-567。谷歌学者

索引术语

dtControl：用于控制器表示的决策树学习算法
1. 计算机系统组织
  1. 嵌入式和网络物理系统
2. 计算方法
  1. 人工智能
    1. 控制方法
  2. 机器学习
    1. 机器学习方法
      1. 分类树和回归树

建议

dtControl：用于控制器表示的决策树学习算法
HSCC’20：第23届混合系统国际会议论文集：计算与控制

决策树学习是机器学习应用中最常用的一种分类技术。最近的工作表明，决策树可以用来简洁地表示可证明正确的控制器。与表示法相比。。。
阅读更多
一种生成广义决策森林的有效算法

单变量决策树学习者的一个缺点是他们不学习中间概念，并且在每个中间树节点的分支决策中只选择一个输入特征。经验证明，级联。。。
阅读更多
dtControl 2.0：通过专家指导的决策树学习进行可解释的策略表示
系统构建和分析的工具和算法
摘要
最近的进展表明，决策树是如何适用于简洁地表示满足各种目标的策略（或控制器）的数据结构。此外，它们还使战略更易于解释。最近的工具dtControl具有。。。
阅读更多

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
HSCC’20：第23届混合系统国际会议论文集：计算与控制
2020年4月
324页
国际标准图书编号：9781450370189
内政部：10.1145/3365365
课程主席：
亚伦·艾姆斯
加州理工学院
,
桑吉特·塞希亚
加州大学伯克利分校
,
出版物主席：
Jyotirmoy Deshmukh公司
南加州大学
版权所有©2020所有者/作者
本作品根据Creative Commons Attribution International 4.0许可证授权。
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2020年4月22日
权限
请求有关此文章的权限。
请求权限

检查更新
徽章
- 再现结果/v1.1
作者标记
控制器表示
决策树
可解释性
不变熵
机器学习
非均匀量化器
符号控制
限定符
- 短纸
会议

接受率
总体验收率153属于373提交文件，41%
资金来源
其他指标
查看文章指标

文章指标
- 8
  引文总数
  查看引文
- 738
  总下载次数
- 下载次数（过去12个月）134
- 下载次数（最近6周）24
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

dtControl：用于控制器表示的决策树学习算法

HSCC’20：第23届混合系统国际会议论文集：计算与控制

摘要

参考文献

引用人

索引术语

建议

dtControl：用于控制器表示的决策树学习算法

一种生成广义决策森林的有效算法

dtControl 2.0：通过专家指导的决策树学习进行可解释的策略表示

评论