王彤;辛西娅·鲁丁;Doshi-Velez,决赛;刘益民;埃里卡·克拉普弗尔;佩里·麦克内尔 用于可解释分类的学习规则集的贝叶斯框架。 (英文) Zbl 1434.68467号 J.马赫。学习。物件。 18(2017-2018),第70号论文,37页(2017). 摘要:我们提出了一种用于构建分类器的机器学习算法,该分类器由小的数量短的规则。这些是限制析取范式模型。这种形式的分类器示例如下:如果\(X)满足(条件A与条件B)或(条件C)或,然后\(Y=1\)。这种形式的模型的优点是可以被人类专家解释,因为它们产生了一组简洁描述特定类的规则。我们提出了两个具有先验参数的概率模型,用户可以设置这些参数来鼓励模型具有所需的大小和形状,以符合特定领域的可解释性定义。我们提供了一种可扩展的MAP推理方法,并通过迭代修剪搜索空间来开发理论界以减少计算。我们应用我们的方法(贝叶斯规则集(Bayesian Rule Sets,BRS)来描述和预测与车内上下文软件个性化推荐系统相关的用户行为。我们的方法有一个主要与经典的关联分类方法和决策树相比,它的优点是不会贪婪地增长模型。 引用于17文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 2015年1月62日 贝叶斯推断 62H30型 分类和区分;聚类分析(统计方面) 关键词:析取范式;统计学习;数据挖掘;关联规则;可解释分类器;贝叶斯建模 软件:FP-增长;CMAR公司;UCI-毫升 PDF格式BibTeX公司 XML格式引用 \textit{T.Wang}等人,J.Mach。学习。第18号决议,第70号论文,37页(2017年;Zbl 1434.68467) 全文: 链接 参考文献: [1] 格迪米亚斯·阿多马维修斯和亚历山大·图志林。迈向下一代推荐系统:对最先进技术和可能扩展的调查。IEEE传输。在Knowl上。和数据工程,17(6):734-7492005。ISSN 1041-4347。 [2] 格迪米亚斯·阿多马维修斯和亚历山大·图志林。上下文软件推荐系统。2008年美国纽约州纽约市2008年ACM Rec系统会议程序,RecSys’08,第335-336页。ACM公司·Zbl 1060.68672号 [3] Hiva Allahayari和Niklas Lavesson。面向用户的分类模型可理解性评估。在SCAI中,2011年第11-19页。33 [4] E.Angelino、N.Larus-Stone、D.Alabi、M.Seltzer和C.Rudin。学习分类数据的可证明最优规则列表。2017年第23届ACM SIGKDD知识发现和数据挖掘国际会议(KDD’17)会议记录·Zbl 1473.68134号 [5] K.Bache和M.Lichman。UCI机器学习库,2013年。统一资源定位地址http://archive。ics.uci.edu/ml。 [6] Matthias Baldauf、Schahram Dustdar和Florian Rosenberg。上下文软件系统调查。国际特设和普适计算杂志,2(4):263-2772007。 [7] 利纳斯·巴尔特鲁纳斯(Linas Baltrunas)、马吕斯·卡明斯卡斯(Marius Kaminskas)、伯恩德·路德维希(Bernd Ludwig)、奥马尔·莫林(Omar Moling。Incarmusic:汽车中的上下文软件音乐推荐。在电子商务和网络技术中,第89-100页。施普林格,2011年。 [8] Elena Baralis、Luca Cagliero、Tania Cerquitelli、Paolo Garza和Marco Marchetti。Cas-mine:通过通用规则在上下文应用程序中提供个性化服务。知识和信息系统,28(2):283-3102011。 [9] 克里斯蒂安·博尔盖特(Christian Borgelt)。fp-growth算法的实现。在开放源代码数据挖掘:频繁模式挖掘实现的第一次联席研讨会过程中,第1-5页。ACM,2005年。 [10] Endre Boros、Peter L Hammer、Toshihide Ibaraki、Alexander Kogan、Eddy Mayoraz和Ilya Muchnik。数据逻辑分析的实现。IEEE知识与数据工程学报,12(2):292-3062000。 [11] 谢尔盖·布林(Sergey Brin)、拉杰夫·莫特瓦尼(Rajeev Motwani)和克雷格·西尔弗斯坦(Craig Silverstein)。超越市场篮子:将关联规则推广到相关性。ACM SIGMOD记录,第26卷(2),第265-276页。ACM,1997年。 [12] 陈国庆、刘红燕、余岚、魏强和张兴。一种新的基于关联规则挖掘的分类方法。决策支持系统,42(2):674-6892006。 [13] 洪诚、严熙凤、韩嘉伟和徐志伟。有效分类的判别频繁模式分析。在ICDE中,第716-725页。IEEE,2007年。 [14] P.Clark和T.Niblett。cn2归纳算法。机器学习,3:261-2831989。 [15] 威廉·科恩。快速有效的规则归纳。第十二届机器学习国际会议论文集,第115-123页,1995年。 [16] Yves Crama、Peter L Hammer和Toshihide Ibaraki。因果关系和部分定义的布尔函数。运筹学年鉴,16(1):299-3251988·Zbl 0709.03533号 [17] 董国柱,张秀珍,黄利顺,李金燕。Caep:通过聚合新兴模式进行分类。在发现科学国际会议上,第30-42页。斯普林格,1999年。 [18] 维塔利·费尔德曼。近似两级逻辑最小化和带有成员查询的pac学习的困难。在第三十八届ACM计算理论研讨会的会议记录中,第363-372页。ACM,2006年。34 ·Zbl 1301.68214号 [19] 维塔利·费尔德曼。从傅立叶谱学习DNF表达式。CoRR,abs/1203.05942012年。 [20] Eibe Frank和Ian H.Witten。生成精确的规则集而不进行全局优化。《第十五届国际机器学习会议记录》,ICML'98,第144-151页,1998年。 [21] 亚历克斯·A·弗雷塔斯。可理解的分类模型:立场文件。ACM SIGKDD探索新闻稿,15(1):1-10,2014年3月。 [22] 杰罗姆·H·弗里德曼和尼古拉斯·I·费舍尔。高维数据中的凹凸搜索。统计与计算,9(2):123-1431999。 [23] 布莱恩·盖恩斯和保罗·康普顿。归纳应用于大型数据库建模的涟漪下降规则。智能信息系统杂志,5(3):211-2281995。 [24] 辛西娅·鲁丁(Cynthia Rudin)。用于学习不平衡数据的方框图。2014年第20届ACM SIGKDD知识发现和数据挖掘会议论文集。 [25] 约翰·豪泽(John R Hauser)、奥利维尔·图比亚(Olivier Toubia)、西奥多罗斯·埃夫吉尼奥(Theodoros Evgeniou)、雷内·贝福特(Rene Befurt)和达里亚·德扎布拉(Daria Dzyabura)。连词的混淆、认知的简单性和考虑的集合。营销研究杂志,47(3):485-4962010。 [26] 罗伯特·霍尔特(Robert C.Holte)。非常简单的分类规则在最常用的数据集上表现良好。机器学习,11(1):63-911993·Zbl 0850.68278号 [27] 约翰·休斯曼(Johan Huysmans)、卡雷尔·德杰格(Karel Dejaeger)、克里斯托夫·梅斯(Christophe Mues)、扬·凡提宁(Jan Vanthenen)和巴特·贝森(Bart Baesens)。对基于决策表、树和规则的预测模型的可理解性进行实证评估。决策支持系统,51(1):141-1542011。 [28] Chi-Ruey Hwang先生。模拟退火:理论与应用。《数学应用学报》,12(1):108-1111988年。 [29] 亚当·克莱文斯和洛科·塞韦迪奥。及时学习dnf 2O(n1/3)。2001年,美国纽约州纽约市,STOC'01,第258-265页,第33届美国计算机学会计算机理论年会。ACM公司·Zbl 1323.68328号 [30] Bae-Hee Lee、Heung-Nam Kim、Jin-Guk Jung和Geun-Sik Jo.基于位置的服务,提供餐厅推荐的上下文数据。在数据库和专家系统应用程序中,第430-438页。斯普林格,2006年。 [31] 本杰明·莱瑟姆(Benjamin Letham)、辛西娅·鲁丁(Cynthia Rudin)、泰勒·H·麦考密克(Tyler H.McCormick)和大卫·马迪根(David Madigan)。使用规则和贝叶斯分析的可解释分类器:构建更好的笔画预测模型。《应用统计年鉴》,2015年。经小修改后接受·Zbl 1454.62348号 [32] 李文敏、韩嘉伟和贝健。Cmar:基于多类关联规则的准确高效分类。在ICDM 2001中,第369-376页。IEEE,2001年。 [33] 马炳(Bing Ma)、刘文妮(Wynne Liu)和徐一鸣(Yiming Hsu)。集成分类和关联规则挖掘。第四届知识发现和数据挖掘国际会议(KDD)论文集,1998年。35 [34] 德米特里·马利奥托夫和库什·瓦什尼。通过布尔压缩感知实现精确规则学习。ICML,2013年。 [35] 大卫·马滕斯和巴特·贝森。建立可接受的分类模型。在数据挖掘中,第53-74页。施普林格,2010年。 [36] David Martens、Jan Vantheinen、Wouter Verbeke和Bart Baesens。从用户角度看分类模型的性能。决策支持系统,51(4):782-7932011。 [37] Tyler McCormick、Cynthia Rudin和David Madigan。序列事件关联规则挖掘的层次模型:一种自动医疗症状预测方法。《应用统计年鉴》,2012年·Zbl 1243.62036号 [38] R.S.Michalski。关于一般覆盖问题的拟最小解。第五届信息处理国际研讨会论文集,第125-1281969页。 [39] 斯蒂芬·马格尔顿(Stephen Muggleton)和吕克·德·雷德(Luc De Raedt)。归纳逻辑程序设计:理论和方法。《逻辑编程杂志》,19:629-6791994年·Zbl 0816.68043号 [40] 何塞·诺格拉(JoséM.Noguera)、曼努埃尔·巴兰科(Manuel J.Barranco)、拉斐尔·塞古拉(Rafael J.Segura)和路易斯·马丁内斯(Luis Martinez)。一个用于旅游业的移动3d-gis混合推荐系统。信息科学,215(0):37-522012。 [41] Moon Hee Park、Jin Hyuk Hong和Sung Bae Cho。移动设备中使用贝叶斯用户偏好模型的基于位置的推荐系统。《无处不在的智能与计算》,第1130-1139页。施普林格,2007年。 [42] 默里·M·波拉克(Murray M Pollack)、乌斯·E·鲁蒂曼(Urs E Ruttimann)和帕梅拉·R·盖森(Pamela R Getson)。儿童死亡率风险(棱镜)评分。危重病护理医学,16(11):1110-11161988。 [43] Peter R Rijnbeek和Jan A Kors。通过穷举搜索找到选言范式中简短准确的决策规则。机器学习,80(1):33-622010·Zbl 1470.68164号 [44] 辛西娅·鲁丁(Cynthia Rudin)、本杰明·莱瑟姆(Benjamin Letham)和大卫·马迪根(David Madigan)。关联规则和序列事件预测的学习理论分析。《机器学习研究杂志》,14:3384-34362013年·Zbl 1317.68184号 [45] 斯特凡·吕平(Stefan Rüping)。学习可解释模型。多特蒙德大学博士论文,2006年。 [46] 罗伯特·夏皮雷(Robert E.Schapire)。使用输出代码来解决多类学习问题。《第十四届国际机器学习会议(ICML)论文集》,313-3211997页。 [47] W Schwinger、Chr Grün、B Pröll、W Retschitzegger和A Schauerhuber。手机旅游指南中的情境意识——一项综合调查。技术报告,林茨约翰内斯·开普勒大学,2005年。 [48] 理查德·萨顿和安德鲁·巴托。强化学习:导论,第1卷。麻省理工学院出版社,剑桥,1998年·Zbl 0465.68041号 [49] 魏光腾、谢明杰和陈明善。关于统计相关项目的替代规则挖掘。在ICDM 2003中,第442-449页。IEEE,2002年。36 [50] 洪文东和冯文洙。移动服务的个性化餐厅推荐代理。IEEE国际电子技术、电子商务和电子服务会议,2004年。(EEE),第259-262页,2004年。 [51] L.G.瓦利安特。可学习理论。Commun公司。ACM,27(11):1134-11421984年11月。ISSN 0001-0782·Zbl 0587.68077号 [52] Mark Van Setten、Stanislav Pokraev和Johan Koolwaaij。移动旅游应用罗盘中的上下文软件建议。在自适应超媒体和自适应网络系统中,第235-244页。斯普林格,2004年。 [53] 凯蒂安·韦伯特(Katrien Verbert)、尼科斯·马努塞利斯(Nikos Manouselis)、泽维尔·奥乔亚(Xavier Ochoa)、马丁·沃尔珀斯(Martin Wolpers)、亨德里克·德拉赫斯勒(Hendrik Drachsler)、伊万娜·博斯尼克(Ivana Bo。用于学习的上下文软件推荐系统:调查和未来挑战。IEEE学习技术汇刊,5(4):318-3352012。 [54] 富尔顿·王和辛西娅·鲁丁。下降规则列表。《人工智能与统计学报》(AISTATS),2015年。 [55] Tong Wang、Cynthia Rudin、F Doshi、Yimin Liu、Erica Klampfl和Perry MacNeille。2015年车内优惠券推荐数据集。网址:www.researchgate.net/publication/\318645502_in-vehicle_coupon_recommendation。 [56] 王彤(Tong Wang)、辛西娅·鲁丁(Cynthia Rudin)、芬兰·多西(Finale Doshi)、刘一敏(Yimin Liu)、艾丽卡·克拉姆弗尔(Erica Klampfl)和佩里·麦克尼尔。贝叶斯或和的可解释分类,应用于上下文感知推荐系统。2016年国际数据挖掘会议(ICDM)论文集·Zbl 1434.68467号 [57] 王新喜、大卫·罗森布拉姆和王冶。针对日常活动的上下文软件移动音乐推荐。2012年第20届ACM国际多媒体会议记录,第99-108页。 [58] 杰弗里·韦伯。Opus:一种有效的无序搜索容许算法。J.阿蒂夫。智力。Res.,3:431-4651995·Zbl 0900.68180号 [59] 吴新东、张成琦和张世超。挖掘正关联规则和负关联规则。《第十九届ICML会议记录》,第658-665页。摩根考夫曼出版公司,2002年。 [60] 尹晓欣和韩嘉伟。Cpar:基于预测关联规则的分类。在SDM中,第3卷,第369-376页。SIAM,2003年。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。