×

用于可解释分类的学习规则集的贝叶斯框架。 (英文) Zbl 1434.68467号

摘要:我们提出了一种用于构建分类器的机器学习算法,该分类器由小的数量短的规则。这些是限制析取范式模型。这种形式的分类器示例如下:如果\(X)满足(条件A与条件B)或(条件C)或,然后\(Y=1\)。这种形式的模型的优点是可以被人类专家解释,因为它们产生了一组简洁描述特定类的规则。我们提出了两个具有先验参数的概率模型,用户可以设置这些参数来鼓励模型具有所需的大小和形状,以符合特定领域的可解释性定义。我们提供了一种可扩展的MAP推理方法,并通过迭代修剪搜索空间来开发理论界以减少计算。我们应用我们的方法(贝叶斯规则集(Bayesian Rule Sets,BRS)来描述和预测与车内上下文软件个性化推荐系统相关的用户行为。我们的方法有一个主要与经典的关联分类方法和决策树相比,它的优点是不会贪婪地增长模型。

MSC公司:

68T05型 人工智能中的学习和自适应系统
2015年1月62日 贝叶斯推断
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 链接

参考文献:

[1] 格迪米亚斯·阿多马维修斯和亚历山大·图志林。迈向下一代推荐系统:对最先进技术和可能扩展的调查。IEEE传输。在Knowl上。和数据工程,17(6):734-7492005。ISSN 1041-4347。
[2] 格迪米亚斯·阿多马维修斯和亚历山大·图志林。上下文软件推荐系统。2008年美国纽约州纽约市2008年ACM Rec系统会议程序,RecSys’08,第335-336页。ACM公司·Zbl 1060.68672号
[3] Hiva Allahayari和Niklas Lavesson。面向用户的分类模型可理解性评估。在SCAI中,2011年第11-19页。33
[4] E.Angelino、N.Larus-Stone、D.Alabi、M.Seltzer和C.Rudin。学习分类数据的可证明最优规则列表。2017年第23届ACM SIGKDD知识发现和数据挖掘国际会议(KDD’17)会议记录·Zbl 1473.68134号
[5] K.Bache和M.Lichman。UCI机器学习库,2013年。统一资源定位地址http://archive。ics.uci.edu/ml。
[6] Matthias Baldauf、Schahram Dustdar和Florian Rosenberg。上下文软件系统调查。国际特设和普适计算杂志,2(4):263-2772007。
[7] 利纳斯·巴尔特鲁纳斯(Linas Baltrunas)、马吕斯·卡明斯卡斯(Marius Kaminskas)、伯恩德·路德维希(Bernd Ludwig)、奥马尔·莫林(Omar Moling。Incarmusic:汽车中的上下文软件音乐推荐。在电子商务和网络技术中,第89-100页。施普林格,2011年。
[8] Elena Baralis、Luca Cagliero、Tania Cerquitelli、Paolo Garza和Marco Marchetti。Cas-mine:通过通用规则在上下文应用程序中提供个性化服务。知识和信息系统,28(2):283-3102011。
[9] 克里斯蒂安·博尔盖特(Christian Borgelt)。fp-growth算法的实现。在开放源代码数据挖掘:频繁模式挖掘实现的第一次联席研讨会过程中,第1-5页。ACM,2005年。
[10] Endre Boros、Peter L Hammer、Toshihide Ibaraki、Alexander Kogan、Eddy Mayoraz和Ilya Muchnik。数据逻辑分析的实现。IEEE知识与数据工程学报,12(2):292-3062000。
[11] 谢尔盖·布林(Sergey Brin)、拉杰夫·莫特瓦尼(Rajeev Motwani)和克雷格·西尔弗斯坦(Craig Silverstein)。超越市场篮子:将关联规则推广到相关性。ACM SIGMOD记录,第26卷(2),第265-276页。ACM,1997年。
[12] 陈国庆、刘红燕、余岚、魏强和张兴。一种新的基于关联规则挖掘的分类方法。决策支持系统,42(2):674-6892006。
[13] 洪诚、严熙凤、韩嘉伟和徐志伟。有效分类的判别频繁模式分析。在ICDE中,第716-725页。IEEE,2007年。
[14] P.Clark和T.Niblett。cn2归纳算法。机器学习,3:261-2831989。
[15] 威廉·科恩。快速有效的规则归纳。第十二届机器学习国际会议论文集,第115-123页,1995年。
[16] Yves Crama、Peter L Hammer和Toshihide Ibaraki。因果关系和部分定义的布尔函数。运筹学年鉴,16(1):299-3251988·Zbl 0709.03533号
[17] 董国柱,张秀珍,黄利顺,李金燕。Caep:通过聚合新兴模式进行分类。在发现科学国际会议上,第30-42页。斯普林格,1999年。
[18] 维塔利·费尔德曼。近似两级逻辑最小化和带有成员查询的pac学习的困难。在第三十八届ACM计算理论研讨会的会议记录中,第363-372页。ACM,2006年。34 ·Zbl 1301.68214号
[19] 维塔利·费尔德曼。从傅立叶谱学习DNF表达式。CoRR,abs/1203.05942012年。
[20] Eibe Frank和Ian H.Witten。生成精确的规则集而不进行全局优化。《第十五届国际机器学习会议记录》,ICML'98,第144-151页,1998年。
[21] 亚历克斯·A·弗雷塔斯。可理解的分类模型:立场文件。ACM SIGKDD探索新闻稿,15(1):1-10,2014年3月。
[22] 杰罗姆·H·弗里德曼和尼古拉斯·I·费舍尔。高维数据中的凹凸搜索。统计与计算,9(2):123-1431999。
[23] 布莱恩·盖恩斯和保罗·康普顿。归纳应用于大型数据库建模的涟漪下降规则。智能信息系统杂志,5(3):211-2281995。
[24] 辛西娅·鲁丁(Cynthia Rudin)。用于学习不平衡数据的方框图。2014年第20届ACM SIGKDD知识发现和数据挖掘会议论文集。
[25] 约翰·豪泽(John R Hauser)、奥利维尔·图比亚(Olivier Toubia)、西奥多罗斯·埃夫吉尼奥(Theodoros Evgeniou)、雷内·贝福特(Rene Befurt)和达里亚·德扎布拉(Daria Dzyabura)。连词的混淆、认知的简单性和考虑的集合。营销研究杂志,47(3):485-4962010。
[26] 罗伯特·霍尔特(Robert C.Holte)。非常简单的分类规则在最常用的数据集上表现良好。机器学习,11(1):63-911993·Zbl 0850.68278号
[27] 约翰·休斯曼(Johan Huysmans)、卡雷尔·德杰格(Karel Dejaeger)、克里斯托夫·梅斯(Christophe Mues)、扬·凡提宁(Jan Vanthenen)和巴特·贝森(Bart Baesens)。对基于决策表、树和规则的预测模型的可理解性进行实证评估。决策支持系统,51(1):141-1542011。
[28] Chi-Ruey Hwang先生。模拟退火:理论与应用。《数学应用学报》,12(1):108-1111988年。
[29] 亚当·克莱文斯和洛科·塞韦迪奥。及时学习dnf 2O(n1/3)。2001年,美国纽约州纽约市,STOC'01,第258-265页,第33届美国计算机学会计算机理论年会。ACM公司·Zbl 1323.68328号
[30] Bae-Hee Lee、Heung-Nam Kim、Jin-Guk Jung和Geun-Sik Jo.基于位置的服务,提供餐厅推荐的上下文数据。在数据库和专家系统应用程序中,第430-438页。斯普林格,2006年。
[31] 本杰明·莱瑟姆(Benjamin Letham)、辛西娅·鲁丁(Cynthia Rudin)、泰勒·H·麦考密克(Tyler H.McCormick)和大卫·马迪根(David Madigan)。使用规则和贝叶斯分析的可解释分类器:构建更好的笔画预测模型。《应用统计年鉴》,2015年。经小修改后接受·Zbl 1454.62348号
[32] 李文敏、韩嘉伟和贝健。Cmar:基于多类关联规则的准确高效分类。在ICDM 2001中,第369-376页。IEEE,2001年。
[33] 马炳(Bing Ma)、刘文妮(Wynne Liu)和徐一鸣(Yiming Hsu)。集成分类和关联规则挖掘。第四届知识发现和数据挖掘国际会议(KDD)论文集,1998年。35
[34] 德米特里·马利奥托夫和库什·瓦什尼。通过布尔压缩感知实现精确规则学习。ICML,2013年。
[35] 大卫·马滕斯和巴特·贝森。建立可接受的分类模型。在数据挖掘中,第53-74页。施普林格,2010年。
[36] David Martens、Jan Vantheinen、Wouter Verbeke和Bart Baesens。从用户角度看分类模型的性能。决策支持系统,51(4):782-7932011。
[37] Tyler McCormick、Cynthia Rudin和David Madigan。序列事件关联规则挖掘的层次模型:一种自动医疗症状预测方法。《应用统计年鉴》,2012年·Zbl 1243.62036号
[38] R.S.Michalski。关于一般覆盖问题的拟最小解。第五届信息处理国际研讨会论文集,第125-1281969页。
[39] 斯蒂芬·马格尔顿(Stephen Muggleton)和吕克·德·雷德(Luc De Raedt)。归纳逻辑程序设计:理论和方法。《逻辑编程杂志》,19:629-6791994年·Zbl 0816.68043号
[40] 何塞·诺格拉(JoséM.Noguera)、曼努埃尔·巴兰科(Manuel J.Barranco)、拉斐尔·塞古拉(Rafael J.Segura)和路易斯·马丁内斯(Luis Martinez)。一个用于旅游业的移动3d-gis混合推荐系统。信息科学,215(0):37-522012。
[41] Moon Hee Park、Jin Hyuk Hong和Sung Bae Cho。移动设备中使用贝叶斯用户偏好模型的基于位置的推荐系统。《无处不在的智能与计算》,第1130-1139页。施普林格,2007年。
[42] 默里·M·波拉克(Murray M Pollack)、乌斯·E·鲁蒂曼(Urs E Ruttimann)和帕梅拉·R·盖森(Pamela R Getson)。儿童死亡率风险(棱镜)评分。危重病护理医学,16(11):1110-11161988。
[43] Peter R Rijnbeek和Jan A Kors。通过穷举搜索找到选言范式中简短准确的决策规则。机器学习,80(1):33-622010·Zbl 1470.68164号
[44] 辛西娅·鲁丁(Cynthia Rudin)、本杰明·莱瑟姆(Benjamin Letham)和大卫·马迪根(David Madigan)。关联规则和序列事件预测的学习理论分析。《机器学习研究杂志》,14:3384-34362013年·Zbl 1317.68184号
[45] 斯特凡·吕平(Stefan Rüping)。学习可解释模型。多特蒙德大学博士论文,2006年。
[46] 罗伯特·夏皮雷(Robert E.Schapire)。使用输出代码来解决多类学习问题。《第十四届国际机器学习会议(ICML)论文集》,313-3211997页。
[47] W Schwinger、Chr Grün、B Pröll、W Retschitzegger和A Schauerhuber。手机旅游指南中的情境意识——一项综合调查。技术报告,林茨约翰内斯·开普勒大学,2005年。
[48] 理查德·萨顿和安德鲁·巴托。强化学习:导论,第1卷。麻省理工学院出版社,剑桥,1998年·Zbl 0465.68041号
[49] 魏光腾、谢明杰和陈明善。关于统计相关项目的替代规则挖掘。在ICDM 2003中,第442-449页。IEEE,2002年。36
[50] 洪文东和冯文洙。移动服务的个性化餐厅推荐代理。IEEE国际电子技术、电子商务和电子服务会议,2004年。(EEE),第259-262页,2004年。
[51] L.G.瓦利安特。可学习理论。Commun公司。ACM,27(11):1134-11421984年11月。ISSN 0001-0782·Zbl 0587.68077号
[52] Mark Van Setten、Stanislav Pokraev和Johan Koolwaaij。移动旅游应用罗盘中的上下文软件建议。在自适应超媒体和自适应网络系统中,第235-244页。斯普林格,2004年。
[53] 凯蒂安·韦伯特(Katrien Verbert)、尼科斯·马努塞利斯(Nikos Manouselis)、泽维尔·奥乔亚(Xavier Ochoa)、马丁·沃尔珀斯(Martin Wolpers)、亨德里克·德拉赫斯勒(Hendrik Drachsler)、伊万娜·博斯尼克(Ivana Bo。用于学习的上下文软件推荐系统:调查和未来挑战。IEEE学习技术汇刊,5(4):318-3352012。
[54] 富尔顿·王和辛西娅·鲁丁。下降规则列表。《人工智能与统计学报》(AISTATS),2015年。
[55] Tong Wang、Cynthia Rudin、F Doshi、Yimin Liu、Erica Klampfl和Perry MacNeille。2015年车内优惠券推荐数据集。网址:www.researchgate.net/publication/\318645502_in-vehicle_coupon_recommendation。
[56] 王彤(Tong Wang)、辛西娅·鲁丁(Cynthia Rudin)、芬兰·多西(Finale Doshi)、刘一敏(Yimin Liu)、艾丽卡·克拉姆弗尔(Erica Klampfl)和佩里·麦克尼尔。贝叶斯或和的可解释分类,应用于上下文感知推荐系统。2016年国际数据挖掘会议(ICDM)论文集·Zbl 1434.68467号
[57] 王新喜、大卫·罗森布拉姆和王冶。针对日常活动的上下文软件移动音乐推荐。2012年第20届ACM国际多媒体会议记录,第99-108页。
[58] 杰弗里·韦伯。Opus:一种有效的无序搜索容许算法。J.阿蒂夫。智力。Res.,3:431-4651995·Zbl 0900.68180号
[59] 吴新东、张成琦和张世超。挖掘正关联规则和负关联规则。《第十九届ICML会议记录》,第658-665页。摩根考夫曼出版公司,2002年。
[60] 尹晓欣和韩嘉伟。Cpar:基于预测关联规则的分类。在SDM中,第3卷,第369-376页。SIAM,2003年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。