×

抽样频繁和最小布尔模式:分类中的理论和应用。 (英语) Zbl 1411.68114号

摘要:我们解决了从分类数据集挖掘最简单布尔模式的难题。我们开发了有效的抽样方法来提取析取范式(DNF)中最小布尔模式的代表子集,而不是完全枚举,这对于这类模式来说通常是不可行的。我们提出了一种新的最小DNF表达式的理论表征,它允许我们有效地修剪模式搜索空间。我们的方法可以提供最小DNF模式的近似均匀样本。我们进行了一系列实验来证明我们的采样方法的有效性。我们还表明,最小DNF模式为分类提供了有效的特征。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿格拉瓦尔,R。;Mannila,H。;Srikant,R。;香薰酮,H。;AI的Verkamo;Fayyad,U.(编辑);等。,关联规则的快速发现,307-328(1996),Menlo Park
[2] Akutsu T、Kuhara S、Maruyama O、Miyano S(1998)通过战略性基因破坏和基因过度表达识别基因调控网络。In:ACM-SIAM离散算法研讨会·Zbl 0930.68049号
[3] Antonie M-L,Zaiane O(2004)挖掘正关联规则和负关联规则:一种受限规则的方法。参加:欧洲数据库知识发现原则与实践会议
[4] Bastide Y,Taouil R,Pasquier N,Stumme G,Lakhal L(2000)利用计数推理挖掘频繁模式。SIGKDD探索2(2):66-75·数字对象标识代码:10.1145/380995.381017
[5] Bayardo RJ,Agrawal R(1999)挖掘最有趣的规则。参加:ACM SIGKDD知识发现和数据挖掘国际会议
[6] Boley M,Gärtner T,Grosskreutz H,Fraunhofer I(2010)计数和无阈值局部模式挖掘的形式概念采样。In:SIAM数据挖掘会议
[7] Boley M,Grosskreutz H(2009)稠密数据中频繁集数量的近似。知情通知系统21(1):65-89·doi:10.1007/s10115-009-0212-4
[8] Boley M,Lucchese C,Paurat D,Gärtner T(2011)通过有效的两步随机程序直接进行局部模式采样。参加:ACM SIGKDD知识发现和数据挖掘国际会议
[9] Bshouty N(1995)通过单调理论精确学习布尔函数。通知计算123(1):146-153·Zbl 1096.68634号 ·doi:10.1006/inco.1995.1164
[10] Calders T,Goethals B(2003)频繁集的最小k-free表示。参加:欧洲数据库知识发现原则与实践会议·Zbl 1020.68566号
[11] Calders T,Goethals B(2005)《快速包容-排斥》。In:关于归纳数据库中知识发现的ECML-PKDD研讨会论文集·Zbl 1178.68190号
[12] Chang C,Lin C(2011)Libsvm:支持向量机库。ACM跨智能系统技术2(3):1-39·数字对象标识代码:10.1145/1961189.1961199
[13] Chaoji V,Hasan MA,Salem S,Besson J,Zaki MJ(2008)ORIGAMI:挖掘代表性正交图模式的一种新的有效方法。统计分析数据最小值1(2):67-84·Zbl 07260185号 ·doi:10.1002/2004年3月10日
[14] Cowles M,Carlin B(1996),马尔可夫链蒙特卡罗收敛诊断:比较综述。《美国统计杂志》91(434):883-904·Zbl 0869.62066号 ·doi:10.1080/01621459.1996.10476956
[15] Curk T、Demsar J、Xu Q、Leban G、Petrovic U、Bratko I、Shaulsky G、Zupan B(2005)《微阵列数据挖掘与可视化编程》。生物信息学21(3):396-398·doi:10.1093/bioinformatics/bth474
[16] Dong G,Jiang C,Pei J,Li J,Wong L(2005)挖掘形式概念最小生成元的简洁系统。In:高级应用的国际会议数据库系统
[17] Fayyad U,Irani K(1993)用于分类学习的连续值属性的多间隔离散化。附:第十三届国际人工智能联合会议记录
[18] Frank A,Asuncion A(2010)UCI机器学习库。加州大学欧文分校信息与计算机科学学院(网址:http://archive.ics.uci.edu/ml)
[19] Ganter B,Wille R(1999)形式概念分析:数学基础。柏林施普林格·Zbl 0909.06001号 ·doi:10.1007/978-3-642-59830-2
[20] Goethals B,Zaki MJ(2004)《频繁项集挖掘实现的进展:FIMI’03报告》。SIGKDD勘探6(1):109-117·doi:10.145/1007730.1007744
[21] Gunopulos D、Khardon R、Mannila H、Saluja S、Toivonen H、Sharma R(2003)《发现所有最具体的句子》。ACM Trans数据库系统28(2):140-174·doi:10.1145/777943.777945
[22] Gunoplos D,Mannila H,Saluja S(1997)通过随机算法发现所有最具体的句子。参加:第六届数据库理论国际会议
[23] Hamrouni T,Yahia S Ben,Mephu Nguifo E(2009)《扫荡析取搜索空间,挖掘频繁项集的新精确简明表示法》。数据与知识工程68(10):1091-1111·doi:10.1016/j.datak.2009.05.001
[24] Hasan MA,Zaki MJ(2009)麝香:k最大模式的均匀采样。参加:第九届SIAM数据挖掘国际会议
[25] Hasan MA,Zaki MJ(2009)图形模式的输出空间采样。程序VLDB Endow 2(1):730-741·doi:10.14778/1687627.1687710
[26] Holte RC、Acker LE、Porter BW(1989),概念学习和小析取问题。附:第十一届国际人工智能联合会议记录·Zbl 0709.68057号
[27] Jaroszewicz S,Simovici DA(2002)使用bonferroni型不等式支持近似。参加:第六届欧洲数据挖掘和知识发现原则会议·Zbl 1020.68691号
[28] Kryszkiewicz M(2001)基于无析取生成器的频繁模式简明表示。参加:IEEE数据挖掘国际会议·Zbl 1048.68809号
[29] Kryszkiewicz M(2005)带否定的频繁模式的广义无析取表示。人工智能实验理论杂志17(1/2):63-82·Zbl 1102.68116号 ·doi:10.1080/09528130512331315882
[30] Li G,Zaki MJ(2012)采样最小频繁布尔(DNF)模式。参加:第18届ACM SIGKDD知识发现和数据挖掘国际会议
[31] Loekito E,Bailey J(2006)使用零抑制二进制决策图快速挖掘高维表达对比度模式。参加:ACM SIGKDD知识发现和数据挖掘国际会议
[32] Mannila H,Toivonen H(1996)频繁集和压缩表示的多重使用。参加:知识发现和数据挖掘国际会议
[33] Mitchell T(1982)作为搜索的泛化。艺术智能18:203-226·doi:10.1016/0004-3702(82)90040-6
[34] Nanavati A,Chitrapura K,Joshi S,Krishnapuram R(2001)关联规则挖掘:挖掘广义析取关联规则。参加:ACM信息和知识管理国际会议
[35] Ramakrishnan N、Kumar D、Mishra B、Potts M、Helm R(2004年8月)《翻转CARTwheels:挖掘重新描述的交替算法》。参加:ACM SIGKDD知识发现和数据挖掘国际会议
[36] Rubinstein RY,Kroese DK(2008)《模拟和蒙特卡罗方法》,第2版。纽约威利·兹比尔1147.68831
[37] Savasere A、Omiecinski E、Navathe S(1998)在大型客户交易数据库中挖掘强烈的负面关联。参加:IEEE国际数据工程会议
[38] Shima Y,Mitsuishi S,Hirata K,Harao M(2004)提取最小和闭单调dnf公式。在:国际发现科学会议·Zbl 1110.68466号
[39] Stumme G,Taouil R,Bastide Y,Pasquier N,Lakhal L(2002)用泰坦尼克计算冰山概念格。数据知识工程42(2):189-222·Zbl 0996.68046号 ·doi:10.1016/S0169-023X(02)00057-5
[40] Veloso A、Meira W、Zaki MJ(2006)《惰性联想分类》。参加:IEEE数据挖掘国际会议
[41] Vimieiro R,Moscato P(2012)《使用titanicor挖掘析取最小发电机》。专家系统应用39(9):8228-8238·doi:10.1016/j.eswa.2012.01.141
[42] Vimieiro R,Moscato P(2014)披露:一种高效的深度优先自顶向下算法,用于挖掘高维数据中的析取闭合项集。通知科学280:171-187·Zbl 1355.68235号 ·doi:10.1016/j.ins.2014.04.044
[43] Vreeken J,Van Leeuwen M,Siebes A(2011)Krimp:压缩的挖掘项集。数据最小知识发现23(1):169-214·Zbl 1235.68071号 ·doi:10.1007/s10618-010-0202-x
[44] Wu X,Zhang C,Zhang-S(2004)正关联规则和负关联规则的高效挖掘。ACM事务通知系统22(3):381-405·doi:10.1145/1010614.1010616
[45] 袁X,巴克尔斯BP,袁Z,张J(2002)挖掘负关联规则。参加:第七届计算机与通信国际研讨会
[46] Zaki M,Ramakrishnan N(2005)使用重新描述挖掘进行集合推理。参加:ACM SIGKDD知识发现和数据挖掘国际会议
[47] Zaki MJ(2000年8月)生成非冗余关联规则。参加:第六届ACM SIGKDD知识发现和数据挖掘国际会议
[48] Zaki MJ,Xiao C-J(2005)挖掘闭项集及其格结构的高效算法。IEEE Trans Knowl Data Eng 17(4):462-478·doi:10.1109/TKDE.2005.60
[49] Zaki MJ,Ramakrishnan N,Zhao L(2010)挖掘频繁布尔表达式:在基因表达和调控建模中的应用。Int J Knowl Discov Bioninform 1(3):68-96生物学中复杂结构挖掘专刊·doi:10.4018/jkdb.2010070105
[50] Zhao L,Zaki MJ,Ramakrishnan N(2006)Blosom:挖掘任意布尔表达式的框架。参加:第十二届ACM SIGKDD知识发现和数据挖掘国际会议
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。