文件Zbl 1411.68114-zbMATH Open

抽样频繁和最小布尔模式：分类中的理论和应用。（英语） Zbl 1411.68114号

最小已知数据。迪斯科。 30，第1期，181-225（2016）.

摘要：我们解决了从分类数据集挖掘最简单布尔模式的难题。我们开发了有效的抽样方法来提取析取范式（DNF）中最小布尔模式的代表子集，而不是完全枚举，这对于这类模式来说通常是不可行的。我们提出了一种新的最小DNF表达式的理论表征，它允许我们有效地修剪模式搜索空间。我们的方法可以提供最小DNF模式的近似均匀样本。我们进行了一系列实验来证明我们的采样方法的有效性。我们还表明，最小DNF模式为分类提供了有效的特征。

引用于2文件

MSC公司：

68T05型	人工智能中的学习和自适应系统
62H30型	分类和区分；聚类分析（统计方面）

关键词：

频繁模式挖掘；最小发电机；最小布尔表达式；模式抽样；分类；析取模式；马尔科夫蒙特卡洛

软件：

伦敦银行支持向量机；泰坦尼克号；爆发；克里姆；UCI-毫升

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	阿格拉瓦尔，R。；Mannila，H。；Srikant，R。；香薰酮，H。；AI的Verkamo；Fayyad，U.（编辑）；等。，关联规则的快速发现，307-328（1996），Menlo Park
[2]	Akutsu T、Kuhara S、Maruyama O、Miyano S（1998）通过战略性基因破坏和基因过度表达识别基因调控网络。In:ACM-SIAM离散算法研讨会·Zbl 0930.68049号
[3]	Antonie M-L，Zaiane O（2004）挖掘正关联规则和负关联规则：一种受限规则的方法。参加：欧洲数据库知识发现原则与实践会议
[4]	Bastide Y，Taouil R，Pasquier N，Stumme G，Lakhal L（2000）利用计数推理挖掘频繁模式。SIGKDD探索2（2）：66-75·数字对象标识代码：10.1145/380995.381017
[5]	Bayardo RJ，Agrawal R（1999）挖掘最有趣的规则。参加：ACM SIGKDD知识发现和数据挖掘国际会议
[6]	Boley M，Gärtner T，Grosskreutz H，Fraunhofer I（2010）计数和无阈值局部模式挖掘的形式概念采样。In:SIAM数据挖掘会议
[7]	Boley M，Grosskreutz H（2009）稠密数据中频繁集数量的近似。知情通知系统21（1）：65-89·doi:10.1007/s10115-009-0212-4
[8]	Boley M，Lucchese C，Paurat D，Gärtner T（2011）通过有效的两步随机程序直接进行局部模式采样。参加：ACM SIGKDD知识发现和数据挖掘国际会议
[9]	Bshouty N（1995）通过单调理论精确学习布尔函数。通知计算123（1）：146-153·Zbl 1096.68634号 ·doi:10.1006/inco.1995.1164
[10]	Calders T，Goethals B（2003）频繁集的最小k-free表示。参加：欧洲数据库知识发现原则与实践会议·Zbl 1020.68566号
[11]	Calders T，Goethals B（2005）《快速包容-排斥》。In:关于归纳数据库中知识发现的ECML-PKDD研讨会论文集·Zbl 1178.68190号
[12]	Chang C，Lin C（2011）Libsvm：支持向量机库。ACM跨智能系统技术2（3）：1-39·数字对象标识代码：10.1145/1961189.1961199
[13]	Chaoji V，Hasan MA，Salem S，Besson J，Zaki MJ（2008）ORIGAMI：挖掘代表性正交图模式的一种新的有效方法。统计分析数据最小值1（2）：67-84·Zbl 07260185号 ·doi:10.1002/2004年3月10日
[14]	Cowles M，Carlin B（1996），马尔可夫链蒙特卡罗收敛诊断：比较综述。《美国统计杂志》91（434）：883-904·Zbl 0869.62066号 ·doi:10.1080/01621459.1996.10476956
[15]	Curk T、Demsar J、Xu Q、Leban G、Petrovic U、Bratko I、Shaulsky G、Zupan B（2005）《微阵列数据挖掘与可视化编程》。生物信息学21（3）：396-398·doi:10.1093/bioinformatics/bth474
[16]	Dong G，Jiang C，Pei J，Li J，Wong L（2005）挖掘形式概念最小生成元的简洁系统。In：高级应用的国际会议数据库系统
[17]	Fayyad U，Irani K（1993）用于分类学习的连续值属性的多间隔离散化。附：第十三届国际人工智能联合会议记录
[18]	Frank A，Asuncion A（2010）UCI机器学习库。加州大学欧文分校信息与计算机科学学院(网址：http://archive.ics.uci.edu/ml)
[19]	Ganter B，Wille R（1999）形式概念分析：数学基础。柏林施普林格·Zbl 0909.06001号 ·doi:10.1007/978-3-642-59830-2
[20]	Goethals B，Zaki MJ（2004）《频繁项集挖掘实现的进展：FIMI’03报告》。SIGKDD勘探6（1）：109-117·doi:10.145/1007730.1007744
[21]	Gunopulos D、Khardon R、Mannila H、Saluja S、Toivonen H、Sharma R（2003）《发现所有最具体的句子》。ACM Trans数据库系统28（2）：140-174·doi:10.1145/777943.777945
[22]	Gunoplos D，Mannila H，Saluja S（1997）通过随机算法发现所有最具体的句子。参加：第六届数据库理论国际会议
[23]	Hamrouni T，Yahia S Ben，Mephu Nguifo E（2009）《扫荡析取搜索空间，挖掘频繁项集的新精确简明表示法》。数据与知识工程68（10）：1091-1111·doi:10.1016/j.datak.2009.05.001
[24]	Hasan MA，Zaki MJ（2009）麝香：k最大模式的均匀采样。参加：第九届SIAM数据挖掘国际会议
[25]	Hasan MA，Zaki MJ（2009）图形模式的输出空间采样。程序VLDB Endow 2（1）：730-741·doi:10.14778/1687627.1687710
[26]	Holte RC、Acker LE、Porter BW（1989），概念学习和小析取问题。附：第十一届国际人工智能联合会议记录·Zbl 0709.68057号
[27]	Jaroszewicz S，Simovici DA（2002）使用bonferroni型不等式支持近似。参加：第六届欧洲数据挖掘和知识发现原则会议·Zbl 1020.68691号
[28]	Kryszkiewicz M（2001）基于无析取生成器的频繁模式简明表示。参加：IEEE数据挖掘国际会议·Zbl 1048.68809号
[29]	Kryszkiewicz M（2005）带否定的频繁模式的广义无析取表示。人工智能实验理论杂志17（1/2）：63-82·Zbl 1102.68116号 ·doi:10.1080/09528130512331315882
[30]	Li G，Zaki MJ（2012）采样最小频繁布尔（DNF）模式。参加：第18届ACM SIGKDD知识发现和数据挖掘国际会议
[31]	Loekito E，Bailey J（2006）使用零抑制二进制决策图快速挖掘高维表达对比度模式。参加：ACM SIGKDD知识发现和数据挖掘国际会议
[32]	Mannila H，Toivonen H（1996）频繁集和压缩表示的多重使用。参加：知识发现和数据挖掘国际会议
[33]	Mitchell T（1982）作为搜索的泛化。艺术智能18:203-226·doi:10.1016/0004-3702（82）90040-6
[34]	Nanavati A，Chitrapura K，Joshi S，Krishnapuram R（2001）关联规则挖掘：挖掘广义析取关联规则。参加：ACM信息和知识管理国际会议
[35]	Ramakrishnan N、Kumar D、Mishra B、Potts M、Helm R（2004年8月）《翻转CARTwheels：挖掘重新描述的交替算法》。参加：ACM SIGKDD知识发现和数据挖掘国际会议
[36]	Rubinstein RY，Kroese DK（2008）《模拟和蒙特卡罗方法》，第2版。纽约威利·兹比尔1147.68831
[37]	Savasere A、Omiecinski E、Navathe S（1998）在大型客户交易数据库中挖掘强烈的负面关联。参加：IEEE国际数据工程会议
[38]	Shima Y，Mitsuishi S，Hirata K，Harao M（2004）提取最小和闭单调dnf公式。在：国际发现科学会议·Zbl 1110.68466号
[39]	Stumme G，Taouil R，Bastide Y，Pasquier N，Lakhal L（2002）用泰坦尼克计算冰山概念格。数据知识工程42（2）：189-222·Zbl 0996.68046号 ·doi:10.1016/S0169-023X（02）00057-5
[40]	Veloso A、Meira W、Zaki MJ（2006）《惰性联想分类》。参加：IEEE数据挖掘国际会议
[41]	Vimieiro R，Moscato P（2012）《使用titanicor挖掘析取最小发电机》。专家系统应用39（9）：8228-8238·doi:10.1016/j.eswa.2012.01.141
[42]	Vimieiro R，Moscato P（2014）披露：一种高效的深度优先自顶向下算法，用于挖掘高维数据中的析取闭合项集。通知科学280:171-187·Zbl 1355.68235号 ·doi:10.1016/j.ins.2014.04.044
[43]	Vreeken J，Van Leeuwen M，Siebes A（2011）Krimp：压缩的挖掘项集。数据最小知识发现23（1）：169-214·Zbl 1235.68071号 ·doi:10.1007/s10618-010-0202-x
[44]	Wu X，Zhang C，Zhang-S（2004）正关联规则和负关联规则的高效挖掘。ACM事务通知系统22（3）：381-405·doi:10.1145/1010614.1010616
[45]	袁X，巴克尔斯BP，袁Z，张J（2002）挖掘负关联规则。参加：第七届计算机与通信国际研讨会
[46]	Zaki M，Ramakrishnan N（2005）使用重新描述挖掘进行集合推理。参加：ACM SIGKDD知识发现和数据挖掘国际会议
[47]	Zaki MJ（2000年8月）生成非冗余关联规则。参加：第六届ACM SIGKDD知识发现和数据挖掘国际会议
[48]	Zaki MJ，Xiao C-J（2005）挖掘闭项集及其格结构的高效算法。IEEE Trans Knowl Data Eng 17（4）：462-478·doi:10.1109/TKDE.2005.60
[49]	Zaki MJ，Ramakrishnan N，Zhao L（2010）挖掘频繁布尔表达式：在基因表达和调控建模中的应用。Int J Knowl Discov Bioninform 1（3）：68-96生物学中复杂结构挖掘专刊·doi:10.4018/jkdb.2010070105
[50]	Zhao L，Zaki MJ，Ramakrishnan N（2006）Blosom:挖掘任意布尔表达式的框架。参加：第十二届ACM SIGKDD知识发现和数据挖掘国际会议

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

抽样频繁和最小布尔模式：分类中的理论和应用。（英语） Zbl 1411.68114号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

抽样频繁和最小布尔模式：分类中的理论和应用。 （英语） Zbl 1411.68114号

MSC公司：

关键词：

软件：

参考文献：

抽样频繁和最小布尔模式：分类中的理论和应用。（英语） Zbl 1411.68114号