×

元关系中的封闭和容错模式。 (英语) Zbl 1267.68176号

摘要:二元关系挖掘已经被广泛研究。尽管如此,许多有趣的0/1数据自然以与(n geq 3)的元关系出现。一个及时的挑战是将局部模式提取(例如闭合模式挖掘)扩展到此类上下文。当考虑更高的算术时,微弱噪声越来越影响提取模式的质量。我们通过新的原语约束和设计有效的算法来提取每个解决方案模式,研究了容错模式的声明性规范。它利用最先进的Data-Peeler算法的枚举原理进行元关系挖掘。有效实施容错关键取决于增量计算数据部分信息的创新策略。我们的原型在合成数据集和实际数据集上进行了测试。即使在有噪声的三元或四元关系的情况下,例如在动态网络的模式发现上下文中,它也会返回相关的模式集合。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68瓦99 计算机科学中的算法
68米15 网络和计算机系统的可靠性、测试和容错

软件:

木匠
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Avis D,Fukuda K(1996)《枚举的反向搜索》。离散应用数学65(1-3):21–46·Zbl 0854.68070号 ·doi:10.1016/0166-218X(95)00026-N
[2] Bayardo RJ、Goethals B、Zaki MJ(eds)(2004)In:FIMI’04,IEEE ICDM频繁项集挖掘实施研讨会会议记录,英国布莱顿,2004年11月1日,CEUR研讨会会议记录第126卷,CEUR-WS.org
[3] Besson J,Robardet C,Boulicaut JF,Rome S(2005)基于约束的形式概念挖掘及其在微阵列数据分析中的应用。智能数据分析9(1):59–82
[4] Besson J,Robardet C,Boulicaut JF(2006)挖掘一种新的容错模式类型作为形式概念发现的替代方案。In:ICCS’06:第14届概念结构国际会议记录,Springer,第144-157页·Zbl 1194.68219号
[5] Bonchi F,Lucchese C(2004)关于封闭约束频繁模式挖掘。In:ICDM’04:第四届IEEE数据挖掘国际会议论文集,IEEE计算机学会,第35-42页
[6] Bonchi F,Lucchese C(2005)在频繁模式挖掘中施加更严格的约束。摘自:PAKDD 05第九届亚太知识发现和数据挖掘会议记录。斯普林格,第114-124页
[7] Boulicaut JF,Bykowski A(2000)《频繁闭包作为二进制数据挖掘的简明表示》。收录于:PAKDD'00:第四届亚太知识发现和数据挖掘会议记录,Springer,第62-73页
[8] Calders T,Rigotti C,Boulicaut JF(2005)关于频繁集的凝聚表示的调查。In:Constraint-Based Mining and Inductive Databases,Springer,计算机科学课堂讲稿,第3848卷,第64-80页·Zbl 1172.68446号
[9] Cerf L,Besson J,Robardet C,Boulicaut JF(2009a)闭合模式满足n元关系。ACM变速器知识发现数据3(1):1–36·数字对象标识代码:10.1145/1497577.1497580
[10] Cerf L,Mougel PN,Boulicaut JF(2009b)用ALPHA分层聚集局部模式。摘自:CIKM’09:第18届信息和知识管理国际会议记录,ACM出版社,第1753-1756页
[11] Cerf L,Nguyen TBN,Boulicaut JF(2009c)发现动态网络中的相关交叉图团。摘自:ISMIS’09:第18届智能系统方法学国际研讨会论文集,Springer,第513–522页
[12] Cerf L,Nguyen TBN,Boulicaut JF(2010)《动态网络中的约束交叉图团挖掘》。归纳数据库和基于约束的数据挖掘,Springer,199-228页·Zbl 1206.68267号
[13] Cheng H,Yu PS,Han J(2008)随机噪声下的近似频繁项集挖掘。收录:Maimon O,Rokach L(编辑)用于知识发现和数据挖掘的软计算。施普林格,第363–389页·Zbl 1140.68426号
[14] Gallo A,Bie TD,Cristianini N(2007)MINI:挖掘信息性非冗余项集。摘自:PKDD’07:第11届欧洲数据库知识发现原则与实践会议记录,Springer,第438–445页
[15] Gallo A、Mammone A、Bie TD、Turchi M、Cristianini N(2009)《从频繁项目集到信息模式》。技术代表123936,英国布里斯托尔大学
[16] Ganter,B,Stumme,G,Wille,R(eds)(2005)计算机科学中的形式概念分析,基础和应用,课堂讲稿。柏林施普林格
[17] Ganti V,Gehrke J,Ramakrishnan R(1999)CACTUS:使用摘要聚类分类数据。In:KDD’99:第五届SIGKDD知识发现和数据挖掘国际会议记录,ACM出版社,第73-83页
[18] Garriga GC、Kralj P、Lavrac N(2008)标记数据的闭集。J Mach学习研究9:559–580·Zbl 1225.68179号
[19] Georgii E,Tsuda K,Schölkopf B(2009)实值张量中的多向集枚举。在:DMMT’09:第二届ACM SIGKDD使用矩阵和张量进行数据挖掘研讨会论文集,ACM出版社,第32-41页
[20] Georgii E,Tsuda K,Schölkopf B(2011)权重张量中的多向集枚举。马赫学习82(2):123–155·兹伯利1237.68144 ·doi:10.1007/s10994-010-5210-y
[21] Goethals B(2010)频繁集挖掘。收录:Maimon O,Rokach L(编辑)数据挖掘和知识发现手册。柏林施普林格,第321-338页
[22] Gupta R,Fang G,Field B,Steinbach M,Kumar V(2008)近似频繁模式挖掘算法的定量评估。收录于:KDD’08:第14届SIGKDD知识发现和数据挖掘国际会议论文集,ACM出版社,第301-309页
[23] Jaschke R,Hotho A,Schmitz C,Ganter B,Stumme G(2006)Trias:冰山三参数挖掘算法。In:ICDM’06:第六届IEEE数据挖掘国际会议论文集,IEEE计算机学会,第907–911页
[24] Ji L,Tan KL,Tung AKH(2006)挖掘三维数据集中的频繁闭合立方体。摘自:2006年VLDB:第32届超大数据库国际会议记录,VLDB捐赠,第811-822页
[25] 姜德培J(2009)挖掘频繁交叉图准流体。ACM变速器知识发现数据2(4):1–42·数字对象标识代码:10.1145/1460797.1460799
[26] Koh JL,Yo PW(2005)基于位向量表示挖掘容错频繁模式的有效方法。收录:DASFAA’05:第十届高级应用数据库系统国际会议记录,Springer,第568–575页
[27] Liu J,Paulsen S,Sun X,Wang W,Nobel AB,Prins J(2006),噪声存在下的近似频繁项集挖掘:算法与分析。摘自:SDM’06:第六届SIAM国际数据挖掘会议记录,SIAM,第405-416页
[28] Pan F,Cong G,Tung AK,Yang J,Zaki MJ(2003)CARPENTER:在长生物数据集中寻找闭合模式。收录于:KDD'03:第九届ACM SIGKDD知识发现和数据挖掘国际会议记录,ACM出版社,第637-642页
[29] Pasquier N,Bastide Y,Taouil R,Lakhal L(1999)使用闭项集格高效挖掘关联规则。信息系统24(1):25–46·Zbl 0983.68511号 ·doi:10.1016/S0306-4379(99)00003-4
[30] Pei J,Tung AKH,Han J(2001)容错频繁模式挖掘:问题与挑战。摘自:DMKD'01:ACM SIGMOD第六届数据挖掘和知识发现研究问题研讨会会议记录,ACM出版社
[31] Poernomo AK,Gopalkrishnan V(2007)挖掘事务数据库中频繁容错模式的统计信息。在:ICDM’07:第七届IEEE国际数据挖掘会议论文集,IEEE计算机学会,第272–281页
[32] Poernomo AK,Gopalkrishnan V(2009a)挖掘感兴趣项集的部分支持的高效计算。摘自:SDM’09:第九届SIAM国际数据挖掘会议记录,SIAM,第1014–1025页
[33] Poernomo AK,Gopalkrishnan V(2009b),面向比例容错频繁项集的高效挖掘。收录:KDD’09:第15届ACM SIGKDD知识发现和数据挖掘国际会议记录,ACM出版社,第697–706页
[34] Seppänen JK,Mannila H(2004)《密集项目集》。In:KDD’04:第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM出版社,第683–688页
[35] Sim K,Liu G,Gopalkrishnan V,Li J(2011)《通过交叉图准现金的财务比率案例研究》。《信息科学》181:201–216
[36] Stumme G,Taouil R,Bastide Y,Pasquier N,Lakhal L(2002)用泰坦尼克计算冰山概念格。数据知识工程42(2):189–222·兹比尔0996.68046 ·doi:10.1016/S0169-023X(02)00057-5
[37] Uno T(2007)枚举伪团的有效算法。摘自:ISAAC’07:第18届国际算法与计算研讨会论文集,Springer,402-414页·Zbl 1193.05155号
[38] Yang C,Fayyad U,Bradley PS(2000)高效发现高维容错频繁项集。技术代表2000-20,Microsoft Research,Microsoft Corporation,One Microsoft Way,Redmond,WA 98052
[39] Zaki MJ(2004)挖掘非冗余关联规则。数据最小知识发现9(3):223–248·doi:10.1023/B:DAMI.0000040429.96086.c7
[40] Zaki MJ,Peters M,Assent I,Seidl T(2007)Clicks:一种在分类数据集中挖掘子空间簇的有效算法。数据知识工程60(1):51–70·doi:10.1016/j.datak.2006.01.005
[41] Zeng Z,Wang J,Zhou L,Karypis G(2007)从大型稠密图形数据库中进行核外相干闭合准液化挖掘。ACM Trans数据库系统32(2):13–42·doi:10.1145/1242524.1242530
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。