×

模式挖掘的最小描述长度原则:综述。 (英语) Zbl 1509.68240号

摘要:挖掘模式是数据分析的核心任务,除了高效枚举问题外,模式的选择也是一个重大挑战。最小描述长度(MDL)原则是一种基于信息论的模型选择方法,已应用于模式挖掘,目的是获得紧凑的高质量模式集。在概述了信息理论和编码的相关概念之后,我们回顾了基于MDL的方法,用于从各种类型的数据中挖掘不同类型的模式。最后,我们就有关这些方法的一些问题展开讨论。

MSC公司:

68T09号 数据分析和大数据的计算方面
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
68吨10 模式识别、语音识别
68-02 与计算机科学有关的研究展览会(专著、调查文章)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿德里安斯,F。;Lijffijt,J。;De Bie,T.,《连接树木和森林的主观趣味》,Data Min Knowl Disc,33,4,1088-1124(2019)·Zbl 1458.68155号 ·doi:10.1007/s10618-019-00627-1
[2] Agrawal R,Srikant R(1994)挖掘关联规则的快速算法。收录:第20届超大数据库国际会议论文集,VLDB’94,Morgan Kaufmann,第487-499页
[3] 阿格拉瓦尔,R。;伊米林斯基,T。;Swami,A.,挖掘大型数据库中项目集之间的关联规则,ACM SIGMOD Rec,22,2,207-216(1993)·doi:10.145/170036.170072
[4] Akoglu L,Tong H,Meeder B,Faloutsos C(2012a)PICS:大型属性图中内聚子群的无参数识别。摘自:2012年SIAM国际数据挖掘会议记录,SDM’12,SIAM,第439-450页,doi:10.1137/1.9781611972825.38
[5] Akoglu L,Tong H,Vreeken J,Faloutsos C(2012b)分类数据中快速可靠的异常检测。摘自:《第21届ACM信息和知识管理国际会议论文集》,CIKM'12,ACM,第415-424页,doi:10.1145/2396761.2396816
[6] Akoglu L、Chau DH、Vreeken J、Tatti N、Tong H、Faloutsos C(2013)《大型图中标记节点的连接路径挖掘》。在:2013年SIAM国际数据挖掘会议记录,SDM’13,SIAM,第37-45页,doi:10.1137/1.9781611972832.5
[7] 欧共体安德森;Novembre,J.,《利用最小描述长度原理寻找单倍型块边界》,《美国人类遗传学杂志》,73,2,336-354(2003)·doi:10.1086/377106
[8] Aoga JOR,Guns T,Nijssen S,Schaus P(2018)使用最小描述长度原则寻找概率规则列表。摘自:《发现科学国际会议论文集》,DS’18,Springer,第66-82页,doi:10.1007/978-3-030-01771-2-5
[9] Araujo M、Günnemann S、Mateos G、Faloutsos C(2014a)《超越区块:双曲社区检测》。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’14,Springer,第50-65页,doi:10.1007/978-3662-44848-9_4
[10] Araujo M、Papadimitriou S、Günnemann S、Faloutsos C、Basu P、Swami A、Papalexakis EE、Koutra D(2014b)Com2:快速自动发现时间(“科姆”)社区。摘自:《第18届亚太地区知识发现和数据挖掘进展会议论文集》,PAKDD’14,Springer,第271-283页,doi:10.1007/978-3-319-06605-9_23
[11] Araujo,M。;Günnemann,S。;Papadimitriou,S。;Faloutsos,C。;巴苏,P。;斯瓦米,A。;Papalexakis,EE;库特拉,D.,《在时间和标记图中发现“彗星”群落》(COM^2),《知识信息系统》,46,3,657-677(2016)·doi:10.1007/s10115-015-0847-2
[12] Asadi B,Varadharajan V(2019a)基于MDL的事务数据集分类器,用于恶意软件检测。arXiv公司:1910.03751
[13] Asadi B,Varadharajan V(2019b)面向稳健分类器:一种基于MDL的生成对抗性示例的方法。arXiv公司:1912.05945
[14] Bariatti F(2021)使用最小描述长度原则挖掘可处理的图形模式集。雷恩大学博士论文,https://hal.inia.fr/tel-03523742
[15] Bariatti F,Cellier P,FerréS(2020a)GraphMDL:基于最小描述长度的图形模式选择。摘自:第18届智能数据分析进展国际研讨会论文集,IDA’20,Springer,第54-66页,doi:10.1007/978-3-030-44584-3_5
[16] Bariatti F,Cellier P,FerréS(2020b)GraphMDL可视化工具:图形模式的交互式可视化。图嵌入和挖掘研讨会论文集创业板@ECML/PKDD'20年,https://hal.inria.fr/hal-03142207
[17] Bariatti F,Cellier P,FerréS(2021)GraphMDL+:交织图模式的生成和基于MDL的选择。摘自:第36届ACM应用计算年会论文集,SAC’21,ACM,第355-363页,doi:10.1145/3412841.3441917
[18] Bastide Y,Pasquier N,Taouil R,Stumme G,Lakhal L(2000)使用频繁闭项集挖掘最小非冗余关联规则。摘自:《第一届国际计算逻辑会议论文集》,CL'00,Springer,第972-986页·Zbl 0983.68511号
[19] Begum N,Hu B,Raktanmanon T,Keogh E(2013)半监督时间序列分类的基于最小描述长度的停止准则。摘自:第14届IEEE信息重用集成国际会议论文集,IRI'13,IEEE计算机学会,第333-340页,doi:10.1109/IRI.2013.6642490
[20] Begum N,Hu B,Rakthanmanon T,Keogh E(2014)半监督时间序列分类的最小描述长度技术。可重用系统集成第171-192页,doi:10.1007/978-3-319-04717-1_8
[21] Belth C,Zheng X,Vreeken J,Koutra D(2020)知识图中什么是正常的,什么是奇怪的,什么缺少:通过归纳总结的统一表征。收录:《网络会议论文集》,WWW’20,ACM,第1115-1126页,doi:10.1145/3366423.3380189
[22] Bertens R(2017)《信息洞察力:从抽象到异常》。荷兰乌得勒支大学博士论文
[23] Bertens R,Siebes A(2014)《地震数据特征描述》。摘自:2014年SIAM国际数据挖掘会议记录,SDM’14,SIAM,第884-892页,doi:10.1137/1.9781611973440.101
[24] Bertens R、Vreeken J、Siebes A(2015)《美丽与大脑:检测异常模式的共现》。arXiv:1512.07048
[25] Bertens R,Vreeken J,Siebes A(2016)保持简短:用多元模式总结复杂事件序列。摘自:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,2016年,ACM
[26] Bertens R、Vreeken J、Siebes A(2017)高效发现意外模式。摘自:2017年SIAM国际数据挖掘会议记录,SDM’17,SIAM,第126-134页,doi:10.1137/1.9781611974973.15
[27] Bhattacharyya A,Vreeken J(2017)高效总结了具有丰富交错模式的事件序列。2017年SIAM数据挖掘国际会议论文集,SDM’17,SIAM
[28] 布兰科,F。;Calatayud,J。;Martín-Perea,DM;多明戈,理学硕士;梅内德斯,I。;穆勒,J。;Fernández,MH;Cantalapiedra,JL,哺乳动物群落在进化时间尺度上的标点生态平衡,《科学》,372,6539,300-303(2021)·doi:10.1126/science.abd5110
[29] Bloem P(2013)基于压缩的图形数据推理。摘自:第22届比利时-荷兰机器学习年会论文集,BENELEARN’13
[30] Bloem P,de Rooij S(2018)图分析MDL假设测试教程。arXiv:1810.13163
[31] 布隆,P。;de Rooij,S.,使用压缩的大规模网络基序分析,Data Min Knowl Disc,34,5,1421-1453(2020)·Zbl 1455.68134号 ·doi:10.1007/s10618-020-00691-y
[32] Bobed C,Maillot P,Cellier P,FerréS(2019)RDF图结构演化的数据驱动评估。语义Web-互操作性、可用性、适用性
[33] Bohlin L、Edler D、Lancichinetti A、Rosvall M(2014)《利用地图方程框架进行网络的社区检测和可视化》。摘自:《学术测量》(ed)Ding Y、Rousseau R、Wolfram D.Impact、Methods and Practice,Springer International Publishing,第3-34页
[34] Boley M,Lucchese C,Paurat D,Gärtner T(2011)通过有效的两步随机程序进行直接局部模式采样。收录:第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’11,ACM,第582-590页,doi:10.1145/2020408.2020500
[35] Boley M、Mampaey M、Kang B、Tokmakov P、Wrobel S(2013)一键式挖掘:通过内隐偏好和性能学习进行交互式局部模式发现。在:交互式数据探索和分析研讨会论文集,IDEA@KDD'13,ACM,第27-35页,doi:10.145/2501511.2501517
[36] Bonchi F、van Leeuwen M、Ukkonen A(2011),使用压缩表征不确定数据。摘自:2011年SIAM国际数据挖掘会议记录,SDM’11,SIAM,第534-545页
[37] Bourand E,Galárraga L,Galbrun E,Fromont E,Termier A(2021a)发现长序列中有用的序列规则紧集。收录:2021年IEEE第33届人工智能工具国际会议论文集,ICTAI’21,IEEE计算机学会,第1295-1299页,doi:10.1109/ICTAI52525.2021.00204
[38] Bourand E,Galárraga L,Galbrun E,Fromont E,Termier A(2021b)发现长序列中有用的紧序列规则集。arXiv:2109.07519
[39] Budhathoki K,Vreeken J(2015)差异和规范——描述数据库之间的相似性和差异。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’15,Springer,第9285卷,第206-223页,doi:10.1007/978-3319-23525-7_13
[40] Budhathoki K,Vreeken J(2017a)压缩相关性。摘自:2017年SIAM国际数据挖掘会议记录,SDM’17,SIAM,第525-533页,doi:10.1137/1.9781611974973.59
[41] Budhathoki K,Vreeken J(2017b)离散数据因果推断的MDL。摘自:第17届IEEE国际数据挖掘会议记录,ICDM’17,IEEE计算机学会,第751-756页,doi:10.1109/ICDM.2017.87
[42] Calatayud,J。;贝尔纳多·马德里,R。;纽曼,M。;罗哈斯,A。;Rosvall,M.,《探索解决方案环境实现更可靠的网络社区检测》,Phys Rev E,100,5(2019)·doi:10.1103/PhysRevE.100.052308
[43] Chakrabarti D(2004)AutoPart:无参数图分割和离群值检测。摘自:《欧洲数据库知识发现会议论文集》,PKDD'04,Springer,第112-124页,doi:10.1007/978-3-540-30116-5_13
[44] Chakrabarti D、Papadimitriou S、Modha DS、Faloutsos C(2004)《全自动交叉关联》。摘自:第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’04,ACM,第79-88页,doi:10.1145/1014052.1014064
[45] Chen L,Amiri SE,Prakash BA(2018)数据序列的自动分段。附:第三十二届AAAI人工智能会议记录,AAAI’18,人工智能促进协会
[46] 厨师,DJ;霍尔德,LB,《使用最小描述长度和背景知识发现子结构》,J Artifi Intell Res,1,1,231-255(1994)·doi:10.1613/jair.43
[47] Coupette C,Vreeken J(2021)图形相似性描述:这些图形的相似性如何?摘自:第27届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’21,ACM
[48] 封面,TM;JA Thomas,《信息理论的要素》(2012),美国:John Wiley&Sons,美国·Zbl 1140.94001号
[49] Cüppers J,Vreeken J(2020),等待吧……挖掘具有可靠预测延迟的序列模式。摘自:第20届IEEE数据挖掘国际会议论文集,ICDM’20,IEEE计算机学会
[50] Das SK,Cook DJ(2004)基于代理的智能家居中的健康监测。摘自:《智能家居与健康远程通信国际会议论文集》,ICOST'04,IOS出版社,第3-14页
[51] De Bie T,Kontonasios KN,Spyropoulou E(2010)挖掘有趣模式集的框架。SIGKDD探索(和ACM SIGKD有用模式研讨会会议记录,UP'10)12(2):92-100
[52] 德多梅尼科,M。;Lancichinetti,A。;阿里纳斯,A。;Rosvall,M.,《识别多层网络上的模块化流揭示了互连系统中高度重叠的组织》,Phys Rev X,5,1,11027(2015)·doi:10.1103/PhysRevX.5.011027
[53] De Raedt L,Zimmermann A(2007)基于约束的模式集挖掘。摘自:2007年SIAM国际数据挖掘会议记录,SDM’07,SIAM,第237-248页,doi:10.1137/1.9781611972771.22
[54] Edler,D。;波林,L。;Rosvall,M.,《使用infomap映射内存和多层网络中的高阶网络流》,《算法》,10,4,112(2017)·Zbl 1462.90027号 ·doi:10.3390/a10040112
[55] Edler,D。;Guedes,T。;Zizka,A。;罗斯瓦尔,M。;Antonelli,A.,《信息地图生物区域:物种分布生物地理区域的交互式制图》,《系统生物学》,66,2,197-204(2017)·doi:10.1093/sysbio/syw087
[56] 埃蒙斯,S。;Mucha,PJ,Map equation with metadata:改变属性在社区检测中的作用,Phys Rev E,100,2(2019)·doi:10.1103/PhysRevE.100.022301
[57] Evans S,Saulnier G,Bush SF(2003)估计字符串kolmogorov复杂度和算法最小充分统计量的新通用两部分代码。摘自:DIMACS复杂性和推断研讨会论文集
[58] Evans S、Markham TS、Torres A、Kourtidis A、Conklin D(2006)核苷酸序列分析的改进最小描述长度学习算法。收录于:2006年第四十届亚洲信号、系统和计算机会议记录,ACSSC’06,第1843-1850页,doi:10.1109/ACSSC.2006.355081
[59] 埃文斯,S。;Kourtidis,A。;马卡姆,TS;Miller,J。;康克林,DS;Torres,AS,使用MDLcompress对乳腺癌相关基因进行微RNA靶点检测和分析,EURASIP J Bioinf Syst Biol,143670(2007)·doi:10.186/1687-4153-2007-43670
[60] Faas M,van Leeuwen M(2020)《Vouw:使用MDL原理的几何模式挖掘》。摘自:第18届智能数据分析进展国际研讨会论文集,IDA’20,Springer,第158-170页,doi:10.1007/978-3-030-44584-3_13
[61] Feng J(2015)信息论图形挖掘。德国慕尼黑大学路德维希·马克西米利安博士论文
[62] Feng J,He X,Konte B,Böhm C,Plant C(2012)基于总结的二部图挖掘。在:第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'12,ACM,第1249-1257页,doi:10.145/2339530.2339725
[63] Feng J,He X,Hubig N,Böhm C,Plant C(2013)利用结构原语的基于压缩的图挖掘。摘自:第13届IEEE数据挖掘国际会议论文集,ICDM’13,IEEE计算机学会,第181-190页,doi:10.1109/ICDM.2013.56
[64] Fischer J,Vreeken J(2019)稳健规则集,以及如何找到它们。摘自:《第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,KDD’19,ACM,第38-54页,doi:10.1007/978-3-030-46150-8_3
[65] Fischer J,Vreeken J(2020)发现表达共现性和互斥性的简洁模式集。摘自:第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’19,ACM
[66] Fischer J,Oláh A,Vreeken J(2021)盒子里有什么?用稳健的规则解释神经网络。摘自:第38届国际机器学习会议论文集,ICML’21
[67] Fowkes J,Sutton C(2016)序列模式挖掘的子序列交错模型。摘自:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’16,ACM,第835-844页
[68] Galbrun E、Cellier P、Tatti N、Termier A、Crémilleux B(2018)使用MDL标准挖掘周期模式。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’18,第535-551页
[69] Gallo A,De Bie T,Cristianini N(2007)MINI:挖掘信息性非冗余项集。摘自:《欧洲数据库知识发现会议论文集》,PKDD'07,Springer,第438-445页,doi:10.1007/978-3-540-74976-9_44
[70] Gautras C、Cellier P、van Leeuwen M、Termier A(2020)基于MDL的零售特征发现拓宽。摘自:第18届智能数据分析进展国际研讨会论文集,IDA’20,Springer,第197-209页,doi:10.1007/978-3-030-44584-3_16
[71] Geng,L。;Hamilton,HJ,《数据挖掘的有趣度量:一项调查》,ACM Compute Surv,38,3,9(2006)·数字对象标识代码:10.1145/1132960.1132963
[72] Gionis,A。;Mannila,H。;Mielikäinen,T。;Tsaparas,P.,《通过交换随机化评估数据挖掘结果》,《ACM从数据中发现知识的交易》,第1、3、14页(2007年)·数字对象标识代码:10.1145/1297332.1297338
[73] Goebl S,Tonch A,Böhm C,Plant C(2016)MeGS:使用最小描述长度划分有意义的子图结构。摘自:第16届IEEE数据挖掘国际会议论文集,ICDM’16,IEEE计算机学会,第889-894页,doi:10.1109/ICDM.2016.0108
[74] Greenspan G,Geiger D(2003)单倍型区组变异的基于模型的推断。摘自:第七届计算分子生物学研究国际年会论文集,RECOMB'03,ACM,pp 131-137,doi:10.1145/640075.640092
[75] 格林斯潘,G。;Geiger,D.,基于模型的单倍型块变异推断,《计算机生物学杂志》,11,2,493-504(2004)·doi:10.1089/1066527041410300
[76] Grosse K,Vreeken J(2017)使用连续事件集和本体论总结事件序列。摘自:2017年ECML/PKDD数据挖掘与自然语言处理互动研讨会论文集
[77] Grünwald,PD,最小描述长度原则(2007),马萨诸塞州剑桥:麻省理工学院出版社·doi:10.7551/mitpress/4643.001.0001
[78] 枪,T。;Nijssen,S。;De Raedt,L.,项目集挖掘:约束编程视角,Artif Intell,175,121951-1983(2011)·Zbl 1353.68233号 ·doi:10.1016/j.artint.2011.05.002
[79] 枪支,T。;Nijssen,S。;De Raedt,L.,约束下的k模式集挖掘,IEEE Trans Knowl Data Eng,25,2,402-418(2013)·doi:10.1109/TKDE.2011.204
[80] 西伯利亚州Hämäläinen。;Webb,GI,统计声音模式发现教程,Data Min Knowl Disc(2018)·Zbl 1464.62305号 ·doi:10.1007/s10618-018-0590-x
[81] Hanhijärvi S、Ojala M、Vuokko N、Puolamäki K、Tatti N、Mannila H(2009)告诉我一些我不知道的事情:迭代数据挖掘的随机化策略。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’09,ACM,第379-388页,doi:10.1145/1557019.1557065
[82] He J,Tong H,Papadimitriou S,Eliassi-Rad T,Faloutsos C,Carbonell J(2009)PaCK:k-partite图上的可缩放无参数聚类。摘自:2006年SIAM国际数据挖掘会议记录,SDM’09,SIAM,第1278-1287页
[83] 何X,冯J,C厂(2011)图中信息丰富节点的自动定位。摘自:第11届IEEE国际数据挖掘研讨会会议记录,ICDMW'11,IEEE计算机学会,第941-948页,doi:10.1109/ICDMW.2011.37
[84] He X,Feng J,Konte B,Mai ST,Plant C(2014)分类数据上的相关重叠子空间聚类。收录:第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’14,ACM,第213-222页,doi:10.1145/2623330.2623652
[85] Heierman EO,Cook DJ(2003)通过发现定期发生的设备使用模式来改进家庭自动化。收录于:第三届IEEE数据挖掘国际会议论文集,ICDM’03,IEEE计算机学会,第537-540页,doi:10.1109/ICDM.2003.1250971
[86] Heierman EO、Youngblood GM、Cook DJ(2004)挖掘时间序列以发现有趣的模式。摘自:第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’19,ACM
[87] Heikinheimo H,Siebes A,Vreeken J,Mannila H(2009)低能量集选择。摘自:2009年SIAM国际数据挖掘会议记录,SDM'09,SIAM,第569-580页,doi:10.1137/1.9781611972795.49
[88] Hess S、Piatkowski N、Morik K(2014)《树中的描述性模式》。收录:2014年LWA会议记录(Lernen,Wissen,Adaption)研讨会:KDML,IR,FGWM
[89] Hess,S。;莫里克(Morik,K.)。;Piatkowski,N.,《PRIMPING例程-通过最近交替线性化最小化进行平铺》,《Data Min Knowl Disc》,31,4,1090-1131(2017)·Zbl 1409.68233号 ·doi:10.1007/s10618-017-0508-z
[90] Hinrichs F,Vreeken J(2017)描述序列数据库之间的差异和范数。摘自:2017年ECML/PKDD数据挖掘与自然语言处理互动研讨会论文集
[91] Hu B,Rakthanmanon T,Hao Y,Evans S,Lonardi S,Keogh E(2011)使用MDL发现时间序列的内在基数和维数。摘自:第十一届IEEE国际数据挖掘会议论文集,ICDM’11,IEEE计算机学会,第1086-1091页,doi:10.1109/ICDM.2011.54·Zbl 1403.68189号
[92] Hu B,Rakthanmanon T,Hao Y,Evans S,Lonardi S,Keogh E(2013)使用MDL探索时间序列的内在基数和维数。摘自:Ray Solomonoff第85届纪念会议论文集,算法概率和朋友。贝叶斯预测和人工智能,Springer,第184-197页,doi:10.1007/978-3642-44958-1_14·兹比尔1403.68189
[93] 胡,B。;Rakthanmanon,T。;Hao,Y。;埃文斯,S。;Lonardi,S。;Keogh,E.,使用最小描述长度发现时间序列的内在基数和维数,Data Min Knowl Disc,29,2,358-399(2015)·Zbl 1403.68190号 ·doi:10.1007/s10618-014-0345-2
[94] 易卜拉欣,A。;Sastry,S。;Sastry,PS,《从事件序列中发现压缩连续剧》,《Knowl Inf Syst》,47,2,405-432(2016)·doi:10.1007/s10115-015-0854-3
[95] Jaroszewicz S,Simovici DA(2004)使用贝叶斯网络作为背景知识的频繁项集的有趣性。摘自:第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’04,ACM,第178-186页,doi:10.1145/1014052.1014074
[96] 江M,Faloutsos C,Han J(2016)《CatchTartan:动态多语境行为的表征与总结》。收录:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’16,ACM,第945-954页,doi:10.1145/2939672.29339749
[97] Jonyer,I。;支架,LB;Cook,DJ,基于Mdl的无上下文图文法归纳与应用,国际Artif Intell Tools,13,1,65-79(2004)·doi:10.1142/S0218213004001429
[98] Kameya Y(2011)通过基于MDL的直方图密度估计实现时间序列离散化。摘自:第23届IEEE人工智能工具国际会议论文集,ICTAI’11,IEEE计算机学会,第732-739页,doi:10.1109/ICTAI.2011.115
[99] Kang U,Faloutsos C(2011)《超越‘穴居人社区’:图形压缩和挖掘的中心和辐条》。摘自:第11届IEEE国际数据挖掘会议记录,ICDM’11,IEEE计算机学会,第300-309页,doi:10.1109/ICDM.2011.26
[100] Ketkar NS、Holder LB、Cook DJ(2005)《征服:图形数据中基于压缩的频繁模式发现》。收录:第一届开源数据挖掘国际研讨会论文集:频繁模式挖掘实现,OSDM’05,ACM,第71-76页,doi:10.1145/1133905.1133915
[101] Khan KU(2015)使用局部敏感散列的基于集合的无损图摘要方法。摘自:第31届IEEE国际数据工程研讨会会议记录,ICDEW'15,IEEE计算机学会,第255-259页,doi:10.1109/ICDEW.2015.7129586
[102] Khan KU,Nawaz W,Lee YK(2014)基于集合的属性图摘要统一方法。收录:第四届IEEE大数据和云计算国际会议论文集,BDCloud’14,IEEE计算机学会,第378-385页,doi:10.1109/BDCloud.2014.108
[103] Khan KU,Nawaz W,Lee YK(2015a)使用稠密子图发现的无损图摘要。摘自:《第九届全球信息管理与通信国际会议论文集》,IMCOM’15,ACM,第1-7页,doi:10.1145/2701126.2701157
[104] 堪萨斯州Khan;纳瓦兹,W。;Lee,YK,基于集合的无损图形摘要近似方法,计算,97,12,1185-1207(2015)·Zbl 1347.68370号 ·doi:10.1007/s00607-015-0454-9
[105] Kiernan J,Terzi E(2008)构建大型事件序列的综合总结。在:第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'08,ACM,第417-425页,doi:10.1145/1401890.1401943
[106] Kiernan,J。;Terzi,E.,《构建大型事件序列的综合摘要》,《美国医学会关于从数据中发现知识的汇刊》,3,4,21:1-21:31(2009)·doi:10.145/1631162.1631169
[107] Kiernan J,Terzi E(2009b)EventSummarizer:总结大型事件序列的工具。摘自:《第十二届扩展数据库技术国际会议论文集:数据库技术的进展》,EDBT'09,ACM,第1136-1139页,doi:10.1145/1516360.1516497
[108] Koivisto M,Perola M,Varilo T,Hennah W,Ekelund J,Lukk M,Peltonen L,Ukkonen E,Mannila H(2002)一种MDL方法,用于发现单倍型块和估计单倍型区块边界的强度。收录:2003年太平洋生物计算研讨会论文集,PSB'03,世界科学,第502-513页,doi:10.1142/978812776303_0047·Zbl 1256.92038号
[109] Kontkanen P,Myllymäki P(2007)MDL直方图密度估计。摘自:《第十一届国际人工智能与统计会议记录》,AISTATS’07,第219-226页
[110] Kontonasios KN,De Bie T(2012)形式化复杂先验信息以量化频繁模式集的主观兴趣。摘自:第十一届智能数据分析进展国际研讨会论文集,IDA’12,Springer,第161-171页
[111] Kontonasios KN,Vreeken J,De Bie T(2013)迭代识别实际数据中主观有趣结构的最大熵模型。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’13,Springer,pp 256-271
[112] Koopman A,Siebes A(2008)高效发现关系项目集。摘自:2008年SIAM国际数据挖掘会议记录,SDM'08,SIAM,第108-119页,doi:10.1137/1.9781611972788.10
[113] Koopman A,Siebes A(2009)《特征关系模式》。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’09,ACM,第437-446页,doi:10.1145/1557019.1557071
[114] Koutra D,Kang U,Vreeken J,Faloutsos C(2014)VOG:总结和理解大图形。摘自:2014年SIAM国际数据挖掘会议记录,SDM’14,SIAM,第91-99页,doi:10.1137/1.9781611973440.11·Zbl 07260433号
[115] 库特拉,D。;Kang,U。;弗里肯,J。;Faloutsos,C.,《总结和理解大图形》,《统计分析和数据挖掘》,第8、3、183-202页(2015年)·Zbl 07260433号 ·doi:10.1002/sam.11267
[116] Lakshmanan LVS,Ng RT,Wang CX,Zhou X,Johnson TJ(2002)《概括MDL方法》。载:第28届超大数据库国际会议论文集,VLDB'02,VLDBEndowment,第766-777页
[117] Lam HT、Mörchen F、Fradkin D、Calders T(2012)《挖掘压缩序列模式》。在:2012年SIAM国际数据挖掘会议记录,SDM’12,SIAM,第319-330页,doi:10.137/1.9781611972825.28·Zbl 07260381号
[118] Lam HT、Calders T、Yang J、Mörchen F、Fradkin D(2013)《拉链:挖掘流中的压缩序列模式》。摘自:交互式数据探索与分析研讨会论文集,IDEA@KDD’13,ACM,第54-62页,doi:10.1145/2501511.2501520
[119] Lam HT,Kiseleva J,Pechenizkiy M,Calders T(2014a)使用压缩算法将序列分解为独立的子序列。摘自:交互式数据探索与分析研讨会论文集,IDEA@KDD’14,第67-75页
[120] Lam,HT;Mörchen,F。;弗拉德金,D。;Calders,T.,挖掘压缩序列模式,统计分析数据挖掘,7,1,34-52(2014)·Zbl 07260381号 ·doi:10.1002/sam.11192
[121] Lee K,Jo H,Ko J,Lim S,Shin K(2020)SSumM:海量图的稀疏摘要。摘自:第26届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’20,ACM,第144-154页,doi:10.1145/3394486.3403057
[122] LeFevre K,Terzi E(2010)GraSS:图形结构概述。摘自:2010年SIAM国际数据挖掘会议记录,SDM’10,SIAM,第454-465页,doi:10.1137/1.9781611972801.40
[123] Lim,Y。;Kang,U。;Faloutsos,C.,《SlashBurn:洞穴人社区以外的图形压缩和挖掘》,IEEE Trans Knowl Data Eng,26,12,3077-3089(2014)·doi:10.1109/TKDE.2014.2320716
[124] Liu Y,Shah N,Koutra D(2015)图聚类方法的总结能力的实证比较。arXiv:1511.06820号
[125] Liu Y,Safavi T,Shah N(2016)《将百万节点图简化为几个结构模式:统一方法》。在:第12届图形挖掘与学习国际研讨会论文集,MLG@KDD'16,第8页
[126] 刘,Y。;萨法维,T。;Dighe,A。;Koutra,D.,《图形摘要方法和应用:一项调查》,ACM Computing Surveys,51,3,62:1-62:34(2018)·数字对象标识代码:10.1145/3186727
[127] 刘,Y。;萨法维,T。;沙阿,N。;Koutra,D.,将大图简化为小超图:一种统一的方法,Soc Netw Anal Min,8,1,17(2018)·doi:10.1007/s13278-018-0491-4
[128] Lucchese C,Orlando S,Perego R(2010a)挖掘二进制数据集的生成模式模型。摘自:2010年ACM应用计算研讨会论文集,SAC’10,ACM,第1109-1110页,doi:10.1145/1774088.1774320
[129] Lucchese C,Orlando S,Perego R(2010b)在存在噪声的情况下从二进制数据集挖掘top-k模式。摘自:2007年SIAM国际数据挖掘会议记录,SDM’07,SIAM,第165-176页,doi:10.1137/1.9781611972801.15
[130] Lucchese,C。;南奥兰多。;Perego,R.,挖掘近似顶部二进制模式的统一框架,IEEE Trans Knowl Data Eng,26,12,2900-2913(2014)·doi:10.1109/TKDE.2013.181
[131] Makhalova T(2021)对模式集挖掘的贡献:从复杂数据集到重要且有用的模式集。洛林大学博士论文,https://hal.univ-loraine.fr/tel-03342124
[132] Makhalova T,Trnecka M(2019)基于MDL的自下布尔矩阵因式分解算法。arXiv:1901.09567·Zbl 07363864号
[133] Makhalova,T。;Trnecka,M.,基于MDL的From-below布尔矩阵因式分解算法,高级数据分析分类,15,1,37-56(2021)·Zbl 07363864号 ·doi:10.1007/s11634-019-00383-6
[134] Makhalova T、Kuznetsov SO、Napoli A(2018a)关于MDL对FCA的作用的首次研究。摘自:《第十五届概念格及其应用国际会议论文集》,CLA'18,第25-36页
[135] Makhalova T,Kuznetsov SO,Napoli A(2018b)FCA的MDL:有背景知识的地方吗?摘自:第六届国际研讨会论文集“FCA能为人工智能做什么?”@IJCAI/ECAI'18,CEUR研讨会论文集,第2149卷,第45-56页,http://ceur-ws.org/Vol-2149/paper5.pdf
[136] Makhalova T、Kuznetsov SO、Napoli A(2019a)通过压缩进行数值模式挖掘。收录:《数据压缩会议论文集》,DCC'19,第112-121页,doi:10.1109/DCC.2019.00019
[137] Makhalova T、Kuznetsov SO、Napoli A(2019b)关于模式挖掘中FCA和MDL的耦合。收录:《形式概念分析国际会议论文集》,FCA’19,Springer,第332-340页,doi:10.1007/978-3-030-21462-3_23·兹比尔1529.68263
[138] Makhalova T,Kuznetsov SO,Napoli A(2020)铸币厂:基于MDL的INTeresting数字模式集挖掘方法。arXiv公司:2011.14843·Zbl 1494.68223号
[139] Makhalova T,Kuznetsov SO,Napoli A(2021)模式挖掘的可能发生项集。摘自:第六届国际研讨会论文集“FCA能为人工智能做什么?”@IJCAI'21,CEUR研讨会论文集,第2972卷,第39-50页,http://ceur-ws.org/Vol-2972/paper4.pdf
[140] Makhalova,T。;库兹涅佐夫,SO;Napoli,A.,Mint:基于MDL的挖掘INTeresting数字模式集的方法,Data Min Knowl Disc,36,1,108-145(2022)·Zbl 1494.68223号 ·doi:10.1007/s10618-021-00799-9
[141] Mampaey M(2010)挖掘项目集之间的非冗余信息理论依赖性。摘自:《第十二届数据仓库和知识发现国际会议论文集》,DaWaK’10,Springer,第130-141页,doi:10.1007/978-3642-15105-7_11
[142] Mampaey M,Vreeken J(2010)通过聚类项目总结数据。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’10,第321-336页,doi:10.1007/978-3642-15883-4_21
[143] 哺乳动物,M。;Vreeken,J.,通过聚类属性总结分类数据,data Min Knowl Disc,26,1,130-173(2013)·Zbl 1260.68339号 ·doi:10.1007/s10618-011-0246-6
[144] Mampaey M,Tatti N,Vreeken J(2011)告诉我我需要知道的:用项目集简明扼要地总结数据。收录:第17届ACM SIGKDD国际知识发现和数据挖掘会议论文集,KDD’11,ACM,第573-581页,doi:10.1145/2020408.2020499
[145] 哺乳动物,M。;弗瑞肯,J。;Tatti,N.,《用信息量最大的项目集简明扼要地总结数据》,《ACM从数据中发现知识的交易》,6,4,16:1-16:42(2012)·doi:10.1145/2382577.2382580
[146] Mannila H,Toivonen H,Verkamo AI(1994)发现关联规则的有效算法。摘自:KDD研讨会论文集,人工智能发展协会,第181-192页
[147] Mannila,H。;科维斯托,M。;佩罗拉,M。;瓦里洛,T。;Hennah,W。;埃克伦德,J。;卢克,M。;佩尔顿,L。;Ukkonen,E.,最小描述长度块查找器,一种识别单倍型块并比较块边界强度的方法,《美国人类遗传学杂志》,73,1,86-94(2003)·Zbl 1256.92038号 ·doi:10.1086/376438
[148] Markham TS、Evans S、Impson J、Steinbrecher E(2009)基于增量MDL的两部分压缩算法在模型推理中的实现。摘自:2009年数据压缩会议记录,DCC'09,pp 322-331,doi:10.1109/DCC.2009.66
[149] Matsubara Y、Sakurai Y、Faloutsos C(2014)AutoPlait:共同进化时间序列的自动挖掘。摘自:2014年ACM SIGMOD国际数据管理会议记录,SIGMOD'14,ACM,第193-204页,doi:10.1145/2588555.2588556
[150] Miettinen P,Vreeken J(2011)布尔矩阵因式分解的模型顺序选择。摘自:第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’11,ACM,第51-59页,doi:10.1145/2020408.2020424
[151] Miettinen,P。;Vreeken,J.,MDL4BMF:布尔矩阵因式分解的最小描述长度,ACM Transactions on Knowledge Discovery from Data,8,4,18:1-18:31(2014)·数字对象标识代码:10.1145/2601437
[152] Mitra S,Sastry PS(2019)《用连续事件总结事件序列:统计模型和应用》。arXiv:1904.00516
[153] Navlakha S、Rastogi R、Shrivastava N(2008)《有界误差的图形摘要》。摘自:2008年ACM SIGMOD国际数据管理会议记录,SIGMOD'08,ACM,第419-432页,doi:10.1145/1376616.1376661
[154] Nguyen,高压;穆勒,E。;弗瑞肯,J。;Böhm,K.,多元数据的非监督交互保护离散化,data Min Knowl Disc,28,5,1366-1397(2014)·Zbl 1342.62001号 ·doi:10.1007/s10618-014-0350-5
[155] Otaki K,Yamamoto A(2015)基于MDL的模式摘要的晶格编辑操作。In:ICFCA’15形式概念分析与应用国际研讨会论文集
[156] Papadimitriou S,Gionis A,TsaparasP,Väisänen RA,Mannila H,Faloutsos C(2005)使用MDL的无参数空间数据挖掘。摘自:第五届IEEE国际数据挖掘会议论文集,2005年,IEEE计算机学会,第346-353页,doi:10.1109/ICDM.2005.117
[157] Papadimitriou S,Sun J,Faloutsos C,Yu PS(2008)分层、无参数社区发现。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’08,Springer,第170-187页,doi:10.1007/978-3-540-87481-2_12
[158] Phan NH、Ienco D、Poncelet P、Teisseire M(2013)通过压缩挖掘代表性运动模式。In:Advances In Knowledge Discovery and Data Mining,Springer,第314-326页,doi:10.1007/978-3642-37453-1_26
[159] Plant C、Biedermann S、Böhm C(2020)《数据压缩作为图形绘制和表示学习的综合框架》。收录:第26届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’20,ACM,pp 1212-1222,doi:10.1145/3394486.3403174
[160] 普拉卡什,BA;弗瑞肯,J。;Faloutsos,C.,《在一个大图形中有效地找出流行病的起点》,《知识信息系统》,38,1,35-59(2014)·doi:10.1007/s10115-013-0671-5
[161] 普伦萨,HM;van Leeuwen,M.,基于MDL规则列表的可解释多类分类,《信息科学》,5121372-1393(2020)·doi:10.1016/j.ins.2019.10.050
[162] Proença HM,van Leeuwen M(2020b)基于MDL的规则列表的可解释多类分类。arXiv:1905.00328号
[163] Proença HM,Grünwald PD,Bäck T,van Leeuwen M(2020)使用MDL发现数字目标的杰出子组列表。摘自:欧洲机器学习会议论文集和数据库中知识发现的原则与实践,ECML/PKDD’20
[164] Proença HM,Bäck T,van Leeuwen M(2021a)稳健亚群发现。arXiv公司:2103.13686
[165] Proença HM、Grünwald PD、Bäck T、van Leeuwen M(2021b)使用MDL发现数字目标的杰出子组列表。arXiv:2006.09186
[166] Puolamäki,K。;Oikarinen,E。;Kang,B。;Lijffijt,J。;De Bie,T.,《带有主观反馈的交互式可视化数据探索:信息理论方法》,《data Min Knowl Disc》,第34、1、21-49页(2020年)·doi:10.1007/s10618-019-00655-x
[167] Rakthanmanon T,Keogh EJ,Lonardi S,Evans S(2011)时间序列扩展:聚类时间序列流需要忽略一些数据。摘自:第11届IEEE国际数据挖掘会议记录,ICDM’11,IEEE计算机学会,第547-556页,doi:10.1109/ICDM.2011.146
[168] Rakthanmanon,T。;EJ基奥;Lonardi,S。;Evans,S.,基于MDL的时间序列聚类,Knowl Inf Syst,33,2371-399(2012)·doi:10.1007/s10115-012-0508-7
[169] 拉希迪,P。;库克,DJ,COM:一种在家庭健康监测系统中挖掘和监测人类活动模式的方法,ACM智能系统与技术汇刊,4,4,64:1-64:20(2013)·doi:10.1145/2508037.2508045
[170] Rissanen,J.,《用最短数据描述建模》,Automatica,14,5,465-471(1978)·Zbl 0418.93079号 ·doi:10.1016/0005-1098(78)90005-5
[171] 罗哈斯,A。;Calatayud,J。;科瓦列夫斯基,M。;纽曼,M。;Rosvall,M.,显生宙化石记录的多尺度视图揭示了三种主要的生物转变,通信生物学,4,1,1-8(2021)·doi:10.1038/s42003-021-01805-y
[172] 罗斯瓦尔,M。;CT Bergstrom,《解决复杂网络中社区结构的信息理论框架》,《国家科学院学报》,104、18、7327-7331(2007)·doi:10.1073/pnas.0611034104
[173] 罗斯瓦尔,M。;康涅狄格州伯格斯特罗姆,《复杂网络上随机漫步的地图揭示了社区结构》,《国家科学院学报》,105,4,1118-1123(2008)·doi:10.1073/pnas.0706851105
[174] 罗斯瓦尔,M。;伯格斯特罗姆(Bergstrom),康涅狄格州,《绘制大型网络中的变化》(Mapping change in large networks),《公共科学图书馆·综合》(PLoS ONE),5,1,1-7(2010)·doi:10.1371/journal.pone.0008694
[175] 罗斯瓦尔,M。;Bergstrom,CT,《网络上随机漫步的多级压缩揭示了大型集成系统中的分层组织》,《公共科学图书馆·综合》,6,4(2011)·doi:10.1371/journal.pone.0018209
[176] 罗斯瓦尔,M。;Axelsson,D。;康涅狄格州伯格斯特罗姆,《地图方程》,《欧洲物理杂志专题》,178,1,13-23(2009)·doi:10.1140/epjst/e2010-01179-1
[177] Sampson O,Berthold MR(2014)《拓宽KRIMP:通过多样化并行实现更好的性能》。摘自:第13届智能数据分析进展国际研讨会论文集,IDA’14,Springer,第276-285页,doi:10.1007/978-3-319-12571-8_24
[178] Saran,D。;Vreeken,J.,《使用MDL总结动态图》。技术代表(2019年),德国:萨尔州大学,德国
[179] Shah N,Koutra D,Zou T,Gallagher B,Faloutsos C(2015)TimeCrunch:可解释的动态图摘要。收录:第21届ACM SIGKDD国际知识发现和数据挖掘会议论文集,KDD’15,ACM,pp 1055-1064,doi:10.1145/2783258.2783321
[180] 沙阿,N。;库特拉,D。;Jin,L.等人。;邹,T。;加拉赫,B。;Faloutsos,C.,《关于总结大规模动态图》,IEEE数据工程公告,40,3,75-88(2017)
[181] 香农,CE,通信数学理论,贝尔系统技术杂志,27,3,379-423(1948)·Zbl 1154.94303号 ·doi:10.1002/j.1538-7305.1948.tb01338.x
[182] Shokoohi-Yekta M,Chen Y,Campana B,Hu B,Zakaria J,Keogh E(2015)《时间序列中有意义规则的发现》。在:第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'15,ACM,第1085-1094页,doi:10.145/2783258.2783306
[183] Siebes A(2012)数据分析查询。摘自:第十一届智能数据分析进展国际研讨会论文集,IDA’12,Springer,第7-22页
[184] Siebes A(2014)模式挖掘中的MDL:krimp简介。in:形式概念分析国际会议论文集,FCA’14,Springer,pp 37-43,doi:10.1007/978-3-19-07248-7_3·Zbl 1444.68162号
[185] Siebes A,Kersten R(2011)交易数据的结构函数。摘自:2011年SIAM国际数据挖掘会议记录,SDM’11,SIAM,pp 558-569,doi:10.1137/1.9781611972818.48
[186] Siebes A,Kersten R(2012)《分类数据平滑》。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’12,Springer,pp 42-57,doi:10.1007/978-3642-33460-3_8
[187] Siebes A、Vreeken J、van Leeuwen M(2006)压缩项目集。摘自:2006年SIAM国际数据挖掘会议记录,SDM’06,SIAM·Zbl 1235.68071号
[188] Smets K,Vreeken J(2011)《奇怪的一点:识别和表征异常》。摘自:2011年SIAM国际数据挖掘会议记录,SDM’11,SIAM,第804-815页,doi:10.1137/1.9781611972818.69
[189] Smets K,Vreeken J(2012)《苗条:直接挖掘描述性模式》。摘自:2012年SIAM国际数据挖掘会议记录,SDM’12,SIAM,第236-247页
[190] Soulet A、Raíssi C、Plantevit M、Crémilleux B(2011)《天空中的主导模式挖掘》。摘自:第11届IEEE国际数据挖掘会议记录,ICDM’11,IEEE计算机学会,pp 655-664,doi:10.1109/ICDM.2011.100
[191] Stone,JV,《信息理论:教程介绍》(2013年),谢菲尔德:谢菲尔德Sebtel出版社
[192] Sun J,Faloutsos C,Papadimitriou S,Yu PS(2007)GraphScope:大型时间演化图的无参数挖掘。收录:第13届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’07,ACM,第687-696页,doi:10.1145/1281192.1281266
[193] Tanaka Y,Uehara K(2003)使用主成分分析和MDL原理发现多维时间序列中的主题。摘自:《模式识别中的机器学习和数据挖掘第三届国际会议论文集》,MLDM’03,Springer,第252-265页·Zbl 1029.68592号
[194] 田中,Y。;岩本,K。;Uehara,K.,基于MDL原理从多维数据中发现时间序列模体,《马赫学习》,58,2,269-300(2005)·Zbl 1075.62084号 ·doi:10.1007/s10994-005-5829-2
[195] Tatti N(2010)可能是最好的项目集。在:第16届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'10,ACM,第293-302页,doi:10.145/1835804.1835843
[196] Tatti N,Heikinheimo H(2008)项目集的可分解族。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’08,第472-487页,doi:10.1007/978-3-540-87481-2_31
[197] Tatti N,Vreeken J(2008)通过包装数据找到好的项目集。摘自:第八届IEEE数据挖掘国际会议论文集,ICDM’08,IEEE计算机学会,第588-597页,doi:10.1109/ICDM.2008.39
[198] Tatti N,Vreeken J(2012a)发现描述性瓷砖树。在:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD'12,施普林格,第9-24页,doi:10.1007/978-3-642-33460-3_6
[199] Tatti N,Vreeken J(2012b)《它的长与短:用连续事件总结事件序列》。摘自:第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’12,ACM,第462-470页
[200] van Leeuwen M(2010)重要的模式。乌得勒支大学博士论文
[201] van Leeuwen,M。;Galbrun,E.,双视图数据中的关联发现,IEEE Trans Knowl data Eng,27,12,3190-3202(2015)·doi:10.1109/TKDE.2015.2453159
[202] van Leeuwen M,Siebes A(2008)StreamKrimp:检测数据流中的变化。摘自:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD’08,Springer,第672-687页,doi:10.1007/978-3-540-87479-9_62
[203] van Leeuwen M,Vreeken J(2014)通过压缩挖掘和使用模式集。收录:Frequent Pattern Mining,Springer,pp 165-198,doi:10.1007/978-319-07821-2_8·Zbl 1298.68250号
[204] van Leeuwen M,Vreeken J,Siebes A(2006)Compression选择了重要的项目集。摘自:《欧洲数据库知识发现会议记录》,PKDD'06,Springer,第585-592页,doi:10.1007/11871637_59
[205] van Leeuwen M、Bonchi F、Sigurbjörnsson B、Siebes A(2009a)压缩标签以查找有趣的媒体组。收录:第18届ACM信息和知识管理会议记录,CIKM'09,ACM,第1147-1156页,doi:10.1145/1645953.1646099
[206] van Leeuwen,M。;弗瑞肯,J。;Siebes,A.,《识别组件》,Data Min Knowl Disc,19、2、176-193(2009)·doi:10.1007/s10618-009-0137-2
[207] van Leeuwen,M。;De Bie,T。;Spyropoulou,E。;Mesnage,C.,子图模式的主观趣味性,Mach Learn,105,1,41-75(2016)·Zbl 1392.68376号 ·doi:10.1007/s10994-015-5539-3
[208] Vanetik N,Litvak M(2017)使用MDL原则的基于查询的摘要。摘自:2017年MultiLing跨源类型和流派的总结和总结评估研讨会论文集@ACL’17,第22-31页
[209] Vanetik N,Litvak M(2018)DRIM:基于MDL的快速多样性总结方法。收录:2018 IEEE/WIC/ACM网络智能国际会议论文集,WI'18,第660-663页,doi:10.1109/WI.2018.00-17
[210] Vespier U、Knobbe A、Nijssen S、Vanschoren J(2012)基于MDL的多时间尺度时间序列分析。在:《欧洲机器学习与数据库知识发现原理与实践会议论文集》,ECML/PKDD'12,施普林格,第371-386页,doi:10.1007/978-3-642-33486-3_24
[211] Viamontes Esquivel,A。;Rosvall,M.,《流压缩可以揭示网络中的重叠模块组织》,Phys Rev X,1,2(2011)·doi:10.1103/PhysRevX.1.021025
[212] Vreeken J(2009)使模式挖掘有用。乌得勒支大学博士论文
[213] Vreeken J,Siebes A(2008)填补空白——针对缺失数据的磷虾最小化。摘自:第八届IEEE数据挖掘国际会议论文集,ICDM’08,IEEE计算机学会,第1067-1072页,doi:10.1109/ICDM.2008.40
[214] Vreeken J、van Leeuwen M、Siebes A(2007a)《差异表征》。在:第13届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'07,ACM,第765-774页,doi:10.145/1281192.1281274
[215] Vreeken J,van Leeuwen M,Siebes A(2007b)通过数据生成保护隐私。摘自:第七届IEEE数据挖掘国际会议论文集,ICDM’07,IEEE计算机学会,第685-690页,doi:10.1109/ICDM.2007.25
[216] 弗瑞肯,J。;van Leeuwen,M。;Siebes,A.,Krimp:压缩的挖掘项集,Data Min Knowl Disc,23,1,169-214(2011)·Zbl 1235.68071号 ·doi:10.1007/s10618-010-0202-x
[217] Wang P,Wang H,Liu M,Wang W(2010)事件摘要的算法方法。摘自:2010年ACM SIGMOD国际数据管理会议记录,SIGMOD'10,ACM,第183-194页,doi:10.1145/1807167.1807189
[218] Webb,GI,《发现重要模式》,《马赫学习》,68,1,1-33(2007)·Zbl 1470.68195号 ·数字对象标识代码:10.1007/s10994-007-5006-x
[219] 韦伯,GI;Vreeken,J.,《高效发现最有趣的关联》,《ACM从数据中发现知识的交易》,8,3,15:1-15:31(2013)·数字对象标识代码:10.1145/2601433
[220] Wiegand B、Klakow D、Vreeken J(2021)从复杂事件日志中挖掘易于理解的模型。摘自:2021年SIAM国际数据挖掘会议记录,SDM’21,SIAM,第244-252页,doi:10.1137/1.9781611976700.28
[221] Wiegand B、Klakow D、Vreeken J(2022)《可解释数据序列生成器的挖掘》。摘自:第三十六届AAAI人工智能会议论文集,AAAI'22,人工智能促进协会
[222] Witteveen J、Duivesteijn W、Knobbe A、Grünwald PD(2014)RealKrimp–寻找用MDL压缩实值数据的超区间。摘自:第13届智能数据分析进展国际研讨会论文集,IDA’14,Springer,第368-379页,doi:10.1007/978-3-319-12571-8_32
[223] Wu D,Gundimeda S,Mou S,Quinn CJ(2020)分段平稳时间序列建模。摘自:《2020 IEEE声学、语音和信号处理国际会议论文集》,ICASSP’20,IEEE计算机学会,第3817-3821页,doi:10.1109/ICSPSP40776.2020.9053470
[224] 严X,程H,韩J,辛D(2005)《项目集模式概述:基于轮廓的方法》。摘自:第十一届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’05,ACM,第314-323页,doi:10.1145/1081870.1081907
[225] Yan Y,Cao L,Madden S,Rundensteiner EA(2018)SWIFT:从大型事件流中挖掘代表性模式。VLDB Endow程序12(3):265-277。数字对象标识代码:10.14778/3291264.3291271
[226] Yang L,Baratchi M,van Leeuwen M(2020)基于二维MDL直方图的无监督离散化。arXiv:2006.01893年
[227] Youngblood GM、Heierman EO、Cook DJ、Holder LB(2005)通过智能环境领域的数据挖掘技术实现HPOMDP的自动化构建。摘自:第十八届佛罗里达国际人工智能研究会会议记录,FLAIRS'05
[228] Yurov M,Ignatov DI(2017)在压缩的属性条件对集上将磷虾转化为三聚类技术。摘自:《粗糙集国际联合会议论文集》,IJCRS’17,Springer,pp 558-569,doi:10.1007/978-319-60840-2_40
[229] Zhao P,Zhao Q,Zhang C,Su G,ZhangQ,Rao W(2019)CLEAN:道路网络上基于频繁模式的轨迹时空压缩。摘自:第20届IEEE移动数据管理国际会议论文集,MDM’19,IEEE计算机学会,第605-610页,doi:10.1109/MDM.2019.00127
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。