文件Zbl 1509.68240-zbMATH Open

模式挖掘的最小描述长度原则：综述。（英语） Zbl 1509.68240号

数据最小知识。发现。 36，第5期，1679-1727（2022）.

摘要：挖掘模式是数据分析的核心任务，除了高效枚举问题外，模式的选择也是一个重大挑战。最小描述长度（MDL）原则是一种基于信息论的模型选择方法，已应用于模式挖掘，目的是获得紧凑的高质量模式集。在概述了信息理论和编码的相关概念之后，我们回顾了基于MDL的方法，用于从各种类型的数据中挖掘不同类型的模式。最后，我们就有关这些方法的一些问题展开讨论。

引用于1文件

MSC公司：

68T09号	数据分析和大数据的计算方面
68页30	编码和信息理论（压缩、压缩、通信模型、编码方案等）（计算机科学方面）
68吨10	模式识别、语音识别
68-02	与计算机科学有关的研究展览会（专著、调查文章）

关键词：

数据挖掘;模式挖掘;频繁项集;最小描述长度原则;信息论

软件：

MDL4BMF公司;StreamKrimp公司;PAL倾斜;克里姆;图形范围

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

参考文献：

[1]	阿德里安斯，F。；Lijffijt，J。；De Bie，T.，《连接树木和森林的主观趣味》，Data Min Knowl Disc，33，4，1088-1124（2019）·Zbl 1458.68155号 ·doi:10.1007/s10618-019-00627-1
[2]	Agrawal R，Srikant R（1994）挖掘关联规则的快速算法。收录：第20届超大数据库国际会议论文集，VLDB’94，Morgan Kaufmann，第487-499页
[3]	阿格拉瓦尔，R。；伊米林斯基，T。；Swami，A.，挖掘大型数据库中项目集之间的关联规则，ACM SIGMOD Rec，22，2，207-216（1993）·doi:10.145/170036.170072
[4]	Akoglu L，Tong H，Meeder B，Faloutsos C（2012a）PICS：大型属性图中内聚子群的无参数识别。摘自：2012年SIAM国际数据挖掘会议记录，SDM’12，SIAM，第439-450页，doi:10.1137/1.9781611972825.38
[5]	Akoglu L，Tong H，Vreeken J，Faloutsos C（2012b）分类数据中快速可靠的异常检测。摘自：《第21届ACM信息和知识管理国际会议论文集》，CIKM'12，ACM，第415-424页，doi:10.1145/2396761.2396816
[6]	Akoglu L、Chau DH、Vreeken J、Tatti N、Tong H、Faloutsos C（2013）《大型图中标记节点的连接路径挖掘》。在：2013年SIAM国际数据挖掘会议记录，SDM’13，SIAM，第37-45页，doi:10.1137/1.9781611972832.5
[7]	欧共体安德森；Novembre，J.，《利用最小描述长度原理寻找单倍型块边界》，《美国人类遗传学杂志》，73，2，336-354（2003）·doi:10.1086/377106
[8]	Aoga JOR，Guns T，Nijssen S，Schaus P（2018）使用最小描述长度原则寻找概率规则列表。摘自：《发现科学国际会议论文集》，DS’18，Springer，第66-82页，doi:10.1007/978-3-030-01771-2-5
[9]	Araujo M、Günnemann S、Mateos G、Faloutsos C（2014a）《超越区块：双曲社区检测》。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’14，Springer，第50-65页，doi:10.1007/978-3662-44848-9_4
[10]	Araujo M、Papadimitriou S、Günnemann S、Faloutsos C、Basu P、Swami A、Papalexakis EE、Koutra D（2014b）Com2:快速自动发现时间（“科姆”）社区。摘自：《第18届亚太地区知识发现和数据挖掘进展会议论文集》，PAKDD’14，Springer，第271-283页，doi:10.1007/978-3-319-06605-9_23
[11]	Araujo，M。；Günnemann，S。；Papadimitriou，S。；Faloutsos，C。；巴苏，P。；斯瓦米，A。；Papalexakis，EE；库特拉，D.，《在时间和标记图中发现“彗星”群落》（COM^2），《知识信息系统》，46，3，657-677（2016）·doi:10.1007/s10115-015-0847-2
[12]	Asadi B，Varadharajan V（2019a）基于MDL的事务数据集分类器，用于恶意软件检测。arXiv公司：1910.03751
[13]	Asadi B，Varadharajan V（2019b）面向稳健分类器：一种基于MDL的生成对抗性示例的方法。arXiv公司：1912.05945
[14]	Bariatti F（2021）使用最小描述长度原则挖掘可处理的图形模式集。雷恩大学博士论文，https://hal.inia.fr/tel-03523742
[15]	Bariatti F，Cellier P，FerréS（2020a）GraphMDL：基于最小描述长度的图形模式选择。摘自：第18届智能数据分析进展国际研讨会论文集，IDA’20，Springer，第54-66页，doi:10.1007/978-3-030-44584-3_5
[16]	Bariatti F，Cellier P，FerréS（2020b）GraphMDL可视化工具：图形模式的交互式可视化。图嵌入和挖掘研讨会论文集创业板@ECML/PKDD'20年，https://hal.inria.fr/hal-03142207
[17]	Bariatti F，Cellier P，FerréS（2021）GraphMDL+：交织图模式的生成和基于MDL的选择。摘自：第36届ACM应用计算年会论文集，SAC’21，ACM，第355-363页，doi:10.1145/3412841.3441917
[18]	Bastide Y，Pasquier N，Taouil R，Stumme G，Lakhal L（2000）使用频繁闭项集挖掘最小非冗余关联规则。摘自：《第一届国际计算逻辑会议论文集》，CL'00，Springer，第972-986页·Zbl 0983.68511号
[19]	Begum N，Hu B，Raktanmanon T，Keogh E（2013）半监督时间序列分类的基于最小描述长度的停止准则。摘自：第14届IEEE信息重用集成国际会议论文集，IRI'13，IEEE计算机学会，第333-340页，doi:10.1109/IRI.2013.6642490
[20]	Begum N，Hu B，Rakthanmanon T，Keogh E（2014）半监督时间序列分类的最小描述长度技术。可重用系统集成第171-192页，doi:10.1007/978-3-319-04717-1_8
[21]	Belth C，Zheng X，Vreeken J，Koutra D（2020）知识图中什么是正常的，什么是奇怪的，什么缺少：通过归纳总结的统一表征。收录：《网络会议论文集》，WWW’20，ACM，第1115-1126页，doi:10.1145/3366423.3380189
[22]	Bertens R（2017）《信息洞察力：从抽象到异常》。荷兰乌得勒支大学博士论文
[23]	Bertens R，Siebes A（2014）《地震数据特征描述》。摘自：2014年SIAM国际数据挖掘会议记录，SDM’14，SIAM，第884-892页，doi:10.1137/1.9781611973440.101
[24]	Bertens R、Vreeken J、Siebes A（2015）《美丽与大脑：检测异常模式的共现》。arXiv:1512.07048
[25]	Bertens R，Vreeken J，Siebes A（2016）保持简短：用多元模式总结复杂事件序列。摘自：第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集，2016年，ACM
[26]	Bertens R、Vreeken J、Siebes A（2017）高效发现意外模式。摘自：2017年SIAM国际数据挖掘会议记录，SDM’17，SIAM，第126-134页，doi:10.1137/1.9781611974973.15
[27]	Bhattacharyya A，Vreeken J（2017）高效总结了具有丰富交错模式的事件序列。2017年SIAM数据挖掘国际会议论文集，SDM’17，SIAM
[28]	布兰科，F。；Calatayud，J。；Martín-Perea，DM；多明戈，理学硕士；梅内德斯，I。；穆勒，J。；Fernández，MH；Cantalapiedra，JL，哺乳动物群落在进化时间尺度上的标点生态平衡，《科学》，372，6539，300-303（2021）·doi:10.1126/science.abd5110
[29]	Bloem P（2013）基于压缩的图形数据推理。摘自：第22届比利时-荷兰机器学习年会论文集，BENELEARN’13
[30]	Bloem P，de Rooij S（2018）图分析MDL假设测试教程。arXiv:1810.13163
[31]	布隆，P。；de Rooij，S.，使用压缩的大规模网络基序分析，Data Min Knowl Disc，34，5，1421-1453（2020）·Zbl 1455.68134号 ·doi:10.1007/s10618-020-00691-y
[32]	Bobed C，Maillot P，Cellier P，FerréS（2019）RDF图结构演化的数据驱动评估。语义Web-互操作性、可用性、适用性
[33]	Bohlin L、Edler D、Lancichinetti A、Rosvall M（2014）《利用地图方程框架进行网络的社区检测和可视化》。摘自：《学术测量》（ed）Ding Y、Rousseau R、Wolfram D.Impact、Methods and Practice，Springer International Publishing，第3-34页
[34]	Boley M，Lucchese C，Paurat D，Gärtner T（2011）通过有效的两步随机程序进行直接局部模式采样。收录：第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’11，ACM，第582-590页，doi:10.1145/2020408.2020500
[35]	Boley M、Mampaey M、Kang B、Tokmakov P、Wrobel S（2013）一键式挖掘：通过内隐偏好和性能学习进行交互式局部模式发现。在：交互式数据探索和分析研讨会论文集，IDEA@KDD'13，ACM，第27-35页，doi:10.145/2501511.2501517
[36]	Bonchi F、van Leeuwen M、Ukkonen A（2011），使用压缩表征不确定数据。摘自：2011年SIAM国际数据挖掘会议记录，SDM’11，SIAM，第534-545页
[37]	Bourand E，Galárraga L，Galbrun E，Fromont E，Termier A（2021a）发现长序列中有用的序列规则紧集。收录：2021年IEEE第33届人工智能工具国际会议论文集，ICTAI’21，IEEE计算机学会，第1295-1299页，doi:10.1109/ICTAI52525.2021.00204
[38]	Bourand E，Galárraga L，Galbrun E，Fromont E，Termier A（2021b）发现长序列中有用的紧序列规则集。arXiv:2109.07519
[39]	Budhathoki K，Vreeken J（2015）差异和规范——描述数据库之间的相似性和差异。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’15，Springer，第9285卷，第206-223页，doi:10.1007/978-3319-23525-7_13
[40]	Budhathoki K，Vreeken J（2017a）压缩相关性。摘自：2017年SIAM国际数据挖掘会议记录，SDM’17，SIAM，第525-533页，doi:10.1137/1.9781611974973.59
[41]	Budhathoki K，Vreeken J（2017b）离散数据因果推断的MDL。摘自：第17届IEEE国际数据挖掘会议记录，ICDM’17，IEEE计算机学会，第751-756页，doi:10.1109/ICDM.2017.87
[42]	Calatayud，J。；贝尔纳多·马德里，R。；纽曼，M。；罗哈斯，A。；Rosvall，M.，《探索解决方案环境实现更可靠的网络社区检测》，Phys Rev E，100，5（2019）·doi:10.1103/PhysRevE.100.052308
[43]	Chakrabarti D（2004）AutoPart:无参数图分割和离群值检测。摘自：《欧洲数据库知识发现会议论文集》，PKDD'04，Springer，第112-124页，doi:10.1007/978-3-540-30116-5_13
[44]	Chakrabarti D、Papadimitriou S、Modha DS、Faloutsos C（2004）《全自动交叉关联》。摘自：第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’04，ACM，第79-88页，doi:10.1145/1014052.1014064
[45]	Chen L，Amiri SE，Prakash BA（2018）数据序列的自动分段。附：第三十二届AAAI人工智能会议记录，AAAI’18，人工智能促进协会
[46]	厨师，DJ；霍尔德，LB，《使用最小描述长度和背景知识发现子结构》，J Artifi Intell Res，1，1，231-255（1994）·doi:10.1613/jair.43
[47]	Coupette C，Vreeken J（2021）图形相似性描述：这些图形的相似性如何？摘自：第27届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’21，ACM
[48]	封面，TM；JA Thomas，《信息理论的要素》（2012），美国：John Wiley&Sons，美国·Zbl 1140.94001号
[49]	Cüppers J，Vreeken J（2020），等待吧……挖掘具有可靠预测延迟的序列模式。摘自：第20届IEEE数据挖掘国际会议论文集，ICDM’20，IEEE计算机学会
[50]	Das SK，Cook DJ（2004）基于代理的智能家居中的健康监测。摘自：《智能家居与健康远程通信国际会议论文集》，ICOST'04，IOS出版社，第3-14页
[51]	De Bie T，Kontonasios KN，Spyropoulou E（2010）挖掘有趣模式集的框架。SIGKDD探索（和ACM SIGKD有用模式研讨会会议记录，UP'10）12（2）：92-100
[52]	德多梅尼科，M。；Lancichinetti，A。；阿里纳斯，A。；Rosvall，M.，《识别多层网络上的模块化流揭示了互连系统中高度重叠的组织》，Phys Rev X，5，1，11027（2015）·doi:10.1103/PhysRevX.5.011027
[53]	De Raedt L，Zimmermann A（2007）基于约束的模式集挖掘。摘自：2007年SIAM国际数据挖掘会议记录，SDM’07，SIAM，第237-248页，doi:10.1137/1.9781611972771.22
[54]	Edler，D。；波林，L。；Rosvall，M.，《使用infomap映射内存和多层网络中的高阶网络流》，《算法》，10，4，112（2017）·Zbl 1462.90027号 ·doi:10.3390/a10040112
[55]	Edler，D。；Guedes，T。；Zizka，A。；罗斯瓦尔，M。；Antonelli，A.，《信息地图生物区域：物种分布生物地理区域的交互式制图》，《系统生物学》，66，2，197-204（2017）·doi:10.1093/sysbio/syw087
[56]	埃蒙斯，S。；Mucha，PJ，Map equation with metadata：改变属性在社区检测中的作用，Phys Rev E，100，2（2019）·doi:10.1103/PhysRevE.100.022301
[57]	Evans S，Saulnier G，Bush SF（2003）估计字符串kolmogorov复杂度和算法最小充分统计量的新通用两部分代码。摘自：DIMACS复杂性和推断研讨会论文集
[58]	Evans S、Markham TS、Torres A、Kourtidis A、Conklin D（2006）核苷酸序列分析的改进最小描述长度学习算法。收录于：2006年第四十届亚洲信号、系统和计算机会议记录，ACSSC’06，第1843-1850页，doi:10.1109/ACSSC.2006.355081
[59]	埃文斯，S。；Kourtidis，A。；马卡姆，TS；Miller，J。；康克林，DS；Torres，AS，使用MDLcompress对乳腺癌相关基因进行微RNA靶点检测和分析，EURASIP J Bioinf Syst Biol，143670（2007）·doi:10.186/1687-4153-2007-43670
[60]	Faas M，van Leeuwen M（2020）《Vouw：使用MDL原理的几何模式挖掘》。摘自：第18届智能数据分析进展国际研讨会论文集，IDA’20，Springer，第158-170页，doi:10.1007/978-3-030-44584-3_13
[61]	Feng J（2015）信息论图形挖掘。德国慕尼黑大学路德维希·马克西米利安博士论文
[62]	Feng J，He X，Konte B，Böhm C，Plant C（2012）基于总结的二部图挖掘。在：第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD'12，ACM，第1249-1257页，doi:10.145/2339530.2339725
[63]	Feng J，He X，Hubig N，Böhm C，Plant C（2013）利用结构原语的基于压缩的图挖掘。摘自：第13届IEEE数据挖掘国际会议论文集，ICDM’13，IEEE计算机学会，第181-190页，doi:10.1109/ICDM.2013.56
[64]	Fischer J，Vreeken J（2019）稳健规则集，以及如何找到它们。摘自：《第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集》，KDD’19，ACM，第38-54页，doi:10.1007/978-3-030-46150-8_3
[65]	Fischer J，Vreeken J（2020）发现表达共现性和互斥性的简洁模式集。摘自：第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’19，ACM
[66]	Fischer J，Oláh A，Vreeken J（2021）盒子里有什么？用稳健的规则解释神经网络。摘自：第38届国际机器学习会议论文集，ICML’21
[67]	Fowkes J，Sutton C（2016）序列模式挖掘的子序列交错模型。摘自：第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’16，ACM，第835-844页
[68]	Galbrun E、Cellier P、Tatti N、Termier A、Crémilleux B（2018）使用MDL标准挖掘周期模式。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’18，第535-551页
[69]	Gallo A，De Bie T，Cristianini N（2007）MINI:挖掘信息性非冗余项集。摘自：《欧洲数据库知识发现会议论文集》，PKDD'07，Springer，第438-445页，doi:10.1007/978-3-540-74976-9_44
[70]	Gautras C、Cellier P、van Leeuwen M、Termier A（2020）基于MDL的零售特征发现拓宽。摘自：第18届智能数据分析进展国际研讨会论文集，IDA’20，Springer，第197-209页，doi:10.1007/978-3-030-44584-3_16
[71]	Geng，L。；Hamilton，HJ，《数据挖掘的有趣度量：一项调查》，ACM Compute Surv，38，3，9（2006）·数字对象标识代码：10.1145/1132960.1132963
[72]	Gionis，A。；Mannila，H。；Mielikäinen，T。；Tsaparas，P.，《通过交换随机化评估数据挖掘结果》，《ACM从数据中发现知识的交易》，第1、3、14页（2007年）·数字对象标识代码：10.1145/1297332.1297338
[73]	Goebl S，Tonch A，Böhm C，Plant C（2016）MeGS:使用最小描述长度划分有意义的子图结构。摘自：第16届IEEE数据挖掘国际会议论文集，ICDM’16，IEEE计算机学会，第889-894页，doi:10.1109/ICDM.2016.0108
[74]	Greenspan G，Geiger D（2003）单倍型区组变异的基于模型的推断。摘自：第七届计算分子生物学研究国际年会论文集，RECOMB'03，ACM，pp 131-137，doi:10.1145/640075.640092
[75]	格林斯潘，G。；Geiger，D.，基于模型的单倍型块变异推断，《计算机生物学杂志》，11，2，493-504（2004）·doi:10.1089/1066527041410300
[76]	Grosse K，Vreeken J（2017）使用连续事件集和本体论总结事件序列。摘自：2017年ECML/PKDD数据挖掘与自然语言处理互动研讨会论文集
[77]	Grünwald，PD，最小描述长度原则（2007），马萨诸塞州剑桥：麻省理工学院出版社·doi:10.7551/mitpress/4643.001.0001
[78]	枪，T。；Nijssen，S。；De Raedt，L.，项目集挖掘：约束编程视角，Artif Intell，175，121951-1983（2011）·Zbl 1353.68233号 ·doi:10.1016/j.artint.2011.05.002
[79]	枪支，T。；Nijssen，S。；De Raedt，L.，约束下的k模式集挖掘，IEEE Trans Knowl Data Eng，25，2，402-418（2013）·doi:10.1109/TKDE.2011.204
[80]	西伯利亚州Hämäläinen。；Webb，GI，统计声音模式发现教程，Data Min Knowl Disc（2018）·Zbl 1464.62305号 ·doi:10.1007/s10618-018-0590-x
[81]	Hanhijärvi S、Ojala M、Vuokko N、Puolamäki K、Tatti N、Mannila H（2009）告诉我一些我不知道的事情：迭代数据挖掘的随机化策略。摘自：第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’09，ACM，第379-388页，doi:10.1145/1557019.1557065
[82]	He J，Tong H，Papadimitriou S，Eliassi-Rad T，Faloutsos C，Carbonell J（2009）PaCK:k-partite图上的可缩放无参数聚类。摘自：2006年SIAM国际数据挖掘会议记录，SDM’09，SIAM，第1278-1287页
[83]	何X，冯J，C厂（2011）图中信息丰富节点的自动定位。摘自：第11届IEEE国际数据挖掘研讨会会议记录，ICDMW'11，IEEE计算机学会，第941-948页，doi:10.1109/ICDMW.2011.37
[84]	He X，Feng J，Konte B，Mai ST，Plant C（2014）分类数据上的相关重叠子空间聚类。收录：第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’14，ACM，第213-222页，doi:10.1145/2623330.2623652
[85]	Heierman EO，Cook DJ（2003）通过发现定期发生的设备使用模式来改进家庭自动化。收录于：第三届IEEE数据挖掘国际会议论文集，ICDM’03，IEEE计算机学会，第537-540页，doi:10.1109/ICDM.2003.1250971
[86]	Heierman EO、Youngblood GM、Cook DJ（2004）挖掘时间序列以发现有趣的模式。摘自：第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’19，ACM
[87]	Heikinheimo H，Siebes A，Vreeken J，Mannila H（2009）低能量集选择。摘自：2009年SIAM国际数据挖掘会议记录，SDM'09，SIAM，第569-580页，doi:10.1137/1.9781611972795.49
[88]	Hess S、Piatkowski N、Morik K（2014）《树中的描述性模式》。收录：2014年LWA会议记录（Lernen，Wissen，Adaption）研讨会：KDML，IR，FGWM
[89]	Hess，S。；莫里克（Morik，K.）。；Piatkowski，N.，《PRIMPING例程-通过最近交替线性化最小化进行平铺》，《Data Min Knowl Disc》，31，4，1090-1131（2017）·Zbl 1409.68233号 ·doi:10.1007/s10618-017-0508-z
[90]	Hinrichs F，Vreeken J（2017）描述序列数据库之间的差异和范数。摘自：2017年ECML/PKDD数据挖掘与自然语言处理互动研讨会论文集
[91]	Hu B，Rakthanmanon T，Hao Y，Evans S，Lonardi S，Keogh E（2011）使用MDL发现时间序列的内在基数和维数。摘自：第十一届IEEE国际数据挖掘会议论文集，ICDM’11，IEEE计算机学会，第1086-1091页，doi:10.1109/ICDM.2011.54·Zbl 1403.68189号
[92]	Hu B，Rakthanmanon T，Hao Y，Evans S，Lonardi S，Keogh E（2013）使用MDL探索时间序列的内在基数和维数。摘自：Ray Solomonoff第85届纪念会议论文集，算法概率和朋友。贝叶斯预测和人工智能，Springer，第184-197页，doi:10.1007/978-3642-44958-1_14·兹比尔1403.68189
[93]	胡，B。；Rakthanmanon，T。；Hao，Y。；埃文斯，S。；Lonardi，S。；Keogh，E.，使用最小描述长度发现时间序列的内在基数和维数，Data Min Knowl Disc，29，2，358-399（2015）·Zbl 1403.68190号 ·doi:10.1007/s10618-014-0345-2
[94]	易卜拉欣，A。；Sastry，S。；Sastry，PS，《从事件序列中发现压缩连续剧》，《Knowl Inf Syst》，47，2，405-432（2016）·doi:10.1007/s10115-015-0854-3
[95]	Jaroszewicz S，Simovici DA（2004）使用贝叶斯网络作为背景知识的频繁项集的有趣性。摘自：第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’04，ACM，第178-186页，doi:10.1145/1014052.1014074
[96]	江M，Faloutsos C，Han J（2016）《CatchTartan：动态多语境行为的表征与总结》。收录：第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’16，ACM，第945-954页，doi:10.1145/2939672.29339749
[97]	Jonyer，I。；支架，LB；Cook，DJ，基于Mdl的无上下文图文法归纳与应用，国际Artif Intell Tools，13，1，65-79（2004）·doi:10.1142/S0218213004001429
[98]	Kameya Y（2011）通过基于MDL的直方图密度估计实现时间序列离散化。摘自：第23届IEEE人工智能工具国际会议论文集，ICTAI’11，IEEE计算机学会，第732-739页，doi:10.1109/ICTAI.2011.115
[99]	Kang U，Faloutsos C（2011）《超越‘穴居人社区’：图形压缩和挖掘的中心和辐条》。摘自：第11届IEEE国际数据挖掘会议记录，ICDM’11，IEEE计算机学会，第300-309页，doi:10.1109/ICDM.2011.26
[100]	Ketkar NS、Holder LB、Cook DJ（2005）《征服：图形数据中基于压缩的频繁模式发现》。收录：第一届开源数据挖掘国际研讨会论文集：频繁模式挖掘实现，OSDM’05，ACM，第71-76页，doi:10.1145/1133905.1133915
[101]	Khan KU（2015）使用局部敏感散列的基于集合的无损图摘要方法。摘自：第31届IEEE国际数据工程研讨会会议记录，ICDEW'15，IEEE计算机学会，第255-259页，doi:10.1109/ICDEW.2015.7129586
[102]	Khan KU，Nawaz W，Lee YK（2014）基于集合的属性图摘要统一方法。收录：第四届IEEE大数据和云计算国际会议论文集，BDCloud’14，IEEE计算机学会，第378-385页，doi:10.1109/BDCloud.2014.108
[103]	Khan KU，Nawaz W，Lee YK（2015a）使用稠密子图发现的无损图摘要。摘自：《第九届全球信息管理与通信国际会议论文集》，IMCOM’15，ACM，第1-7页，doi:10.1145/2701126.2701157
[104]	堪萨斯州Khan；纳瓦兹，W。；Lee，YK，基于集合的无损图形摘要近似方法，计算，97，12，1185-1207（2015）·Zbl 1347.68370号 ·doi:10.1007/s00607-015-0454-9
[105]	Kiernan J，Terzi E（2008）构建大型事件序列的综合总结。在：第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD'08，ACM，第417-425页，doi:10.1145/1401890.1401943
[106]	Kiernan，J。；Terzi，E.，《构建大型事件序列的综合摘要》，《美国医学会关于从数据中发现知识的汇刊》，3，4，21:1-21:31（2009）·doi:10.145/1631162.1631169
[107]	Kiernan J，Terzi E（2009b）EventSummarizer：总结大型事件序列的工具。摘自：《第十二届扩展数据库技术国际会议论文集：数据库技术的进展》，EDBT'09，ACM，第1136-1139页，doi:10.1145/1516360.1516497
[108]	Koivisto M，Perola M，Varilo T，Hennah W，Ekelund J，Lukk M，Peltonen L，Ukkonen E，Mannila H（2002）一种MDL方法，用于发现单倍型块和估计单倍型区块边界的强度。收录：2003年太平洋生物计算研讨会论文集，PSB'03，世界科学，第502-513页，doi:10.1142/978812776303_0047·Zbl 1256.92038号
[109]	Kontkanen P，Myllymäki P（2007）MDL直方图密度估计。摘自：《第十一届国际人工智能与统计会议记录》，AISTATS’07，第219-226页
[110]	Kontonasios KN，De Bie T（2012）形式化复杂先验信息以量化频繁模式集的主观兴趣。摘自：第十一届智能数据分析进展国际研讨会论文集，IDA’12，Springer，第161-171页
[111]	Kontonasios KN，Vreeken J，De Bie T（2013）迭代识别实际数据中主观有趣结构的最大熵模型。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’13，Springer，pp 256-271
[112]	Koopman A，Siebes A（2008）高效发现关系项目集。摘自：2008年SIAM国际数据挖掘会议记录，SDM'08，SIAM，第108-119页，doi:10.1137/1.9781611972788.10
[113]	Koopman A，Siebes A（2009）《特征关系模式》。摘自：第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’09，ACM，第437-446页，doi:10.1145/1557019.1557071
[114]	Koutra D，Kang U，Vreeken J，Faloutsos C（2014）VOG：总结和理解大图形。摘自：2014年SIAM国际数据挖掘会议记录，SDM’14，SIAM，第91-99页，doi:10.1137/1.9781611973440.11·Zbl 07260433号
[115]	库特拉，D。；Kang，U。；弗里肯，J。；Faloutsos，C.，《总结和理解大图形》，《统计分析和数据挖掘》，第8、3、183-202页（2015年）·Zbl 07260433号 ·doi:10.1002/sam.11267
[116]	Lakshmanan LVS，Ng RT，Wang CX，Zhou X，Johnson TJ（2002）《概括MDL方法》。载：第28届超大数据库国际会议论文集，VLDB'02，VLDBEndowment，第766-777页
[117]	Lam HT、Mörchen F、Fradkin D、Calders T（2012）《挖掘压缩序列模式》。在：2012年SIAM国际数据挖掘会议记录，SDM’12，SIAM，第319-330页，doi:10.137/1.9781611972825.28·Zbl 07260381号
[118]	Lam HT、Calders T、Yang J、Mörchen F、Fradkin D（2013）《拉链：挖掘流中的压缩序列模式》。摘自：交互式数据探索与分析研讨会论文集，IDEA@KDD’13，ACM，第54-62页，doi:10.1145/2501511.2501520
[119]	Lam HT，Kiseleva J，Pechenizkiy M，Calders T（2014a）使用压缩算法将序列分解为独立的子序列。摘自：交互式数据探索与分析研讨会论文集，IDEA@KDD’14，第67-75页
[120]	Lam，HT；Mörchen，F。；弗拉德金，D。；Calders，T.，挖掘压缩序列模式，统计分析数据挖掘，7，1，34-52（2014）·Zbl 07260381号 ·doi:10.1002/sam.11192
[121]	Lee K，Jo H，Ko J，Lim S，Shin K（2020）SSumM：海量图的稀疏摘要。摘自：第26届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’20，ACM，第144-154页，doi:10.1145/3394486.3403057
[122]	LeFevre K，Terzi E（2010）GraSS：图形结构概述。摘自：2010年SIAM国际数据挖掘会议记录，SDM’10，SIAM，第454-465页，doi:10.1137/1.9781611972801.40
[123]	Lim，Y。；Kang，U。；Faloutsos，C.，《SlashBurn:洞穴人社区以外的图形压缩和挖掘》，IEEE Trans Knowl Data Eng，26，12，3077-3089（2014）·doi:10.1109/TKDE.2014.2320716
[124]	Liu Y，Shah N，Koutra D（2015）图聚类方法的总结能力的实证比较。arXiv:1511.06820号
[125]	Liu Y，Safavi T，Shah N（2016）《将百万节点图简化为几个结构模式：统一方法》。在：第12届图形挖掘与学习国际研讨会论文集，MLG@KDD'16，第8页
[126]	刘，Y。；萨法维，T。；Dighe，A。；Koutra，D.，《图形摘要方法和应用：一项调查》，ACM Computing Surveys，51，3，62:1-62:34（2018）·数字对象标识代码：10.1145/3186727
[127]	刘，Y。；萨法维，T。；沙阿，N。；Koutra，D.，将大图简化为小超图：一种统一的方法，Soc Netw Anal Min，8，1，17（2018）·doi:10.1007/s13278-018-0491-4
[128]	Lucchese C，Orlando S，Perego R（2010a）挖掘二进制数据集的生成模式模型。摘自：2010年ACM应用计算研讨会论文集，SAC’10，ACM，第1109-1110页，doi:10.1145/1774088.1774320
[129]	Lucchese C，Orlando S，Perego R（2010b）在存在噪声的情况下从二进制数据集挖掘top-k模式。摘自：2007年SIAM国际数据挖掘会议记录，SDM’07，SIAM，第165-176页，doi:10.1137/1.9781611972801.15
[130]	Lucchese，C。；南奥兰多。；Perego，R.，挖掘近似顶部二进制模式的统一框架，IEEE Trans Knowl Data Eng，26，12，2900-2913（2014）·doi:10.1109/TKDE.2013.181
[131]	Makhalova T（2021）对模式集挖掘的贡献：从复杂数据集到重要且有用的模式集。洛林大学博士论文，https://hal.univ-loraine.fr/tel-03342124
[132]	Makhalova T，Trnecka M（2019）基于MDL的自下布尔矩阵因式分解算法。arXiv:1901.09567·Zbl 07363864号
[133]	Makhalova，T。；Trnecka，M.，基于MDL的From-below布尔矩阵因式分解算法，高级数据分析分类，15，1，37-56（2021）·Zbl 07363864号 ·doi:10.1007/s11634-019-00383-6
[134]	Makhalova T、Kuznetsov SO、Napoli A（2018a）关于MDL对FCA的作用的首次研究。摘自：《第十五届概念格及其应用国际会议论文集》，CLA'18，第25-36页
[135]	Makhalova T，Kuznetsov SO，Napoli A（2018b）FCA的MDL：有背景知识的地方吗？摘自：第六届国际研讨会论文集“FCA能为人工智能做什么？”@IJCAI/ECAI'18，CEUR研讨会论文集，第2149卷，第45-56页，http://ceur-ws.org/Vol-2149/paper5.pdf
[136]	Makhalova T、Kuznetsov SO、Napoli A（2019a）通过压缩进行数值模式挖掘。收录：《数据压缩会议论文集》，DCC'19，第112-121页，doi:10.1109/DCC.2019.00019
[137]	Makhalova T、Kuznetsov SO、Napoli A（2019b）关于模式挖掘中FCA和MDL的耦合。收录：《形式概念分析国际会议论文集》，FCA’19，Springer，第332-340页，doi:10.1007/978-3-030-21462-3_23·兹比尔1529.68263
[138]	Makhalova T，Kuznetsov SO，Napoli A（2020）铸币厂：基于MDL的INTeresting数字模式集挖掘方法。arXiv公司：2011.14843·Zbl 1494.68223号
[139]	Makhalova T，Kuznetsov SO，Napoli A（2021）模式挖掘的可能发生项集。摘自：第六届国际研讨会论文集“FCA能为人工智能做什么？”@IJCAI'21，CEUR研讨会论文集，第2972卷，第39-50页，http://ceur-ws.org/Vol-2972/paper4.pdf
[140]	Makhalova，T。；库兹涅佐夫，SO；Napoli，A.，Mint:基于MDL的挖掘INTeresting数字模式集的方法，Data Min Knowl Disc，36，1，108-145（2022）·Zbl 1494.68223号 ·doi:10.1007/s10618-021-00799-9
[141]	Mampaey M（2010）挖掘项目集之间的非冗余信息理论依赖性。摘自：《第十二届数据仓库和知识发现国际会议论文集》，DaWaK’10，Springer，第130-141页，doi:10.1007/978-3642-15105-7_11
[142]	Mampaey M，Vreeken J（2010）通过聚类项目总结数据。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’10，第321-336页，doi:10.1007/978-3642-15883-4_21
[143]	哺乳动物，M。；Vreeken，J.，通过聚类属性总结分类数据，data Min Knowl Disc，26，1，130-173（2013）·Zbl 1260.68339号 ·doi:10.1007/s10618-011-0246-6
[144]	Mampaey M，Tatti N，Vreeken J（2011）告诉我我需要知道的：用项目集简明扼要地总结数据。收录：第17届ACM SIGKDD国际知识发现和数据挖掘会议论文集，KDD’11，ACM，第573-581页，doi:10.1145/2020408.2020499
[145]	哺乳动物，M。；弗瑞肯，J。；Tatti，N.，《用信息量最大的项目集简明扼要地总结数据》，《ACM从数据中发现知识的交易》，6，4，16:1-16:42（2012）·doi:10.1145/2382577.2382580
[146]	Mannila H，Toivonen H，Verkamo AI（1994）发现关联规则的有效算法。摘自：KDD研讨会论文集，人工智能发展协会，第181-192页
[147]	Mannila，H。；科维斯托，M。；佩罗拉，M。；瓦里洛，T。；Hennah，W。；埃克伦德，J。；卢克，M。；佩尔顿，L。；Ukkonen，E.，最小描述长度块查找器，一种识别单倍型块并比较块边界强度的方法，《美国人类遗传学杂志》，73，1，86-94（2003）·Zbl 1256.92038号 ·doi:10.1086/376438
[148]	Markham TS、Evans S、Impson J、Steinbrecher E（2009）基于增量MDL的两部分压缩算法在模型推理中的实现。摘自：2009年数据压缩会议记录，DCC'09，pp 322-331，doi:10.1109/DCC.2009.66
[149]	Matsubara Y、Sakurai Y、Faloutsos C（2014）AutoPlait:共同进化时间序列的自动挖掘。摘自：2014年ACM SIGMOD国际数据管理会议记录，SIGMOD'14，ACM，第193-204页，doi:10.1145/2588555.2588556
[150]	Miettinen P，Vreeken J（2011）布尔矩阵因式分解的模型顺序选择。摘自：第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’11，ACM，第51-59页，doi:10.1145/2020408.2020424
[151]	Miettinen，P。；Vreeken，J.，MDL4BMF:布尔矩阵因式分解的最小描述长度，ACM Transactions on Knowledge Discovery from Data，8，4，18:1-18:31（2014）·数字对象标识代码：10.1145/2601437
[152]	Mitra S，Sastry PS（2019）《用连续事件总结事件序列：统计模型和应用》。arXiv:1904.00516
[153]	Navlakha S、Rastogi R、Shrivastava N（2008）《有界误差的图形摘要》。摘自：2008年ACM SIGMOD国际数据管理会议记录，SIGMOD'08，ACM，第419-432页，doi:10.1145/1376616.1376661
[154]	Nguyen，高压；穆勒，E。；弗瑞肯，J。；Böhm，K.，多元数据的非监督交互保护离散化，data Min Knowl Disc，28，5，1366-1397（2014）·Zbl 1342.62001号 ·doi:10.1007/s10618-014-0350-5
[155]	Otaki K，Yamamoto A（2015）基于MDL的模式摘要的晶格编辑操作。In:ICFCA’15形式概念分析与应用国际研讨会论文集
[156]	Papadimitriou S，Gionis A，TsaparasP，Väisänen RA，Mannila H，Faloutsos C（2005）使用MDL的无参数空间数据挖掘。摘自：第五届IEEE国际数据挖掘会议论文集，2005年，IEEE计算机学会，第346-353页，doi:10.1109/ICDM.2005.117
[157]	Papadimitriou S，Sun J，Faloutsos C，Yu PS（2008）分层、无参数社区发现。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’08，Springer，第170-187页，doi:10.1007/978-3-540-87481-2_12
[158]	Phan NH、Ienco D、Poncelet P、Teisseire M（2013）通过压缩挖掘代表性运动模式。In:Advances In Knowledge Discovery and Data Mining，Springer，第314-326页，doi:10.1007/978-3642-37453-1_26
[159]	Plant C、Biedermann S、Böhm C（2020）《数据压缩作为图形绘制和表示学习的综合框架》。收录：第26届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’20，ACM，pp 1212-1222，doi:10.1145/3394486.3403174
[160]	普拉卡什，BA；弗瑞肯，J。；Faloutsos，C.，《在一个大图形中有效地找出流行病的起点》，《知识信息系统》，38，1，35-59（2014）·doi:10.1007/s10115-013-0671-5
[161]	普伦萨，HM；van Leeuwen，M.，基于MDL规则列表的可解释多类分类，《信息科学》，5121372-1393（2020）·doi:10.1016/j.ins.2019.10.050
[162]	Proença HM，van Leeuwen M（2020b）基于MDL的规则列表的可解释多类分类。arXiv:1905.00328号
[163]	Proença HM，Grünwald PD，Bäck T，van Leeuwen M（2020）使用MDL发现数字目标的杰出子组列表。摘自：欧洲机器学习会议论文集和数据库中知识发现的原则与实践，ECML/PKDD’20
[164]	Proença HM，Bäck T，van Leeuwen M（2021a）稳健亚群发现。arXiv公司：2103.13686
[165]	Proença HM、Grünwald PD、Bäck T、van Leeuwen M（2021b）使用MDL发现数字目标的杰出子组列表。arXiv:2006.09186
[166]	Puolamäki，K。；Oikarinen，E。；Kang，B。；Lijffijt，J。；De Bie，T.，《带有主观反馈的交互式可视化数据探索：信息理论方法》，《data Min Knowl Disc》，第34、1、21-49页（2020年）·doi:10.1007/s10618-019-00655-x
[167]	Rakthanmanon T，Keogh EJ，Lonardi S，Evans S（2011）时间序列扩展：聚类时间序列流需要忽略一些数据。摘自：第11届IEEE国际数据挖掘会议记录，ICDM’11，IEEE计算机学会，第547-556页，doi:10.1109/ICDM.2011.146
[168]	Rakthanmanon，T。；EJ基奥；Lonardi，S。；Evans，S.，基于MDL的时间序列聚类，Knowl Inf Syst，33，2371-399（2012）·doi:10.1007/s10115-012-0508-7
[169]	拉希迪，P。；库克，DJ，COM：一种在家庭健康监测系统中挖掘和监测人类活动模式的方法，ACM智能系统与技术汇刊，4，4，64:1-64:20（2013）·doi:10.1145/2508037.2508045
[170]	Rissanen，J.，《用最短数据描述建模》，Automatica，14，5，465-471（1978）·Zbl 0418.93079号 ·doi:10.1016/0005-1098（78）90005-5
[171]	罗哈斯，A。；Calatayud，J。；科瓦列夫斯基，M。；纽曼，M。；Rosvall，M.，显生宙化石记录的多尺度视图揭示了三种主要的生物转变，通信生物学，4，1，1-8（2021）·doi:10.1038/s42003-021-01805-y
[172]	罗斯瓦尔，M。；CT Bergstrom，《解决复杂网络中社区结构的信息理论框架》，《国家科学院学报》，104、18、7327-7331（2007）·doi:10.1073/pnas.0611034104
[173]	罗斯瓦尔，M。；康涅狄格州伯格斯特罗姆，《复杂网络上随机漫步的地图揭示了社区结构》，《国家科学院学报》，105，4，1118-1123（2008）·doi:10.1073/pnas.0706851105
[174]	罗斯瓦尔，M。；伯格斯特罗姆（Bergstrom），康涅狄格州，《绘制大型网络中的变化》（Mapping change in large networks），《公共科学图书馆·综合》（PLoS ONE），5，1，1-7（2010）·doi:10.1371/journal.pone.0008694
[175]	罗斯瓦尔，M。；Bergstrom，CT，《网络上随机漫步的多级压缩揭示了大型集成系统中的分层组织》，《公共科学图书馆·综合》，6，4（2011）·doi:10.1371/journal.pone.0018209
[176]	罗斯瓦尔，M。；Axelsson，D。；康涅狄格州伯格斯特罗姆，《地图方程》，《欧洲物理杂志专题》，178，1，13-23（2009）·doi:10.1140/epjst/e2010-01179-1
[177]	Sampson O，Berthold MR（2014）《拓宽KRIMP：通过多样化并行实现更好的性能》。摘自：第13届智能数据分析进展国际研讨会论文集，IDA’14，Springer，第276-285页，doi:10.1007/978-3-319-12571-8_24
[178]	Saran，D。；Vreeken，J.，《使用MDL总结动态图》。技术代表（2019年），德国：萨尔州大学，德国
[179]	Shah N，Koutra D，Zou T，Gallagher B，Faloutsos C（2015）TimeCrunch：可解释的动态图摘要。收录：第21届ACM SIGKDD国际知识发现和数据挖掘会议论文集，KDD’15，ACM，pp 1055-1064，doi:10.1145/2783258.2783321
[180]	沙阿，N。；库特拉，D。；Jin，L.等人。；邹，T。；加拉赫，B。；Faloutsos，C.，《关于总结大规模动态图》，IEEE数据工程公告，40，3，75-88（2017）
[181]	香农，CE，通信数学理论，贝尔系统技术杂志，27，3，379-423（1948）·Zbl 1154.94303号 ·doi:10.1002/j.1538-7305.1948.tb01338.x
[182]	Shokoohi-Yekta M，Chen Y，Campana B，Hu B，Zakaria J，Keogh E（2015）《时间序列中有意义规则的发现》。在：第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD'15，ACM，第1085-1094页，doi:10.145/2783258.2783306
[183]	Siebes A（2012）数据分析查询。摘自：第十一届智能数据分析进展国际研讨会论文集，IDA’12，Springer，第7-22页
[184]	Siebes A（2014）模式挖掘中的MDL：krimp简介。in:形式概念分析国际会议论文集，FCA’14，Springer，pp 37-43，doi:10.1007/978-3-19-07248-7_3·Zbl 1444.68162号
[185]	Siebes A，Kersten R（2011）交易数据的结构函数。摘自：2011年SIAM国际数据挖掘会议记录，SDM’11，SIAM，pp 558-569，doi:10.1137/1.9781611972818.48
[186]	Siebes A，Kersten R（2012）《分类数据平滑》。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’12，Springer，pp 42-57，doi:10.1007/978-3642-33460-3_8
[187]	Siebes A、Vreeken J、van Leeuwen M（2006）压缩项目集。摘自：2006年SIAM国际数据挖掘会议记录，SDM’06，SIAM·Zbl 1235.68071号
[188]	Smets K，Vreeken J（2011）《奇怪的一点：识别和表征异常》。摘自：2011年SIAM国际数据挖掘会议记录，SDM’11，SIAM，第804-815页，doi:10.1137/1.9781611972818.69
[189]	Smets K，Vreeken J（2012）《苗条：直接挖掘描述性模式》。摘自：2012年SIAM国际数据挖掘会议记录，SDM’12，SIAM，第236-247页
[190]	Soulet A、Raíssi C、Plantevit M、Crémilleux B（2011）《天空中的主导模式挖掘》。摘自：第11届IEEE国际数据挖掘会议记录，ICDM’11，IEEE计算机学会，pp 655-664，doi:10.1109/ICDM.2011.100
[191]	Stone，JV，《信息理论：教程介绍》（2013年），谢菲尔德：谢菲尔德Sebtel出版社
[192]	Sun J，Faloutsos C，Papadimitriou S，Yu PS（2007）GraphScope:大型时间演化图的无参数挖掘。收录：第13届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’07，ACM，第687-696页，doi:10.1145/1281192.1281266
[193]	Tanaka Y，Uehara K（2003）使用主成分分析和MDL原理发现多维时间序列中的主题。摘自：《模式识别中的机器学习和数据挖掘第三届国际会议论文集》，MLDM’03，Springer，第252-265页·Zbl 1029.68592号
[194]	田中，Y。；岩本，K。；Uehara，K.，基于MDL原理从多维数据中发现时间序列模体，《马赫学习》，58，2，269-300（2005）·Zbl 1075.62084号 ·doi:10.1007/s10994-005-5829-2
[195]	Tatti N（2010）可能是最好的项目集。在：第16届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD'10，ACM，第293-302页，doi:10.145/1835804.1835843
[196]	Tatti N，Heikinheimo H（2008）项目集的可分解族。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’08，第472-487页，doi:10.1007/978-3-540-87481-2_31
[197]	Tatti N，Vreeken J（2008）通过包装数据找到好的项目集。摘自：第八届IEEE数据挖掘国际会议论文集，ICDM’08，IEEE计算机学会，第588-597页，doi:10.1109/ICDM.2008.39
[198]	Tatti N，Vreeken J（2012a）发现描述性瓷砖树。在：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD'12，施普林格，第9-24页，doi:10.1007/978-3-642-33460-3_6
[199]	Tatti N，Vreeken J（2012b）《它的长与短：用连续事件总结事件序列》。摘自：第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’12，ACM，第462-470页
[200]	van Leeuwen M（2010）重要的模式。乌得勒支大学博士论文
[201]	van Leeuwen，M。；Galbrun，E.，双视图数据中的关联发现，IEEE Trans Knowl data Eng，27，12，3190-3202（2015）·doi:10.1109/TKDE.2015.2453159
[202]	van Leeuwen M，Siebes A（2008）StreamKrimp：检测数据流中的变化。摘自：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD’08，Springer，第672-687页，doi:10.1007/978-3-540-87479-9_62
[203]	van Leeuwen M，Vreeken J（2014）通过压缩挖掘和使用模式集。收录：Frequent Pattern Mining，Springer，pp 165-198，doi:10.1007/978-319-07821-2_8·Zbl 1298.68250号
[204]	van Leeuwen M，Vreeken J，Siebes A（2006）Compression选择了重要的项目集。摘自：《欧洲数据库知识发现会议记录》，PKDD'06，Springer，第585-592页，doi:10.1007/11871637_59
[205]	van Leeuwen M、Bonchi F、Sigurbjörnsson B、Siebes A（2009a）压缩标签以查找有趣的媒体组。收录：第18届ACM信息和知识管理会议记录，CIKM'09，ACM，第1147-1156页，doi:10.1145/1645953.1646099
[206]	van Leeuwen，M。；弗瑞肯，J。；Siebes，A.，《识别组件》，Data Min Knowl Disc，19、2、176-193（2009）·doi:10.1007/s10618-009-0137-2
[207]	van Leeuwen，M。；De Bie，T。；Spyropoulou，E。；Mesnage，C.，子图模式的主观趣味性，Mach Learn，105，1，41-75（2016）·Zbl 1392.68376号 ·doi:10.1007/s10994-015-5539-3
[208]	Vanetik N，Litvak M（2017）使用MDL原则的基于查询的摘要。摘自：2017年MultiLing跨源类型和流派的总结和总结评估研讨会论文集@ACL’17，第22-31页
[209]	Vanetik N，Litvak M（2018）DRIM：基于MDL的快速多样性总结方法。收录：2018 IEEE/WIC/ACM网络智能国际会议论文集，WI'18，第660-663页，doi:10.1109/WI.2018.00-17
[210]	Vespier U、Knobbe A、Nijssen S、Vanschoren J（2012）基于MDL的多时间尺度时间序列分析。在：《欧洲机器学习与数据库知识发现原理与实践会议论文集》，ECML/PKDD'12，施普林格，第371-386页，doi:10.1007/978-3-642-33486-3_24
[211]	Viamontes Esquivel，A。；Rosvall，M.，《流压缩可以揭示网络中的重叠模块组织》，Phys Rev X，1，2（2011）·doi:10.1103/PhysRevX.1.021025
[212]	Vreeken J（2009）使模式挖掘有用。乌得勒支大学博士论文
[213]	Vreeken J，Siebes A（2008）填补空白——针对缺失数据的磷虾最小化。摘自：第八届IEEE数据挖掘国际会议论文集，ICDM’08，IEEE计算机学会，第1067-1072页，doi:10.1109/ICDM.2008.40
[214]	Vreeken J、van Leeuwen M、Siebes A（2007a）《差异表征》。在：第13届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD'07，ACM，第765-774页，doi:10.145/1281192.1281274
[215]	Vreeken J，van Leeuwen M，Siebes A（2007b）通过数据生成保护隐私。摘自：第七届IEEE数据挖掘国际会议论文集，ICDM’07，IEEE计算机学会，第685-690页，doi:10.1109/ICDM.2007.25
[216]	弗瑞肯，J。；van Leeuwen，M。；Siebes，A.，Krimp：压缩的挖掘项集，Data Min Knowl Disc，23，1，169-214（2011）·Zbl 1235.68071号 ·doi:10.1007/s10618-010-0202-x
[217]	Wang P，Wang H，Liu M，Wang W（2010）事件摘要的算法方法。摘自：2010年ACM SIGMOD国际数据管理会议记录，SIGMOD'10，ACM，第183-194页，doi:10.1145/1807167.1807189
[218]	Webb，GI，《发现重要模式》，《马赫学习》，68，1，1-33（2007）·Zbl 1470.68195号 ·数字对象标识代码：10.1007/s10994-007-5006-x
[219]	韦伯，GI；Vreeken，J.，《高效发现最有趣的关联》，《ACM从数据中发现知识的交易》，8，3，15:1-15:31（2013）·数字对象标识代码：10.1145/2601433
[220]	Wiegand B、Klakow D、Vreeken J（2021）从复杂事件日志中挖掘易于理解的模型。摘自：2021年SIAM国际数据挖掘会议记录，SDM’21，SIAM，第244-252页，doi:10.1137/1.9781611976700.28
[221]	Wiegand B、Klakow D、Vreeken J（2022）《可解释数据序列生成器的挖掘》。摘自：第三十六届AAAI人工智能会议论文集，AAAI'22，人工智能促进协会
[222]	Witteveen J、Duivesteijn W、Knobbe A、Grünwald PD（2014）RealKrimp–寻找用MDL压缩实值数据的超区间。摘自：第13届智能数据分析进展国际研讨会论文集，IDA’14，Springer，第368-379页，doi:10.1007/978-3-319-12571-8_32
[223]	Wu D，Gundimeda S，Mou S，Quinn CJ（2020）分段平稳时间序列建模。摘自：《2020 IEEE声学、语音和信号处理国际会议论文集》，ICASSP’20，IEEE计算机学会，第3817-3821页，doi:10.1109/ICSPSP40776.2020.9053470
[224]	严X，程H，韩J，辛D（2005）《项目集模式概述：基于轮廓的方法》。摘自：第十一届ACM SIGKDD知识发现和数据挖掘国际会议论文集，KDD’05，ACM，第314-323页，doi:10.1145/1081870.1081907
[225]	Yan Y，Cao L，Madden S，Rundensteiner EA（2018）SWIFT：从大型事件流中挖掘代表性模式。VLDB Endow程序12（3）：265-277。数字对象标识代码：10.14778/3291264.3291271
[226]	Yang L，Baratchi M，van Leeuwen M（2020）基于二维MDL直方图的无监督离散化。arXiv:2006.01893年
[227]	Youngblood GM、Heierman EO、Cook DJ、Holder LB（2005）通过智能环境领域的数据挖掘技术实现HPOMDP的自动化构建。摘自：第十八届佛罗里达国际人工智能研究会会议记录，FLAIRS'05
[228]	Yurov M，Ignatov DI（2017）在压缩的属性条件对集上将磷虾转化为三聚类技术。摘自：《粗糙集国际联合会议论文集》，IJCRS’17，Springer，pp 558-569，doi:10.1007/978-319-60840-2_40
[229]	Zhao P，Zhao Q，Zhang C，Su G，ZhangQ，Rao W（2019）CLEAN:道路网络上基于频繁模式的轨迹时空压缩。摘自：第20届IEEE移动数据管理国际会议论文集，MDM’19，IEEE计算机学会，第605-610页，doi:10.1109/MDM.2019.00127

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

模式挖掘的最小描述长度原则：综述。 （英语） Zbl 1509.68240号

MSC公司：

关键词：

软件：

参考文献：

模式挖掘的最小描述长度原则：综述。（英语） Zbl 1509.68240号