×

最小命中集生成问题:算法和计算。 (英文) Zbl 1352.68279号

摘要:为给定的集合族找到包含最小命中集(MHS)是一个基本的组合问题,在布尔代数、计算生物学和数据挖掘等领域都有应用。尽管文献中有许多算法可用于生成这些MHS,但应用论文通常在选择一种算法(或引入新算法)之前只考虑少数算法,这表明需要进行全面调查和性能比较。我们介绍了其中的几个应用程序,讨论了MHS生成在每个领域中的应用以及使用了哪些算法,为来自不同领域的研究人员提供了这些应用程序的统一视图。考虑到MHS的历史、分类和有用特征,我们调查了21种不同领域的MHS生成算法。我们提供了17种算法的公共软件实现的一整套基准测试的结果,其中包括我们在C++中自己实现的6种算法,强调了文献中实际应用程序中的问题实例。我们发现,实际中速度最快的算法并不是那些复杂度界限最紧的算法,也不是应用程序中最常用的算法,这表明,对于给定的应用程序,从广泛的可用算法中进行基准测试将有助于更好的选择。最后,我们提供了这些软件实现的公共存储库,作为基于AlgoRun框架的现成、平台-认知Docker容器,因此感兴趣的计算科学家可以使用他们自己研究领域的输入轻松执行类似的测试,要么在他们自己的计算机上,要么通过一个方便的Web界面,要么将算法部署到他们自己的分析管道中。

MSC公司:

68周05 非数值算法
68卢比 计算机科学中的组合数学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] R.Abreu和A.J.van Gemund,{低成本近似最小命中集算法及其在基于模型诊断中的应用},摘自《抽象、重构和近似研讨会》,第9卷,AAA I出版社,加利福尼亚州门罗公园,2009年,第2-9页。
[2] R.Agrawal、T.Imielin⁄ski和A.Swami,{\it挖掘大型数据库中项目集之间的关联规则},载于《ACM SIGMOD记录》,22(1993),第207-216页。
[3] R.Agrawal、H.Mannila、R.Srikant、H.Toivonen和A.I.Verkamo,《关联规则的快速发现》,《知识发现和数据挖掘进展》,U.M.Fayyad、G.Piatestky Shapiro、P.Smyth和R.Uthursamy编辑,AAAI/MIT出版社,加利福尼亚州门洛帕克,1996年,第307-328页。
[4] J.Bailey,T.Manoukian和K.Ramamohanarao,{计算超图横截的快速算法及其在挖掘新兴模式中的应用},《第三届IEEE数据挖掘国际会议论文集》,IEEE,Piscataway,2003年,新泽西州,第485-488页。
[5] C.Beeri、R.Fagin、D.Maier和M.Yannakakis,《论非循环数据库方案的可取性》,J.ACM,30(1983),第479-513页·Zbl 0624.68087号
[6] C.Berge,{超图:有限集的组合数学},North-Holland数学。阿姆斯特丹爱思唯尔45号图书馆,1984年。
[7] J.C.Bioch和T.Ibaraki,{正布尔函数识别和二元化的复杂性},Inform。和计算。,123(1995),第50-63页·Zbl 1096.68633号
[8] E.Boros、K.Elbassioni、V.Gurvich、L.Khachiyan和K.Makino,{双有界生成问题:单调线性不等式组的所有最小整数解},SIAM J.Compute。,31(2002),第1624-1643页·Zbl 1041.68064号
[9] E.Boros,K.Elbassioni,V.Gurvich,K.Makino,and V.Oudalov,{禁止的(2×2)子博弈下双矩阵博弈中Nash均衡存在的充分条件},国际博弈论,(2015),第1-21页·Zbl 1388.91003号
[10] E.Boros、K.Elbassioni和K.Makino,{单调布尔二元化的左右乘法},SIAM J.Compute。,39(2010),第3424-3439页·Zbl 1213.68327号
[11] E.Boros、V.Gurvich、L.Khachiyan和K.Makino,{关于生成最大频繁集和最小不频繁集的复杂性},载于2002年STACS,柏林斯普林格出版社,2002年,第133-141页·Zbl 1054.68072号
[12] E.Boros、V.Gurvich、L.Khachiyan和K.Makino,{关于二进制矩阵中的最大频繁集和最小不频繁集},《数学年鉴》。Artif公司。智力。,39(2003),第211-221页·Zbl 1038.68041号
[13] E.Boros和K.Makino,{单调对偶问题的快速简单并行算法},收录于《自动机,语言与编程》,柏林斯普林格出版社,2009年,第183-194页·Zbl 1248.68546号
[14] R.E.Bryant,{布尔函数操作的基于图形的算法},计算。,IEEE传输。,100(1986),第677-691页·Zbl 0593.94022号
[15] N.Cardoso和R.Abreu,{\it\(MHS^{\,2}\):一种Map-Reduce启发式驱动的最小命中集搜索算法},收录于《多核软件工程、性能和工具》,《计算讲义》。科学。8063,柏林施普林格出版社,2013年,第25-36页。
[16] B.DasGupta、P.Vera-Licona和E.Sontag,{从通用组合方法对分子网络进行逆向工程},收录于《计算分子生物学算法:技术、方法和应用》,Wiley Ser。生物信息。,M.Elloumi和A.Y.Zomaya主编,牛津威利出版社,2010年,第941-953页。
[17] C.Domingo,N.Mishra和L.Pitt,{通过成员查询学习实现高效的只读受限单调CNF/DNF二元化},Mach。学习。,37(1999),第89-110页·兹比尔0948.68097
[18] G.Dong和J.Li,{从数据集对中挖掘新兴模式的边界描述},Knowl。通知。系统。,8(2005),第178-202页。
[19] T.Eiter和G.Gottlob,{识别超图的最小横截及相关问题},SIAM J.Compute。,24(1995),第1278-1304页·Zbl 0842.05070号
[20] T.Eiter,G.Gottlob,and K.Makino,{关于单调对偶和生成超图断面}的新结果,SIAM J.Compute。,32(2003),第514-537页·Zbl 1052.68101号
[21] T.Eiter、K.Makino和G.Gottlob,《单调二元化的计算方面:简要调查》,《离散应用》。数学。,156(2008),第2035-2049页·Zbl 1160.68016号
[22] K.Elbassioni,M.Hagen,and I.Rauf,{\it-超图对偶的一些固定参数可处理类和相关问题},《参数化和精确计算》,《计算讲义》。科学。5018 Springer,柏林,2008年,第91-102页·兹比尔1142.68455
[23] K.M.Elbassioni,{关于单调CNF/DNF对偶的乘法复杂性},《算法ESA 2006》,《计算讲义》。科学。4168 Springer,伦敦,2006年,第340-351页·Zbl 1131.68463号
[24] K.M.Elbassioni,{关于单调对偶和生成最小超图横截的复杂性},离散应用。数学。,156(2008),第2109-2123页·Zbl 1160.68017号
[25] K.M.Elbassioni、M.Hagen和I.Rauf,{HBC横向超图生成的下限},基金。通知。,130(2014),第409-414页·Zbl 1359.68127号
[26] R.Fagin,{超图和关系数据库模式的非循环度},J.ACM,30(1983),第514-550页·Zbl 0624.68088号
[27] M.L.Fredman和L.Khachiyan,{论单调析取范式对偶的复杂性},《算法》,21(1996),第618-628页·Zbl 0864.68038号
[28] K.Geurts、G.Wets、T.Brijs和K.Vanhoof,{使用关联规则对高频事故地点进行分析},运输。研究记录J.运输。Res.Board,1840(2003),第123-130页。
[29] D.R.Grayson和M.E.Stillman,{麦考利2]。
[30] R.Greiner、B.A.Smith和R.W.Wilkerson,《Reiter诊断理论中算法的修正》,《人工智能》,41(1989),第79-88页·Zbl 0678.68101号
[31] D.Gunopulos、H.Mannila、R.Khardon和H.Toivonen,{数据挖掘、超图横向和机器学习},第十六届ACM SIGACT-SIGMOD-SIGART数据库系统原理研讨会论文集,ACM,纽约,1997年,第209-216页。
[32] O.Haídicke和S.Klamt,{使用约束最小割集计算复杂代谢干预策略},Metabol。《工程》,13(2011),第204-213页。
[33] M.Hagen,{MONET的算法和计算复杂性问题},rer博士。nat.,Friedrich-Schiller-Universita­t Jena,德国耶拿,2008年。
[34] M.Hagen,{\it横向超图生成的三种算法的下界},离散应用程序。数学。,157(2009),第1460-1469页·Zbl 1177.05116号
[35] M.Hagen、P.Horatschek和M.Mundhenk,《两种Fredman-Khachiyan算法的实验比较》,摘自2009年第十一届算法工程与实验研讨会论文集(ALENEX),SIAM,费城,2009年,第154-161页·Zbl 1430.68472号
[36] U.-U.Haus、S.Klamt和T.Stephen,《代谢网络中的计算淘汰策略》,J.Compute。生物学,15(2008),第259-268页。
[37] C.Hébert、A.Bretto和B.Crémilleux,《改进超图最小横向计算的数据挖掘形式化》,基金。通知。,80(2007年),第415-434页·Zbl 1128.68032号
[38] A.Hosny、P.Vera-Licona、R.Laubenbacher和T.Favre,{\it AlgoRun:基于Docker的平台生成实现算法封装系统},生物信息。,32(2016),第2396-2398页。
[39] T.E.Ideker、V.Thorsson和R.M.Karp,《通过扰动发现调节相互作用:推断和实验设计》,载于《太平洋生物计算研讨会》,2000年第5卷,第302-313页。
[40] A.S.Jarrah、R.Laubenbacher、B.Stigler和M.Stillman,《多项式动力系统的逆向工程》,高级应用。数学。,39(2007),第477-489页·Zbl 1129.93026号
[41] M.N.Jelassi,C.Largeron和S.Ben Yahia,{超图最小断面的简明表示:依赖推理问题的方法和应用},IEEE第九届信息科学研究挑战国际会议,2015,IEEE,新泽西州皮斯卡塔韦,2015,pp.434-444。
[42] D.S.Johnson、M.Yannakakis和C.H.Papadimitriou,《关于生成所有最大独立集》,Inform。过程。莱特。,27(1988),第119-123页·Zbl 0654.68086号
[43] R.M.Karp,{组合问题中的可约性},《计算机计算复杂性》,IBM Res.Symp。序列号。,R.E.Miller、J.W.Thatcher和J.D.Bohlinger编辑,Springer,纽约,第85-103页·Zbl 0366.68041号
[44] D.J.Kavvadias和E.C.Stavropoulos,{单音布尔二元化在(text{co-NP}[\log 2^n])},Inform。过程。莱特。,85(2003),第1-6页·Zbl 1051.68140号
[45] D.J.Kavvadias和E.C.Stavropoulos,{它是生成横向超图的有效算法。},《图形算法应用》。,9(2005),第239-264页·Zbl 1088.05069号
[46] L.Khachiyan、E.Boros、K.Elbassioni和V.Gurvich,{\it超图横向问题的一种新算法},《计算与组合学计算讲义》。科学。,3595,柏林施普林格出版社,2005年,第767-776页·Zbl 1128.05306号
[47] L.Khachiyan、E.Boros、K.Elbassioni和V.Gurvich,{生成超图断面的拟多项式算法的有效实现及其在联合生成中的应用},离散应用。数学。,154(2006),第2350-2372页·Zbl 1110.68104号
[48] L.Khachiyan、E.Boros、K.Elbassioni和V.Gurvich,{超图横向问题的全局并行算法},Inform。过程。莱特。,101(2007),第148-155页·Zbl 1185.68838号
[49] L.Khachiyan、E.Boros、V.Gurvich和K.Elbassioni,{并行计算超图的多个最大独立集},并行过程。莱特。,17(2007),第141-152页。
[50] S.Klamt和E.D.Gilles,{生化反应网络中的最小割集},生物信息。,20(2004),第226-234页。
[51] D.E.Knuth,《组合算法:计算机编程的艺术》第1部分,第4A卷,Addison-Wesley,波士顿,2011年·Zbl 1354.68001号
[52] A.D.Korshunov,{单调布尔函数},俄罗斯数学。调查,58(2003),第929-1001页·Zbl 1072.06008号
[53] C.E.Leiserson、M.Moreno Maza、L.Li和Y.Xie,{偏序集最小元素的并行计算},《第四届并行与符号计算国际研讨会论文集》,美国计算机学会,纽约,2010年,第53-62页。
[54] 李磊,云飞,{用遗传算法计算最小碰集},技术报告,DTIC ADP0126972002。
[55] L.Lin和Y.Jiang,{\it命中集的计算:回顾和新算法},Inform。过程。莱特。,86(2003),第177-184页·Zbl 1173.68827号
[56] H.Mannila和H.Toivoneny,《关于发现所有有趣句子的算法(扩展摘要)》,摘自《第13届欧洲控制论和系统研究会议论文集》,奥地利控制论研究学会,维也纳,1996年,第973-978页。
[57] G.McGuire、B.Tugemann和G.Civario,{\it没有{\it 16}线索数独:通过点击集合枚举}解决数独最小线索数问题,实验数学。,23(2014),第190-217页·Zbl 1296.05008号
[58] E.Miller,《单调理想及其决议的亚历山大对偶性》。预印本,1998年。
[59] N.Mishra和L.Pitt,{生成有界度超图的所有最大独立集},《第十届计算学习理论年会论文集》,美国计算机学会,New Yok,1997年,第211-217页。
[60] K.Murakami和T.Uno,{大规模超图对偶的有效算法},离散应用。数学。,170(2014),第83-94页·Zbl 1288.05188号
[61] K.Murakami和T.Uno,{超图二元化存储库},2014。
[62] I.Pill和T.Quaritsch,{计算最小命中集的布尔方法的优化。},欧洲人工智能会议,阿姆斯特丹爱奥斯,2012年,第648-653页·Zbl 1327.68230号
[63] I.Pill,T.Quaritsch和F.Wotawa,《从冲突到诊断:最小命中集算法的实证评估》,第22届诊断原理国际研讨会,Frannhofer-Gesellschaft,慕尼黑,2011年,第203-210页。
[64] T.Quaritsch和I.Pill,{\it PyMBD:MBD算法库和轻量级评估平台},《Dx-2014学报》,2014年。
[65] R.Reiter,《第一原理诊断理论》,《人工智能》,32(1987),第57-95页·Zbl 0643.68122号
[66] R.Samaga、J.Saez-Rodriguez、L.G.Alexopoulos、P.K.Sorger和S.Klamt,{it EGFR/ErbB信号的逻辑:高通量数据的理论属性和分析},《公共科学图书馆·计算生物学》,5(2009),e1000438。
[67] S.Schuster和C.Hilgetag,《关于稳态生化反应系统中的基本通量模式》,J.Biol。系统,2(1994),第165-182页。
[68] R.H.Shoemaker,《NCI60人类肿瘤细胞系抗癌药物筛选》,《癌症自然评论》,6(2006),第813-823页。
[69] E.C.Stavropoulos、V.S.Verykios和V.Kagklis,《频繁项集隐藏问题的横向超图方法》,Knowl。通知。系统。,47(2015),第625-645页。
[70] K.Takata,{列出超图最小命中集的序列方法的最坏情况分析},SIAM J.离散数学。,21(2007),第936-946页·Zbl 1158.68016号
[71] T.Toda,{二元决策图的超图横向计算},载于《实验算法》第12届国际研讨会,2013年,罗马,施普林格,柏林,2013,第91-102页。
[72] H.Toivonen,{为关联规则对大型数据库进行采样},收录于VLDB,Morgan Kaufmann,旧金山,1996年,第134-145页。
[73] C.T.Trinh、A.Wlaschin和F.Srienc,《基本模式分析:表征细胞代谢的有用代谢途径分析工具》,《应用微生物学》。和生物技术。,81(2009),第813-826页。
[74] A.Vazquez,{最佳药物组合和最小命中集},BMC系统生物学。,3(2009),第81页。
[75] P.Vera-Licona、E.Bonnet、E.Barillot和A.Zinovyev,《OCSANA:网络分析干预措施的最佳组合》,《生物信息》。,29(2013),第1571-1573页。
[76] P.Vera-Licona、A.Jarrah、L.D.Garcia-Pente、J.McGee和R.Laubenbacher,{一种基于代数的基因调控网络推断方法},BMC系统。生物学,8(2014),第1-16页。
[77] P.Vera-Licona、A.Zinovyev、E.Bonnet、I.Kuperstein、O.Kel、A.Kel、T.Dubois、G.Tucker和E.Barillot,《癌症合理组合疗法的基于路径的设计》,《欧洲癌症杂志》,48(2012),S154。
[78] S.Vinterbo和A.Øhrn,{最小近似命中集和规则模板},国际。J.近似原因。,25(2000),第123-143页·Zbl 0968.68139号
[79] A.Von Kamp和S.Schuster,{it Metatool{it 5.0}:快速灵活的基本模式分析},生物信息。,22(2006),第1930-1931页。
[80] R.-S.Wang和R.Albert,{基本信号模式预测信号转导网络组件的重要性},BMC系统。《生物学》,5(2011),第44页。
[81] F.Wotawa,{\它是Reiter的hitting-set算法的变体},Inform。过程。莱特。,79(2001),第45-51页·Zbl 0998.68220号
[82] J.Zanghelini、D.E.Ruckerbauer、M.Hanscho和C.Jungreuthmayer,《基本通量模式:特性、计算和应用》,《生物技术》。J.,8(2013),第1009-1016页。
[83] I.Zevedei-Oncea和S.Schuster,《信令网络中检测信号传输路由的理论框架》,计算。化学。《工程》,29(2005),第597-617页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。