×

(加权)LCS的草图、流和细粒度复杂性。 (英语) Zbl 1528.68426号

Ganguly,Sumit(ed.)等人,第38届IARCS软件技术和理论计算机科学基础年会,FSTTCS 2018,印度艾哈迈达巴德,2018年12月11日至13日。Wadern:达格斯图尔宫——莱布尼茨Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。122,第40条,第16页(2018年)。
摘要:我们研究了小字母字符串上最长公共子序列问题(LCS)的草图绘制和流算法。对于判定字符串\(x),\(y)的LCS是否至少有长度\(L)的问题,我们得到了\(mathcal{O}(L^{|\Sigma|-1}\log L)\)的草图大小和流空间使用量。我们还证明了匹配的无条件下界。
作为一个应用,我们研究了LCS的一个变体,其中每个字母符号都配有一个作为输入给定的权重,任务是计算最大总权重的公共子序列。使用我们的素描算法,我们得到了这个问题的(mathcal{O}(min{nm,n+m^{|\Sigma|}})-时间算法,在长度为(n),(m)的字符串(x),(y)上。假设强指数时间假设,我们证明了该运行时间在低阶因子下的最优性。
关于整个系列,请参见[Zbl 1407.68032号].

MSC公司:

68瓦32 字符串上的算法
68瓦27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Amir Abboud、Arturs Backurs和Virginia Vassilevska Williams。LCS的二次时间硬性和其他序列相似性度量。程序中。第56届IEEE计算机科学基础年会(FOCS’15),第59-78页,2015年。
[2] Amir Abboud、Ryan Williams和Huacheng Yu。多项式方法在算法设计中的更多应用。程序中。2015年第26届ACM-SIAM离散算法年会(SODA'15),第218-230页·Zbl 1372.68282号
[3] Jochen Alber、Jens Gramm、Jiong Guo和Rolf Niedermeier。研究线性时间内带嵌套弧注释序列的最长公共子序列问题。程序中。第13届组合模式匹配年度研讨会(CPM'02),第99-114页,2002年·Zbl 1077.68738号
[4] Helmut Alt和Michael Godau。计算两条多边形曲线之间的Fréchet距离。国际。J.计算。地理。申请。,5(1-2):78-99, 1995. ·Zbl 0941.68809号
[5] Stephen F.Altschul、Warren Gish、Webb Miller、Eugene W.Myers和David J.Lipman。基本本地对齐搜索工具。《分子生物学杂志》,215(3):403-4101990年。
[6] Amihood Amir、Zvi Gotthilf和B.Riva Shalom。加权LCS。离散算法杂志,8(3):273-2812010·Zbl 1197.68086号
[7] 兴延安、杨长彪、曾朝廷和乔伊荷。一种快速简单的算法,用于计算运行长度编码字符串的最长公共子序列。信息处理信函,108(6):360-3642008·Zbl 1191.68818号
[8] 阿尔贝托·阿波斯托利科。提高两个字符串最长公共子序列的Hunt-Szymanski策略的最坏情况性能。信息处理。莱特。,23(2):63-69, 1986. doi:10.1016/0020-0190(86)90044-X·Zbl 0608.68057号 ·doi:10.1016/0020-0190(86)90044-X
[9] 阿尔贝托·阿波斯托利科和康塞蒂娜·格拉。最长的常见子序列问题重温。《算法》,2:316-3361987年。doi:10.1007/BF01840365·Zbl 0636.68083号 ·doi:10.1007/BF01840365
[10] Arturs Backurs和Piotr Indyk。哪些正则表达式模式很难匹配?程序中。第57届IEEE计算机科学基础年会(FOCS’16),第457-466页,2016年。
[11] 贾马尔·贝拉佐圭(Djamal Belazzougui)和张琴(Qin Zhang)。编辑距离:草图绘制、流式处理和文档交换。程序中。第57届计算机科学基础年度研讨会,第51-60页,2016年。
[12] 卡尔·布林曼。为什么遛狗需要时间:除非SETH失败,否则Frechet距离没有强次二次算法。程序中。第55届IEEE计算机科学基础年会(FOCS’14),第661-670页,2014年。doi:10.1109/FOCS。2014.76. ·doi:10.1109/FOCS.2014.76
[13] 卡尔·布林曼(Karl Bringmann)和马文·库内曼(Marvin Künnemann)。弦问题和动态时间扭曲的二次条件下界。程序中。第56届IEEE计算机科学基础年会(FOCS’15),第79-97页,2015年·Zbl 1372.68252号
[14] Karl Bringmann和Marvin Künnemann。最长公共子序列的多元细粒度复杂性。程序中。2018年第29届ACM-SIAM离散算法年会(SODA’18)。出现。40:15 ·Zbl 1403.68369号
[15] 毛罗·卡斯泰利(Mauro Castelli)、里卡多·唐迪(Riccardo Dondi)、吉安卡洛·毛里(Giancarlo Mauri)和伊塔洛·佐皮斯(Italo Zoppis)。填充时间最长的常见子序列问题。程序中。2017年,第28届组合模式匹配年度研讨会(CPM’17)。出现·Zbl 1434.68728号
[16] Diptarka Chakraborty、Elazar Goldenberg和Michal Kouckỳ。不使用后缀树计算编辑距离的流算法。ArXiv:1607.037182016年·Zbl 1375.68231号
[17] 陈文达(Wun Tat Chan)、张勇(Yong Zhang)、冯培炎(Stanley P.Y.Fung)、叶德士(Deshi Ye)和朱红(Hong Zhu)。寻找最长公共递增子序列的有效算法。组合优化杂志,13(3):277-2882007·Zbl 1123.68135号
[18] 马雷克·西根(Marek Cygan)、马金·库比卡(Marcin Kubica)、雅库布·拉多舍夫斯基(Jakub Radoszewski)、沃伊切·莱特(Wojciech Rytter)和托马斯·瓦伦(Tomasz Wale nn)。加权LCS问题的多项式时间近似算法。离散应用数学,204:38-482016·Zbl 1335.68304号
[19] David Eppstein、Zvi Galil、Raffaele Giancarlo和Giuseppe F.Italiano。稀疏动态规划I:线性成本函数。J.ACM,39(3):519-5451992年7月。doi:10.1145/146637.146650·Zbl 0807.90120号 ·doi:10.1145/146637.146650
[20] 瓦莱里奥·弗雷斯基(Valerio Freschi)和亚历山德罗·博格里奥洛(Alessandro Bogliolo)。运行长度编码字符串之间最长的公共子序列:一种改进了并行性的新算法。信息处理信件,90(4):167-1732004·Zbl 1177.68248号
[21] 兹维·戈瑟夫(Zvi Gotthilf)、丹尼·赫尔梅林(Danny Hermelin)、加德·兰道(Gad M.Landau)和莫舍·勒文斯坦(Moshe Lewenstein)。受限LCS。程序中。第17届国际字符串处理和信息检索会议(SPIRE’10),第250-257页,2010年。
[22] Daniel S.Hirschberg,最长公共子序列问题的算法。J.ACM,24(4):664-6751977年。doi:10.1145/322033.322044·兹比尔0402.68041 ·doi:10.1145/322033.322044
[23] J.W.Hunt和M.D.McIlroy。用于差异文件比较的算法。计算科学技术报告41,贝尔实验室,1975年。
[24] 詹姆斯·亨特(James W.Hunt)和托马斯·西曼斯基(Thomas G.Szymanski)。计算最长子序列的快速算法。Commun公司。美国医学会,20(5):350-3531977年。doi:10.1145/359581.359603·Zbl 0354.68078号 ·doi:10.1145/359581.359603
[25] 科斯塔斯·西利奥普洛斯(Costas S Iliopoulos)、马金·库比卡(Marcin Kubica)、索赫尔·拉赫曼(M Sohel Rahman)和托马斯·瓦伦(Tomasz Wale nn)。计算最长参数化公共子序列的算法。程序中。第18届组合模式匹配年度会议(CPM'07),第265-273页,2007年·Zbl 1138.68660号
[26] 科斯塔斯·伊利奥普洛斯(Costas S.Iliopoulos)和M.索赫尔·拉赫曼(M.Sohel Rahman)。一种新的计算最长公共子序列的高效算法。计算系统理论,45(2):355-3712009。doi:10.1007/s00224-008-9101-6·Zbl 1187.68681号 ·doi:10.1007/s00224-008-9101-6
[27] 罗素·英帕利亚佐(Russell Impagliazzo)、拉莫汉·帕图里(Ramamohan Paturi)和弗朗西斯·赞恩(Francis Zane)。哪些问题具有强指数复杂性?计算机与系统科学杂志,63(4):512-5302001·Zbl 1006.68052号
[28] 姜涛、林国辉、马斌和张开忠。弧通告序列的最长公共子序列问题。离散算法杂志,2(2):257-2702004·兹比尔1118.68756
[29] Hossein Jowhari。用于确定编辑距离的高效通信协议。程序中。欧洲算法研讨会,第648-658页,2012年·Zbl 1365.68284号
[30] 奥尔加德·凯勒(Orgad Keller)、茨维·科佩洛维茨(Tsvi Kopelowitz)和莫舍·勒文斯坦(Moshe Lewenstein)。关于最长的公共参数化子序列。理论计算机科学,410(51):5347-53532009·Zbl 1186.68148号
[31] 伊兰·克莱默(Ilan Kremer)、诺姆·尼桑(Noam Nisan)和达娜·罗恩(Dana Ron)。随机单圈通信复杂性研究。计算复杂性,8(1):21-491999·兹比尔0942.68059
[32] Keita Kuboi、Yuta Fujishige、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda。通过RLE实现更快的STR-IC-LCS计算。程序中。2017年第28届组合模式匹配年度研讨会(CPM’17)。要显示,arXiv:1703.04954·Zbl 1434.68738号
[33] 马丁·库茨(Martin Kutz)、格思·斯特林特·布罗达尔(Gerth Stölting Brodal)、卡内拉·卡利戈西(Kanela Kaligosi)和艾丽特·凯特里尔(Irit Katriel)。计算最长公共递增子序列的更快算法。离散算法杂志,9(4):314-3252011·兹比尔1230.68225
[34] Gad M.Landau、Baruch Schieber和Michal Ziv-Ukelson。稀疏LCS公共子串对齐。信息处理快报,88(6):259-270,2003·Zbl 1178.68186号
[35] David Liben-Nowell、Erik Vee和An Zhu。在流数据中寻找最长的增加子序列和常见子序列。组合优化杂志,11(2):155-1752006·Zbl 1130.90040号
[36] Chin-Yew Lin.Rouge:一个自动评估摘要的软件包。2004年文本摘要分出。
[37] 刘佳杰、王月丽和李泽楷。查找运行长度编码字符串和未压缩字符串之间最长的公共子序列。复杂性杂志,24(2):173-1842008·Zbl 1279.68371号
[38] 韦伯·米勒(Webb Miller)和尤金·迈尔斯(Eugene W.Myers)。文件比较程序。软质。,实际。专家。,15(11):1025-1040, 1985. doi:10.1002/spe.4380151102·doi:10.1002/spe.4380151102
[39] Johra Muhammad Moosa、M.Sohel Rahman和Fatema Tuz Zohora。计算在没有重复元素的序列上几乎递增的最长公共子序列。《离散算法杂志》,20:12-202013·Zbl 1334.68320号
[40] 霍华德·摩根。系统程序中的拼写更正。ACM通讯,13(2):90-941970·Zbl 0185.43403号
[41] Shay Mozes、Dekel Tsur、Oren Weimann和Michal Ziv-Ukelson。用于计算树LCS的快速算法。理论计算机科学,410(43):4303-43142009·Zbl 1187.68684号
[42] 尤金·W·迈尔斯。一种O(N-D)差分算法及其变化。算法,1(2):251-2661986。doi:10.1007/BF01840446·Zbl 0639.68054号 ·doi:10.1007/BF01840446
[43] 吉恩·迈尔斯。正则表达式模式匹配的四俄罗斯人算法。美国医学会杂志(JACM),39(2):432-4481992·Zbl 0799.68104号
[44] Narao Nakatsu、Yahiko Kambayashi和Shuzo Yajima。适用于相似文本字符串的最长公共子序列算法。《学报》,18:171-1791982年。doi:10.1007/BF00264437·Zbl 0493.68041号 ·doi:10.1007/BF00264437
[45] 帕维尔·佩夫兹纳和迈克尔·沃特曼。矩阵最长公共子序列问题,对偶性和希尔伯特基。程序中。第三届组合模式匹配年会(CPM'92),第79-89页,1992年。
[46] Michael Saks和C.Seshadhri。针对单调性距离和非对称编辑距离的高效空间流算法。程序中。第24届ACM-SIAM离散算法年度研讨会,第1698-1709页,2013年·Zbl 1422.68333号
[47] 孙晓明和大卫·P·伍德拉夫。计算最长公共子序列和增加子序列的通信和流复杂性。程序中。第18届ACM-SIAM年度离散算法研讨会,第336-3452007页·Zbl 1302.68142号
[48] 亚历山大·提斯金。置换中最长的公共子序列和圆图中的最大团。程序中。第17届组合模式匹配年度研讨会(CPM'06),第270-281页,2006年·Zbl 1196.68352号
[49] 罗伯特·瓦格纳(Robert A.Wagner)和迈克尔·菲舍尔(Michael J.Fischer)。串对串校正问题。J.ACM,21(1):168-1731974年。doi:10.1145/321796.321811·Zbl 0278.68032号 ·doi:10.145/321796.321811
[50] 瑞恩·威廉姆斯。最优2-约束满足的一种新算法及其启示。理论计算机科学,348(2):357-3652005·Zbl 1081.68095号
[51] 孙武、乌迪·曼伯、吉恩·迈尔斯和韦布·米勒。一种O(NP)序列比较算法。信息处理。莱特。,35(6):317-323, 1990. doi:10.1016/0020-0190(90)90035-V·兹比尔0698.68055 ·doi:10.1016/0020-0190(90)90035-V
[52] 杨一轩、黄建平和赵坤茂。计算最长公共递增子序列的快速算法。信息处理快报,93(5):249-2532005·Zbl 1173.68839号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。