×

流式处理\(k\)-与纠错和应用程序不匹配。 (英语) Zbl 1435.68402号

摘要:我们为\(k\)提出了一种新的流算法-不匹配问题是模式匹配中最基本的问题之一。给定一个模式和一个文本,任务是找到文本中最多与模式保持汉明距离的所有子字符串。我们的算法通过一个名为错误更正,其对于\(k=1\)和一般\(k\)的复杂性与对于\(k)的解的复杂性相当-不匹配问题依据B.孔E.波拉特[摘自:2009年IEEE第50届计算机科学基础研讨会论文集。加利福尼亚州洛斯·阿拉米托斯:IEEE计算机协会。315–323 (2009;Zbl 1292.68174号)] R.克利福德等【摘自:第27届ACM-SIAM离散算法年会论文集,SODA’16。宾夕法尼亚州费城:工业和应用数学学会(SIAM);纽约州纽约市:计算机协会(ACM)。2039–2052 (2016;Zbl 1410.68160号)]. 与我们的研究并行,一个更有效的算法-不匹配的问题错误更正功能由开发R.克利福德等【摘自:第30届ACM-SIAM离散算法年会论文集,SODA’19。宾夕法尼亚州费城:工业和应用数学学会(SIAM);纽约州纽约市:计算机协会(ACM)。1106–1125 (2019;Zbl 1431.68168号)]. 使用流媒体的新功能和最新工作多模式匹配我们开发了一系列用于加权字符串模式匹配的流算法,加权字符串是分子生物学中不确定序列的常用表示。我们还表明,这些算法在多对数因子下是空间最优的。

MSC公司:

68瓦32 字符串上的算法
68周27 在线算法;流式算法

软件:

JASPAR公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿米尔,阿米胡德;埃兰·切辛斯基(Eran Chencinski);伊利奥普洛斯,科斯塔斯·S。;科佩洛维茨,茨维;Zhang,Hui,属性匹配和加权匹配,Theor。计算。科学。,395, 2-3, 298-310 (2008) ·Zbl 1142.68066号
[2] 阿米尔,阿米胡德;伊利奥普洛斯,科斯塔斯·S。;奥伦·卡帕;Porat,Ely,《加权序列中的近似匹配》,(Lewenstein,Moshe;Valiente,Gabriel,《组合模式匹配》,第17届年度研讨会。组合模式匹配,第17次年度研讨会,CPM 2006。组合模式匹配,第17届年度研讨会。组合模式匹配,第17届年度研讨会,CPM 2006,计算机科学讲稿,第4009卷(2006),Springer),365-376·Zbl 1196.68340号
[3] 卡尔·巴顿;Tomasz Kociumaka;刘畅;Pissis,Solon P。;Radoszewski,Jakub,索引加权序列:整洁高效,Inf.Comput。,第104462条pp.(2019)·Zbl 1436.68082号
[4] 卡尔·巴顿;刘畅;Pissis,Solon P.,加权字符串前缀表的线性时间计算与应用,Theor。计算。科学。,656, 160-172 (2016) ·Zbl 1356.68299号
[5] Biswas、Sudip;帕蒂尔,马尼什;莎玛五世(Sharma V.Thankachan)。;Shah,Rahul,不确定字符串的概率阈值索引,(Pitoura,Evaggelia;Maabout,Sofian;Koutrika,Georgia;Marian,Amélie;Tanca,Letizia;Manolescu,Ioana;Stefanidis,Kostas,第19届扩展数据库技术国际会议论文集。第19届扩展数据库技术国际会议论文集,EDBT 2016(2016),OpenProceedings.org,401-412
[6] 丹尼·布雷斯劳尔(Dany Breslauer);Galil,Zvi,实时流字符串匹配,ACM Trans。算法,10,4,22:1-22:12(2014)·Zbl 1398.68701号
[7] 马诺利斯基督城;伊利奥普洛斯,科斯塔斯·S。;劳伦特·穆沙尔;Tsichlas,Kostas,加权序列的模式匹配,(CompBioNets’04:第一届生物化学和进化网络算法和计算方法国际会议(2004),KCL出版物)
[8] 拉斐尔·克利福德;Efremenko,克里姆;本尼·波拉特;Porat,Ely,在线近似模式匹配的黑盒,Inf.Compute。,209,4731-736(2011年)·Zbl 1215.68279号
[9] 拉斐尔·克利福德;艾丽克斯·方丹;伊利·波拉特;本杰明·萨奇(Benjamin Sach);Starikovskaya,Tatiana,Dictionary matching in a stream,(Bansal,Nikhil;Finocchi,Irene,Algorithms-ESA 2015-第23届欧洲年会。Algoritoms-ESA2015-第23次欧洲年会,计算机科学讲义,第9294卷(2015),Springer),361-372·兹比尔1443.68218
[10] 拉斐尔·克利福德;艾丽克斯·方丹;伊利·波拉特;本杰明·萨奇(Benjamin Sach);Starikovskaya,Tatiana,《重新审视k失配问题》(Krauthgamer,Robert,《第二十七届ACM-SIAM离散算法研讨会论文集》,第二十七届年度ACM-SIAM离散算法研讨会,SODA 2016(2016),SIAM),2039-252·兹比尔1410.68160
[11] 拉斐尔·克利福德;马库斯·贾森尤斯;伊利·波拉特;Sach,Benjamin,在线模式匹配的空间下限,Theor。计算。科学。,483, 68-74 (2013) ·Zbl 1292.68180号
[12] 拉斐尔·克利福德;Tomasz Kociumaka;Porat,Ely,The streaming k-mismatch problem,(Chan,Timothy M.,《第三十届ACM-SIAM离散算法研讨会论文集》,第三十届年度ACM-SIAM离散算法研讨会,SODA 2019(2019),SIAM),1106-1125·兹比尔1431.68168
[13] 拉斐尔·克利福德;Starikovskaya,Tatiana,《溪流中的近似汉明距离》(Ioannis的Chatzigiannakis;Michael的Mitzenmacher;Yuval的Rabani;Davide的Sangiorgi,第43届国际自动化、语言和编程学术讨论会)。第43届自动化、语言与编程国际学术讨论会,ICALP 2016。第43届国际自动化、语言和编程学术讨论会。第43届国际自动化、语言和编程学术讨论会,2016年ICALP,LIPIcs,第55卷(2016年),达格斯图尔-莱布尼茨-泽特鲁姆信息学院,20:1-20:14·Zbl 1388.68321号
[14] Ergün,Funda;侯赛因·乔哈里;塞拉姆·默特,《溪流周期》(Serna,Maria J.;Shaltiel,Ronen;Jansen,Klaus;Rolim,JoséD。近似、随机化和组合优化。算法与技术,第13届国际研讨会,2010年左右,第14届国际研讨会。近似、随机化和组合优化。算法与技术,第13届国际研讨会,2010年左右,第14届国际研讨会(RANDOM),2010年。近似、随机化和组合优化。算法与技术,第13届国际研讨会,2010年左右,第14届国际研讨会。近似、随机化和组合优化。算法与技术,第13届国际研讨会,2010年左右,第14届国际研讨会(RANDOM),2010年,计算机科学讲稿,第6302卷(2010年),施普林格出版社,545-559·Zbl 1305.68329号
[15] 新泽西州Fine。;Wilf,H.S.,周期函数的唯一性定理,Proc。美国数学。《社会学杂志》,第16期,第109-114页(1965年)·Zbl 0131.30203号
[16] 沙伊戈兰;科佩洛维茨,茨维;Porat,Ely,通过匹配多个流中的多个模式来实现最佳近似流模式匹配,(Chatzigiannakis,Ioannis;Kaklanis,Christos;Marx,Dániel;唐纳德·桑内拉(Donald Sannella),第45届国际自动化、语言和编程学术讨论会。第45届国际自动化、语言和编程学术讨论会,ICALP 2018。第45届自动机、语言和程序设计国际学术讨论会。第45届国际自动化、语言和编程学术讨论会,ICALP 2018,LIPIcs,第107卷(2018),Dagstuhl Schloss-Leibniz-Zentrum fuer Informatik),65:1-65:16·Zbl 1499.68424号
[17] 沙伊戈兰;Porat,Ely,实时流式多模式搜索常量字母表,(Pruhs,Kirk;Sohler,Christian,第25届欧洲算法年度研讨会。第25届欧洲算法年度研讨会,欧空局2017。第25届欧洲算法年会。第25届欧洲算法年会,ESA 2017,LIPIcs,第87卷(2017),Schloss Dagstuhl-Leibniz Zentrum fuer Informatik),41:1-41:15·Zbl 1442.68280号
[18] 伊利奥普洛斯,科斯塔斯·S。;克里斯托斯·马克里斯(Christos Makris);Panagis,Yannis;卡特琳娜·佩迪库里(Katerina Perdikuri);西奥多里迪斯、埃文格洛斯;Tsakalidis,Athanasios K.,加权后缀树:处理分子加权序列的有效数据结构及其应用,Fundam。通知。,71, 2-3, 259-277 (2006) ·Zbl 1095.68029号
[19] 理查德·卡普(Richard M.Karp)。;Michael O.Rabin,《高效随机模式匹配算法》,IBM J.Res.Dev.,31,2,249-260(1987)·Zbl 0653.68054号
[20] Tomasz Kociumaka;Pissis,Solon P。;Radoszewski,Jakub,加权序列和轮廓的模式匹配和一致性问题,理论计算。系统。,63, 506-542 (2019) ·Zbl 1423.68620号
[21] Pizzi,辛齐亚;Ukkonen,Esko,《快速轮廓匹配算法-调查》,Theor。计算。科学。,395, 2-3, 137-157 (2008) ·Zbl 1140.68475号
[22] 本尼·波拉特;Porat,Ely,流模型中的精确和近似模式匹配,(第50届IEEE计算机科学基础研讨会。第50届EEE计算机科学基础会议,FOCS 2009(2009),IEEE计算机学会),315-323·Zbl 1292.68174号
[23] 伊利·波拉特;Lipsky,Ohad,《改进的汉明距离草图绘制与纠错》,(Ma,Bin;Zhang,Kaizhong,组合模式匹配,第18届年度研讨会,CPM 2007。组合模式匹配,第18届年度研讨会。组合模式匹配,第18届年度研讨会,CPM 2007,计算机科学讲稿,第4580卷(2007),Springer),173-182·Zbl 1138.68421号
[24] 雅库布·拉多舍夫斯基;Starikovskaya,Tatiana,Streaming k-mismatch with error correction and applications,(Ali Bilgin;Michael W.Marcellin;Joan Serra-Sagristá;James A.Storer,2017年数据压缩会议,2017年DCC 2017(2017),IEEE),290-299·Zbl 1435.68402号
[25] 阿尔宾·桑德林;韦南德·阿尔凯马;Engström,Pär;Wasserman,Wyeth W。;Lenhard,Boris,JASPAR:真核转录因子结合图谱的开放存取数据库,《核酸研究》,32,1,D91-D94(2004)
[26] Xia,Xuhua,位置权重矩阵,Gibbs sampler,及其在基序表征和预测中的相关显著性检验,Scientifica,2012,第917540页(2012)
[27] Yao,Andrew Chih,概率计算:实现复杂性的统一度量(扩展摘要),(第18届计算机科学基础年会。第18届计算机科学基础年会,FOCS 1977(1977),IEEE计算机学会),222-227·Zbl 0418.68001号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。