×

基于平均值的最优轨迹重建算法。 (英语) Zbl 1416.62196号

摘要:在(删除通道)跟踪重建问题中,有一个未知的\(n\)位源字符串\(x\)。算法被赋予对\(x\)的独立跟踪的访问权限,其中跟踪是通过以概率\(delta\)独立删除\(x \)的每一位而形成的。该算法的目标是精确恢复(x)(以高概率),同时最小化样本(记录道数)和运行时间。
以前,用于轨迹重建问题的最著名算法是由于[T.荷伦斯坦等,摘自:2008年第19届ACM-SIAM离散算法年会论文集。纽约州纽约市:计算机协会(ACM);宾夕法尼亚州费城:工业和应用数学学会(SIAM)。389–398 (2008;Zbl 1192.94064号)]; 它使用\(\exp(\tilde{O}(n^{1/2}))样本和任何固定\(0<\delta<1)的运行时间。这也是我们所称的“基于平均值的算法”,意味着它只使用单个轨迹位的经验平均值。Holenstein等人也给出了一个下限,表明任何基于均值的算法都必须至少使用(n^{tilde{Omega}(logn)})个样本。
在本文中,我们改进了这两个结果,获得了基于均值的轨迹重建的匹配上下界。对于任意恒定的删除率(0<delta<1),我们给出了一个基于均值的算法,该算法使用(exp(O(n^{1/3}))时间和迹;我们还证明了任何基于均值的算法都必须使用至少\(\exp(\Omega(n^{1/3}))\)个迹。事实上,即使是对于\(\delta\)子常量和\(\rho\:=1-\delta_)子常量,我们也可以获得匹配的上下界:when\(\log^{3} n个)/(delta\leq1/2)界限为(\exp(-\Theta(\deltan)^{1/3}),当(1/\sqrt{n}\ll\rho\leq1/2)界限为。
我们的证明涉及复圆盘上Littlewood多项式极大值的估计。我们表明,除了删除之外,这些技术还可以用于执行随机插入和位偏移的轨迹重建。我们还发现了一个令人惊讶的结果:对于删除概率(delta>1/2),插入的存在实际上有助于跟踪重建。

MSC公司:

62G07年 密度估算
68问题32 计算学习理论
94A40型 信息与通信理论中的信道模型(包括量子)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andoni,A.、Daskalakis,C.、Hassidim,A.和Roch,S.(2012年)。通过祖先状态重建实现分子序列的全局比对。随机过程。申请号:122 3852-3874·Zbl 1250.92034号 ·doi:10.1016/j.spa.2012.08.04
[2] Batu,T.、Kannan,S.、Khanna,S.和McGregor,A.(2004)。从随机跟踪重建字符串。第十五届ACM-SIAM离散算法研讨会论文集910-918。纽约ACM·Zbl 1318.68206号
[3] Borwein,P.和Erdélyi,T.(1997)。单位圆分区上的Littlewood型问题。印第安纳大学数学。J.46 1323-1346·Zbl 0930.30005号 ·doi:10.1512/iumj.1997.46.1435
[4] Borwein,P.、Erdélyi,T.和Kós,G.(1999)。\([0,1]\)上的Littlewood类型问题。程序。伦敦。数学。Soc.(3)79 22-46·Zbl 1039.11046号
[5] Choffrut,C.和Karhumäki,J.(1997年)。单词组合学。《形式语言手册》,第1卷329-438。柏林施普林格。
[6] De Anindya,A.、O'Donnell,R.和Servedio,R.A.(2017年)。基于平均值的最优轨迹重建算法。STOC’17第49届ACM SIGACT计算理论年度研讨会论文集1047-1056。纽约ACM·Zbl 1369.68202号
[7] Dudík,M.和Schulman,L.J.(2003)。根据子序列重建。J.组合理论系列。A103 337-348·Zbl 1039.68098号 ·doi:10.1016/S0097-3165(03)00103-1
[8] Holenstein,T.、Mitzenmacher,M.、Panigrahy,R.和Wieder,U.(2008年)。具有恒定删除概率的轨迹重建及相关结果。第十九届ACM-SIAM离散算法研讨会论文集389-398。纽约ACM·Zbl 1192.94064号
[9] Janson,S.(2014)。几何变量和指数变量之和的尾部界限。可在网址:http://www2.math.uu.se/svante/papers/sjN14.pdf·Zbl 1392.60042号 ·doi:10.1016/j.spl.2017.11.017
[10] 卡拉什尼克,V.V.(1973)。从单词的片段中重建单词。计算数学与计算机科学(Vychislitel'naya Matematika i Vychilsitel'naya Tekhnika),哈尔科夫56-57。
[11] Kannan,S.和McGregor,A.(2005年)。更多关于从随机记录道重建字符串的内容:插入和删除。在IEEE信息理论国际研讨会297-301上。
[12] Krasikov,I.和Roditty,Y.(1997年)。关于序列的重构问题。J.组合理论系列。A77 344-348·Zbl 0871.05002号 ·doi:10.1006/jcta.1997.2732
[13] Levenshtein,V.I.(2001)。从其子序列或超序列中高效地重建序列。J.组合理论系列。A93 310-332·Zbl 0992.68155号 ·doi:10.1006/jcta.2000.3081
[14] Levenstein,V.I.(2001年)。序列的高效重建。IEEE传输。通知。理论47 2-22·Zbl 1029.94019号 ·doi:10.1109/18.904499
[15] Manvel,B.、Meyerowitz,A.、Schwenk,A.、Smith,K.和Stockmeyer,P.(1991)。序列重建。离散数学94 209-219·Zbl 0746.05045号 ·doi:10.1016/0012-365X(91)90026-X
[16] McGregor,A.、Price,E.和Vorotnikova,S.(2014)。重新访问了痕迹重建。2014年《算法-欧空局》。计算机科学讲义8737 689-700。海德堡施普林格·兹比尔1425.68470
[17] Mitzenmacher,M.(2009年)。删除通道和相关同步通道的结果调查。普罗巴伯。概述6 1-33·Zbl 1189.94058号 ·doi:10.1214/08-PS141
[18] Mossel,E.(2013)。MSRI打开问题会话。可在https://www.msri.org/c/document_library/get_file?uuid=4a885484-bcdd-4238-a3da-21c05713034c&groupId=14404。
[19] Nazarov,F.和Peres,Y.(2017年)。用\(\exp(O(n^{1/3}))样本重建跟踪。STOC’17-第49届ACM SIGACT计算理论研讨会论文集1042-1046。纽约ACM·Zbl 1370.68087号
[20] Peres,Y.和Zhai,A.(2017)。删除通道的平均案例重建:次多项式多个记录道就足够了。在2017年第58届IEEE计算机科学基础研讨会上,228-239。IEEE计算机协会,加利福尼亚州洛斯阿拉米托斯。
[21] 斯科特医学博士(1997年)。重建序列。离散数学175 231-238·Zbl 0890.05003号 ·doi:10.1016/S0012-365X(96)00153-7
[22] Smyth,C.(2008)。代数数的马勒度量:一项调查。在数论和多项式中。伦敦数学学会讲座笔记系列352 322-349。剑桥大学出版社,剑桥·Zbl 1334.11081号
[23] Viswanathan,K.和Swaminathan,R.(2008年)。改进了插入-删除通道上的字符串重建。第十九届ACM-SIAM离散算法研讨会论文集399-408。纽约ACM·Zbl 1192.94072号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。