×

树编辑距离的度量标准化。 (英语) 兹比尔1267.68227

摘要:传统的标准化树编辑距离不满足三角形不等式。我们提出了一种树编辑距离的度量标准化方法,该方法在权重函数是所有插入/删除代价具有相同权重的基本编辑操作集上的度量的条件下,得到了一个新的满足三角形不等式的标准化树编辑距离。我们证明了在[0,1]范围内的新距离是一个真正的度量,它是两个有序标记树的大小和它们之间的树编辑距离的简单函数,可以直接通过具有相同复杂度的树编辑距来计算。基于将数字表示为有序标记树的有效算法,我们表明,在使用近似和消除搜索算法(AESA)的手写数字识别实验中,标准化树编辑度量可以提供比其他现有方法稍好的结果。

MSC公司:

68立方英尺 知识表示
68瓦32 字符串上的算法
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Zhang K,Shasha D,Wang J T L。可变长度下的近似树匹配并不重要。算法杂志,1994,16(1):33–66·Zbl 0803.68038号 ·doi:10.1006/jagm.1994.1003
[2] Tai K C.树对树修正问题。美国医学会杂志,1979,26(3):422-433·Zbl 0409.68040号 ·数字对象标识代码:10.1145/322139.322143
[3] Zhang K,Shasha D。树木编辑距离的简单快速算法及相关问题。SIAM计算机杂志,1989,18(6):1245–1262·Zbl 0692.68047号 ·数字对象标识代码:10.1137/0218082
[4] Kilpeläinen P,Mannila H.有序和无序树包含。SIAM计算机杂志,1995,24(2):340–356·Zbl 0827.68050号 ·doi:10.1137/S0097539791218202
[5] Klein P、Tirthapura S、Sharvit D、Kimia B。用于比较简单闭合形状的树编辑距离算法。摘自:第11届ACM-SIAM离散算法年会论文集。2000, 696–704 ·Zbl 0954.68146号
[6] Hoffmann C M,O'Donnell M J.树中的模式匹配。美国医学会杂志,1982,29(1):68–95·Zbl 0477.68067号 ·doi:10.1145/322290.322295
[7] Ramesh R,Ramakrishnan I V.树中的非线性模式匹配。美国医学会杂志,1992,39(2):295–316·Zbl 0799.68103号 ·doi:10.1145/128749.128752
[8] Bille P.关于树编辑距离和相关问题的调查。理论计算机科学,2005,337(1-3):217–239·Zbl 1078.68152号 ·doi:10.1016/j.tcs.2004.12.030
[9] Levenshtein A.能够纠正删除、插入和反转的二进制代码。苏联物理学Doklady,1966,10(8):707–710
[10] Sellers P H.关于进化距离的理论和计算。SIAM应用数学杂志,1974,26(4):787–793·Zbl 0291.92013号 ·数字对象标识代码:10.1137/0126070
[11] Wagner R A、Fischer M J。串对串校正问题。ACM杂志,1974,21(1):168–173·Zbl 0278.68032号 ·doi:10.1145/321796.321811
[12] Weigel A,Fein F.标准化加权编辑距离。摘自:第十二届模式识别国际会议论文集。1994, 399–402
[13] Yianilos P N.两种常用度量标准的规范化形式。报告91-082-9027-1,第7版。2002年7月,NEC研究所。http://www.pnylab.com/pny/
[14] Rico-Juan J R,Mico L.使用字符串和树编辑数据比较AESA和LAESA搜索算法。模式识别快报,2003,24(9–10):1417–1426·Zbl 1054.68126号 ·doi:10.1016/S0167-8655(02)00382-3
[15] Yujian L,Bo L.A归一化Levenshtein距离度量。IEEE模式分析和机器智能汇刊,2007,29(6):1091–1095·doi:10.1109/TPAMI.2007.1078
[16] Marzal A,Vidal E.标准化编辑距离的计算和应用。IEEE模式分析和机器智能汇刊,1993,15(9):926–932·数字对象标识代码:10.1109/34.232078
[17] Schroeder M,Schweimeier R.论证与误解:谈判代理人的模糊统一。理论计算机科学电子笔记,2002,70(5):1–19·Zbl 1270.68336号 ·doi:10.1016/S1571-0661(04)80585-1
[18] Vidal E.最近邻近似和消除搜索算法(AESA)的新公式和改进。模式识别信件,1994,15(1):1–7·doi:10.1016/0167-8655(94)90094-9
[19] Lecun Y、Bottou L、Bengio Y、Haffner P.基于梯度的学习应用于文档识别。IEEE会议记录,1998,86(11):2278–2324·数字对象标识代码:10.1109/5.726791
[20] Carrasco R C,Forcada ML.关于Nagen-draprasad-Wang-Gupta细化算法的注释。模式识别信件,1995,16(5):539–541·Zbl 0939.68913号 ·doi:10.1016/0167-8655(95)00121-V
[21] 孔立波,汤世伟,杨德清,王天杰,高杰。XML数据查询技术。软件期刊,2007,18(6):1400–1418(中文)·Zbl 1174.68401号 ·doi:10.1360/jos181400
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。