×

唯一可解码的\(n\)-语法嵌入。 (英语) Zbl 1086.68073号

摘要:我们定义了从有限字母表上的字符串到半模(mathbb n^K)的(n)-gram嵌入族。我们将所有在这种嵌入下是字符串有效图像的\(\xi\in\mathbb N^K),以及所有其逆图像正好由1个字符串组成的\(\ xi\)进行分类(我们称之为这种\(\ xi\)唯一可解码)。我们证明了对于一个固定的字母表,其图像是唯一可解码的所有字符串的集合是一种正则语言。

MSC公司:

65年第68季度 形式语言和自动机
05年4月5日 欧拉图和哈密顿图
68兰特 计算机科学中的图论(包括图形绘制)
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Angluin,D.,关于正则集最小推理的复杂性,Inform。控制,39,337-350(1978)·Zbl 0393.68066号
[2] G.R.Brightwell,P.Winkler,关于欧拉电路计数的注记http://arxiv.org/abs/cs/\(0405067>\), 2004.; G.R.Brightwell,P.Winkler,关于欧拉电路计数的注记http://arxiv.org/abs/cs/\(0405067>\), 2004.
[3] H.Fleischner,《欧拉图及其相关主题》,第2卷,《离散数学年鉴》。,50,阿姆斯特丹,1991年。;H.Fleischner,《欧拉图及其相关主题》,第2卷,《离散数学年鉴》。,50,阿姆斯特丹,1991年·Zbl 0792.05092号
[4] B.Hao,H.Xie,S.Zhang,蛋白质序列的组成表示和欧拉环数,\(\<\)http://arxiv.org/abs/physics/\(0103028>\),2001年。;B.Hao,H.Xie,S.Zhang,蛋白质序列的组成表示和欧拉环数,\(\<\)http://arxiv.org/abs/physics/\(0103028>\), 2001.
[5] 刘易斯,H。;Papadimitriou,C.,《计算理论的要素》(1981),普伦蒂斯·霍尔公司:普伦蒂斯霍尔公司,新泽西州恩格尔伍德克利夫斯·Zbl 0464.68001号
[6] 曼宁,C。;Schütze,H.,《统计自然语言处理基础》(1999年),麻省理工学院出版社:剑桥·Zbl 0951.68158号
[7] 佩夫兹纳,P.,《计算分子生物学算法方法》(2000),麻省理工学院出版社:麻省理学学院出版社剑桥·Zbl 0972.92011号
[8] 皮特·L。;Warmuth,M.,最小一致dfa问题不能在任何多项式内近似,JACM,40,1(1993)·Zbl 0774.68084号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。