坦桑尼亚先令 swMATH ID: 7977 软件作者: 托尔斯滕·布兰茨 描述: TnT–统计部分语音标记。TnT是Trigrams'n'Tags的缩写,是一个非常有效的统计部分语言标记器,可以在不同的语言和几乎任何标记集上进行训练。参数生成组件在标记的语料库上训练。该系统包含几种平滑和处理未知单词的方法。TnT未针对特定语言进行优化。相反,它针对各种语料库的培训进行了优化。使标记器适应新语言、新域或新标记集非常容易。此外,TnT还针对速度进行了优化。标记器是二阶马尔可夫模型的维特比算法的实现。用于平滑的主要范例是线性插值,各个权重由删除的插值确定。未知单词由后缀trie和连续抽象处理。 主页: 网址:http://www.coli.uni-saarland.de/~托尔斯滕/tnt/ 相关软件: 树标记器;宾州树库;SVM工具;WordNet(文字网);BLEU公司;斯坦福·塔格;感官;DB足;BabelNet公司;FreeLing公司;SRILM公司;NLTK公司;蟒蛇;毛坯;欧罗巴 引用于: 13文件 全部的 前5名30位作者引用 1 亚吉奇·埃尔杰科 1 恩里克·阿尔巴 1 劳德斯·阿劳霍 1 斯雷拉姆·巴拉克利什南 1 安娜·玛丽亚·巴布 1 托尔斯滕·布兰茨 1 科恩、凯文·布雷顿 1 达里巴·毕尔巴鄂,维克托·M·。 1 董继昌 1 兹德拉夫科·多维丹 1 托马·埃尔贾维克 1 卡加·菲利波娃 1 拉娜·福萨蒂 1 米哈·格查尔 1 劳伦斯·亨特。 1 Sachindra乔希 1 安德拉斯·科奈 1 李晶晶 1 加布里埃尔·卢克 1 甘尼什·拉马克里希南 1 Rupnik,一月 1 阿诺普·萨卡尔 1 梅赫努什·沙姆斯法德 1 沈鸿 1 阿什温·斯里尼瓦桑 1 迈克尔·斯特鲁贝 1 马尔科·塔迪奇 1 丹·图菲什 1 杰苏斯·维拉雷斯·费罗 1 维拉雷斯·费罗,曼努埃尔 全部的 前5名7篇连载文章中引用 2 逻辑、语言与信息杂志 2 Informatica(卢布尔雅那) 1 信息处理信件 1 计算机与系统科学杂志 1 应用数学建模 1 国际语音技术杂志 1 系统科学与复杂性杂志 全部的 前5名在6个字段中引用 12 计算机科学(68至XX) 3 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 数学逻辑和基础(03-XX) 1 统计学(62-XX) 1 运筹学、数学规划(90-XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文