×

坦桑尼亚先令

swMATH ID: 7977
软件作者: 托尔斯滕·布兰茨
描述: TnT–统计部分语音标记。TnT是Trigrams'n'Tags的缩写,是一个非常有效的统计部分语言标记器,可以在不同的语言和几乎任何标记集上进行训练。参数生成组件在标记的语料库上训练。该系统包含几种平滑和处理未知单词的方法。TnT未针对特定语言进行优化。相反,它针对各种语料库的培训进行了优化。使标记器适应新语言、新域或新标记集非常容易。此外,TnT还针对速度进行了优化。标记器是二阶马尔可夫模型的维特比算法的实现。用于平滑的主要范例是线性插值,各个权重由删除的插值确定。未知单词由后缀trie和连续抽象处理。
主页: 网址:http://www.coli.uni-saarland.de/~托尔斯滕/tnt/
相关软件: 树标记器;宾州树库;SVM工具;WordNet(文字网);BLEU公司;斯坦福·塔格;感官;DB足;BabelNet公司;FreeLing公司;SRILM公司;NLTK公司;蟒蛇;毛坯;欧罗巴
引用于: 13文件

按年份列出的引文