摘要

在本文中,我们描述了我们的跨学科项目“非标准正字法文本数据库中基于规则的搜索(RSNSR)”,以支持文化遗产的保护,特别是支持德国对哲学家尼采的接受。我们提出了一个基于规则的模糊搜索引擎,它允许用户独立于其拼写实现来检索文本数据。使用的规则来源于统计分析、历史出版物、语言学原理和专家知识。我们的基于Web的工具面向专家和感兴趣的业余爱好者。除了目前的特点外,目前还制定了进一步的功能。其中包括通过广义Levenshtein相似性度量进行自动规则推导和更精细的结果分类。我们的工作与最近启动的项目Deutsch Diachron Digital(DDD)有关,该项目旨在首次建立一个完整的德语历时语料库,其中包含从九世纪(旧高级德语)到现在(现代德语)的文本。

您当前没有访问此文章的权限。