跳到主要内容

水貂

水貂是什么?

Sprákbanken文本是语言数据的研究基础设施。我们提供适合研究的数字文本数据,并开发基于语言技术的分析工具。

使用水貂,您可以将自己的文本数据直接提交到我们的工具中。

在以下位置使用水貂spraakbanken.美元/美元

谁能用水貂?

任何拥有eduGAIN帐户的人都可以使用该帐户登录Mink。这包括与大学或其他学术机构相关的大多数人。

其他用户可以在创建帐户教育ID它本身与eduGAIN相连。

我们正在努力提供Mink的“演示”版本,该版本有一些限制,但无需登录即可使用。

我们还想扩展我们的身份验证解决方案,以允许其他帐户,如瑞典银行ID、谷歌和经典的电子邮件密码组合。

水貂能做什么?

Mink的第一个版本针对特定的工作流:

  1. 创建上传文本文件的语料库
  2. 运行自动批注
  3. 在中使用结果科尔普或在Strix中,或作为XML/CSV文件

文本文件支持的格式有:

  • 纯文本(.txt)
  • XML格式
  • Microsoft Word(.docx)
  • 打开文档(.odt)
  • PDF格式

注释管道包括:

  • 部分语音标签(POS)
  • 基形式(引理)
  • 形态句法标签(MSD)
  • 依赖关系
  • 情绪标签

即将推出的功能

Mink未来的一些开发目标是扩展注释设置、共享和发布,以及其他类型的语言数据(如词典)的工作流。