水貂是什么? Sprákbanken文本是语言数据的研究基础设施。我们提供适合研究的数字文本数据,并开发基于语言技术的分析工具。 使用水貂,您可以将自己的文本数据直接提交到我们的工具中。 在以下位置使用水貂spraakbanken.美元/美元 谁能用水貂? 任何拥有eduGAIN帐户的人都可以使用该帐户登录Mink。这包括与大学或其他学术机构相关的大多数人。 其他用户可以在创建帐户教育ID它本身与eduGAIN相连。 我们正在努力提供Mink的“演示”版本,该版本有一些限制,但无需登录即可使用。 我们还想扩展我们的身份验证解决方案,以允许其他帐户,如瑞典银行ID、谷歌和经典的电子邮件密码组合。 水貂能做什么? Mink的第一个版本针对特定的工作流: 创建上传文本文件的语料库 运行自动批注 在中使用结果科尔普或在Strix中,或作为XML/CSV文件 文本文件支持的格式有: 纯文本(.txt) XML格式 Microsoft Word(.docx) 打开文档(.odt) PDF格式 注释管道包括: 部分语音标签(POS) 基形式(引理) 形态句法标签(MSD) 依赖关系 情绪标签 即将推出的功能 Mink未来的一些开发目标是扩展注释设置、共享和发布,以及其他类型的语言数据(如词典)的工作流。