小文本 swMATH ID: 39610 软件作者: 克里斯托弗·施罗德(Christopher Schröder)、莉迪亚·米勒(Lydia Müller)、安德烈亚斯·尼克勒(Andreas Niekler)、马丁·波塔斯特(Martin Potthast) 描述: 小文本:Python中文本分类的主动学习。我们介绍了small-text,这是一个简单的模块化主动学习库,它为Python中的文本分类提供了基于池的主动学习。它带有各种预先实现的最先进的查询策略,包括一些可以利用GPU的策略。明确定义的界面允许将多种此类查询策略与不同的分类器相结合,从而促进快速混合和匹配,并支持快速开发主动学习实验和应用程序。为了以一致的方式访问各种分类器,它集成了几个著名的机器学习库,即scikit-learn、PyTorch和huggingface transformers,后者的集成可以作为可选的可安装扩展提供。该库根据麻省理工学院许可证提供,网址为https://github.com/webis-de/small-text。 主页: https://small-text.readthedocs.io/en/latest/ 源代码: https://github.com/webis-de/small-text 依赖项: 蟒蛇 关键词: 机器学习;arXiv_cs。LG公司;arXiv_cs。氯;小文本;主动学习;文本分类;蟒蛇;查询策略;变压器 相关软件: 轻轨列车控制中心;BERT(误码率);ALiPy公司;情态动词;诽谤罪;JCLAL公司;变压器;Scikit公司;PyTorch公司;蟒蛇 引用于: 0个文档 标准条款 1出版物描述软件 年份 小文本:Python中文本分类的主动学习arXiv公司克里斯托弗·施罗德(Christopher Schröder)、莉迪亚·米勒(Lydia Müller)、安德烈亚斯·尼克勒(Andreas Niekler)、马丁·波塔斯特(Martin Potthast) 2021