阿利比

ALiPy:Python中的主动学习。有监督的机器学习方法通常需要大量带标签的例子来进行模型训练。然而,在许多实际应用中,有大量的未标记数据,而有标记的数据却有限;而收购标签的成本也很高。主动学习(activelearning,AL)通过迭代选择最有价值的数据从注释器中查询其标签,从而降低了标记成本。本文介绍了一个用于主动学习的pythontoobox ALiPy。ALiPy提供了一个基于模块的主动学习框架的实现,用户可以方便地评估、比较和分析主动学习方法的性能。在工具箱中,学习框架的每个组件都有多种选择,包括数据处理、主动选择、标签查询、结果可视化等,此外还实现了20多种最先进的主动学习算法,ALiPy还支持用户在不同的主动学习设置下方便地配置和实现自己的方法,如多标签数据的AL、带噪声注释器的AL、不同成本的AL等。这个工具箱在Github上有很好的文档记录并且是开源的,可以通过PyPI轻松安装。