Python中的多标签分类

Scikit-multilern是一个BSD许可的多标签分类库是建立在著名的科学知识学习生态系统。
pip安装scikit-multilearning
发布:0.2.0|支持的Python版本:2.7/3.x|github|PyPi公司|文档
稳定释放:0.1.0|支持的Python版本:2.7/3.x|文档
开始
星星 叉子
很多分类器

Scikit-multilearn提供了许多本机Python多标签分类器分类器。

标签关系

使用专家知识或从数据推断标签关系以改进模型。

多标签嵌入

嵌入标签空间以提高分类器的辨别能力。

多标签深度学习

扩展Keras或pytorch神经网络以解决多标签分类问题。

高效的分类

Scikit-multilearning比标准更快,占用的内存更少MULAN、MEKA和WEKA的堆栈。

与BSD中一样免费

许可模式遵循scikit的BSD许可,以允许最大的互操作性。一些库如果用于标签空间划分,可能会产生GPL要求。

数据管理

Scikit-multilearning比标准更快,占用的内存更少MULAN、MEKA和WEKA的堆栈。

多层分层

使用专家知识或从数据中推断标签关系来改进模型。

MEKA包装

缺少Java MEKA和WEKA堆栈中存在的特定分类器?现在您可以像使用本机scikit分类器一样使用它了!

保养良好

Scikit-multilearn的测试覆盖率超过82%,并在Windows 10、OS X和Ubuntu上持续集成。

Scikit兼容

Scikit-multilearn与Scipy和Scikit-learn堆栈兼容。使用我们的分类器和scikit,在代码中使用scikit分类器。

广泛使用

scikit-multilearn拥有160多颗星和60个分叉,是github上第二大最受欢迎的多标签库。

我们在StackOverflow

需要帮助吗?问一个关于堆栈溢出的问题,我们的社区会回答。

了解更多信息

Scikit-multilearn提供了广泛的用户文档。阅读用户文档,学习基于真实数据构建的配方,或浏览API引用以查找具体的类或函数。

用户文档 参考

加入团队!

Scikit multilean已开发

开发人员文档 关于项目

新闻

0.2.0(2018-12-10发布)

新功能版本:

  • 多标签SVM(MLTSVM)的第一个python实现
  • 支持多个嵌入器的通用多标签嵌入框架(LNEMLC、CLEMS)
  • 实现了来自HOMER的平衡k-均值聚类器
  • 科瑞斯模型包装器在scikit-multilearn中的使用

0.1.0[稳定](发布日期:2018-09-04)

修复了许多错误,并普遍提高了稳定性、跨平台功能标准和单元测试覆盖率。此版本已通过一组大型单元测试进行了测试在Windows上工作。此外,新功能:

  • 多标签分层算法与分层质量度量
  • 标签空间划分的稳健重组,以及工作随机块模型方法和新的底层-图形生成器,允许使用图形模型来划分标签空间,而不仅仅基于标签共存,但在任何类型的标签之间的网络关系上,你都可以想出
  • meka包装器现在完全跨平台工作,包括windows10
  • 引入多标签数据集下载和加载/保存功能,如sklearn的数据集
  • kNN模型支持稀疏输入
  • MLARAM模型支持稀疏输入
  • 通过NetworkX进行BSD兼容标签空间分区
  • 对GPL库的依赖是可选的
  • 标签空间划分方法中添加的工作predict_proba
  • MLARAM从神经模糊转向适应
  • 测试覆盖率增加到94%
  • 分类器链允许指定链顺序
  • 大量文档更新