主页
Mulan是一个开源Java库,用于学习多标签数据集。多标签数据集由具有多个二进制目标变量的目标函数的训练示例组成。这意味着多标签数据集的每个项可以是多个类别的成员,也可以由多个标签(类)进行注释。这实际上是许多现实世界问题的本质,例如图像和视频的语义注释、网页分类、直接营销、功能基因组学和音乐分类到流派和情感。中介绍了挖掘多标签数据(Tsoumakas等人,2010年).
目前,该库包含各种最先进的算法,用于执行以下主要的多标签学习任务:
- 分类。此任务涉及将标签的双分区输出为给定输入实例的相关和不相关分区。
- 排名。此任务涉及根据标签与给定数据项的相关性输出标签的顺序
- 分类和排名上述两项任务的组合。
此外,该库还提供以下功能:
- 功能选择。当前支持简单的基线方法。
- 评估。通过保持评估和交叉验证计算各种评估指标的类。
如前所述,木兰是一座图书馆。因此,它只向库用户提供编程API。没有可用的图形用户界面(GUI)。目前也不支持通过命令行使用库。这个入门中的页面文档这是开始探索木兰的理想地点。工具书类
Tsoumakas,G.、Kataki,I.、Vlahavas,I.(2010)《挖掘多标签数据》,《数据挖掘和知识发现手册》,O.Maimon,L.Rokach(编辑),Springer,第二版,2010年。
|