×

半监督学习的自适应主动学习。 (中文。英文摘要) Zbl 1474.68263号

摘要:主动学习算法试图通过从大量未标记示例中查询来克服标记瓶颈。现有的批处理模式主动学习算法存在三个局限性:(1)基于数据假设的模型很难找到既有信息又有代表性的图像;(2) 基于相似函数或优化某种多样性度量的方法可能会导致性能次优,并产生具有冗余示例的选定集;(3) 噪声标签问题一直是主动学习算法的一个障碍。本研究提出了一种基于深度学习的新型批处理模式主动学习方法。深度神经网络生成标记和未标记示例的表示(嵌入),采用标记循环模式,将标记示例与未标记示例之间的嵌入连接到同一类中,同时考虑了示例的信息性和代表性,以及对噪音标签的鲁棒性。将所提出的主动学习方法应用于半监督分类和聚类。设计子模函数以减少所选实例的冗余。此外,在主动学习中优化了权重损失的查询条件,自动平衡了信息量和代表性示例。具体来说,将批处理模式主动方案引入到分类方法中,提高了泛化能力。对于半监督聚类,所提出的主动约束方案被用于促进快速收敛,并且比无监督聚类性能更好。为了验证所提算法的有效性,针对不同任务的多样性基准数据集进行了大量实验,实验结果表明,与最先进的方法相比,该方法得到了一致且实质性的改进。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序