×

优化视频语义分类训练集构造。 (英语) Zbl 1153.68431号

总结:我们利用该准则来优化大规模视频语义分类的训练集构造。由于低层特征和高层语义之间存在较大差距,以及视频数据的高度多样性,很难用有限大小的训练集表示语义概念的原型。在视频语义分类中,大多数基于学习的方法都需要大量的训练集才能获得良好的泛化能力,而在这些训练集中,大量的人工标注是不可避免的。然而,可以观察到,分类器的泛化能力在很大程度上取决于训练数据的几何分布,而不是大小。我们认为,即使训练集的大小有限,包含整个数据的大部分时间和空间分布信息的训练集也能取得良好的性能。为了捕获给定视频集合的几何分布特征,我们提出了构建/选择最佳训练集的四个指标,包括显著性、时间分散性、空间分散性和多样性。此外,基于这些度量,我们提出了一组优化规则,以使用给定大小的训练集捕获整个数据的最大分布信息。实验结果表明,这些规则对于视频语义分类中的训练集构建是有效的,并且显著优于随机训练集选择。

MSC公司:

68T05型 人工智能中的学习和自适应系统
94A08型 信息与通信理论中的图像处理(压缩、重建等)
68单位10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] doi:10.1016/j.patrec.2004.01.005·doi:10.1016/j.patrec.2004.01.005
[2] doi:10.1049/el:20073674·doi:10.1049/el:20073674
[4] doi:10.1016/S0925-2312(03)00429-6·doi:10.1016/S0925-2312(03)00429-6
[5] doi:10.1109/76.718510·doi:10.1109/76.718510
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。