计算机科学>计算机视觉与模式识别
标题: StableVQA:视频稳定性的深度无参考质量评估模型
摘要: 视频抖动是用户生成内容(UGC)视频的一种令人不快的失真,这通常是由相机的不稳定握持造成的。 近年来,人们提出了许多视频稳定算法,但没有一个具体而准确的指标能够全面评估视频的稳定性。 实际上,大多数现有的质量评估模型都将视频质量作为一个整体进行评估,而没有具体考虑视频稳定性的主观体验。 因此,这些模型无法在出现严重抖动时明确准确地测量视频稳定性。 此外,公开的大型视频数据库中没有包含不同程度的不稳定视频以及相应的主观评分,这阻碍了视频质量稳定性评估(VQA-S)的发展。 为此,我们建立了一个名为StableDB的新数据库,其中包含1952个不同的不稳定UGC视频,每个视频都有一个由34名受试者评分的视频稳定性的平均意见得分(MOS)。 此外,我们精心设计了一个名为StableVQA的新型VQA-S模型,该模型由三个特征提取器组成,分别获取光流、语义和模糊特征,以及一个回归层来预测最终的稳定性得分。 大量实验表明,与现有的VQA-S模型和通用VQA模型相比,StableVQA与主观意见的相关性更高。 数据库和代码位于 此https URL .