StableVQA: A Deep No-Reference Quality Assessment Model for Video Stability

Kou, Tengchuan; Liu, Xiaohong; Sun, Wei; Jia, Jun; Min, Xiongkuo; Zhai, Guangtao; Liu, Ning

doi:10.1145/3581783.3611860

计算机科学>计算机视觉与模式识别

arXiv公司：2308.04904（cs）

【于2023年8月9日提交(第1版)，最新修订日期：2023年10月27日（本版本，第3版）]

标题：StableVQA：视频稳定性的深度无参考质量评估模型

作者：腾川口,刘晓红,孙伟（音译）,Jun Jia先生,熊国敏,翟广涛,刘宁（Ning Liu）

查看PDF

摘要：视频抖动是用户生成内容（UGC）视频的一种令人不快的失真，这通常是由相机的不稳定握持造成的。近年来，人们提出了许多视频稳定算法，但没有一个具体而准确的指标能够全面评估视频的稳定性。实际上，大多数现有的质量评估模型都将视频质量作为一个整体进行评估，而没有具体考虑视频稳定性的主观体验。因此，这些模型无法在出现严重抖动时明确准确地测量视频稳定性。此外，公开的大型视频数据库中没有包含不同程度的不稳定视频以及相应的主观评分，这阻碍了视频质量稳定性评估（VQA-S）的发展。为此，我们建立了一个名为StableDB的新数据库，其中包含1952个不同的不稳定UGC视频，每个视频都有一个由34名受试者评分的视频稳定性的平均意见得分（MOS）。此外，我们精心设计了一个名为StableVQA的新型VQA-S模型，该模型由三个特征提取器组成，分别获取光流、语义和模糊特征，以及一个回归层来预测最终的稳定性得分。大量实验表明，与现有的VQA-S模型和通用VQA模型相比，StableVQA与主观意见的相关性更高。数据库和代码位于此https URL.

评论：	ACM MM'23验收
学科：	计算机视觉和模式识别（cs.CV）; 图像和视频处理（eess.IV）
引用为：	arXiv公司：2308.04904[cs.CV]
	（或 arXiv:2308.04904v3[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2308.04904
相关DOI:	https://doi.org/10.1145/3581783.3611860

提交历史记录

发件人：滕川口[查看电子邮件]
[第1版]2023年8月9日星期三12:04:36 UTC（4181 KB）
[版本2]2023年8月10日星期四03:52:49 UTC（4181 KB）
[第3版]2023年10月27日星期五09:13:38 UTC（4464 KB）

计算机科学>计算机视觉与模式识别

标题：StableVQA：视频稳定性的深度无参考质量评估模型

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉与模式识别

标题：StableVQA：视频稳定性的深度无参考质量评估模型

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目