计算机科学>计算机视觉和模式识别
标题: AGIQA-3K:AI生成图像质量评估的开放数据库
摘要: 随着文本到图像生成模型的快速发展,人工智能生成的图像(AGI)已广泛应用于娱乐、教育、社交媒体等领域。然而,考虑到不同AGI之间的质量差异较大,迫切需要与人类主观评分相一致的质量模型。 为了解决这个问题,我们广泛考虑了各种流行的AGI模型,通过不同的提示和模型参数生成AGI,并收集了感知质量和文本图像对齐的主观分数,从而构建了迄今为止最全面的AGI主观质量数据库AGIQA-3K。 此外,我们在此数据库上进行了基准测试,以评估当前图像质量评估(IQA)模型与人类感知之间的一致性,同时提出了StairReward,它显著提高了主观文本图像对齐的评估性能。 我们相信,AGIQA-3K中细粒度的主观评分将激励后续AGI质量模型在感知和对齐水平上适应人类主观感知机制,并优化未来AGI模型的生成结果。 数据库发布于 此https URL .