Multi-View Consistent Generative Adversarial Networks for 3D-aware Image Synthesis

Zhang, Xuanmeng; Zheng, Zhedong; Gao, Daiheng; Zhang, Bang; Pan, Pan; Yang, Yi

计算机科学>计算机视觉和模式识别

arXiv公司：2204.06307（cs）

【于2022年4月13日提交】

标题：用于3D软件图像合成的多视图一致生成对抗网络

作者：张宣萌,郑哲东,Daiheng Gao公司,张邦（Bang Zhang）,平移平移,易阳

查看PDF

摘要：3D-ware图像合成旨在通过学习3D表示，从多个视图生成对象的图像。然而，仍然存在一个关键挑战：现有方法缺乏几何约束，因此通常无法生成多视图一致的图像。为了应对这一挑战，我们提出了多视图一致生成对抗网络（MVCGAN），用于具有几何约束的高质量3D软件图像合成。通过利用生成图像的底层3D几何信息，即深度和相机变换矩阵，我们明确建立视图之间的立体对应关系，以执行多视图联合优化。特别是，我们加强了视图对之间的光度一致性，并在训练过程中集成了立体混合机制，鼓励模型推理正确的3D形状。此外，为了提高图像质量，我们设计了一种基于特征级多视图联合优化的两阶段训练策略。在三个数据集上的大量实验表明，MVCGAN在3D软件图像合成方面达到了最先进的性能。

评论：	CVPR 2022接受
学科：	计算机视觉和模式识别（cs.CV）
引用为：	arXiv公司：2204.06307[cs.CV]
	（或 arXiv:2204.06307v1[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2204.06307

提交历史记录

发件人：张宣萌[查看电子邮件]
[第1版]2022年4月13日星期三11:23:09 UTC（24773 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。个人简历

<上一版本 | 下一个>

新的 | 最近的 |2022-04

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>计算机视觉和模式识别

标题：用于3D软件图像合成的多视图一致生成对抗网络

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

标题：用于3D软件图像合成的多视图一致生成对抗网络

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目