UnifiedGesture: A Unified Gesture Synthesis Model for Multiple Skeletons

Yang, Sicheng; Wang, Zilin; Wu, Zhiyong; Li, Minglei; Zhang, Zhensong; Huang, Qiaochu; Hao, Lei; Xu, Songcen; Wu, Xiaofei; yang, changpeng; Dai, Zonghong

doi:10.1145/3581783.3612503

计算机科学>人机交互

arXiv公司：2309.07051（cs）

【于2023年9月13日提交】

标题：统一手势：多骨骼的统一手势合成模型

作者：四川杨,王子林,吴志勇,李明磊,张振松,乔楚·黄,雷浩,徐松岑,吴晓飞,杨昌鹏,宗洪戴

查看PDF

摘要：语音合成手势的自动生成在计算机动画中备受关注。以前的工作是在单个数据集上设计网络结构，这导致缺乏数据量和跨不同运动捕捉标准的通用性。此外，由于语音和手势之间的相关性较弱，这是一项具有挑战性的任务。为了解决这些问题，我们提出了一种新的基于扩散模型的手势合成方法UnifiedGesture，该方法基于具有不同骨架的多个手势数据集进行训练。具体来说，我们首先提出了一个重定目标网络，以学习不同运动捕捉标准的潜在同胚图，在扩展数据集的同时统一各种姿势的表示。然后，我们基于扩散模型架构捕获语音和手势之间的相关性，该架构使用跨区域注意和自我注意来生成更好的语音匹配和真实手势。为了进一步协调语音和手势并增加多样性，我们将离散手势单元上的强化学习与学习的奖励功能结合起来。大量实验表明，UnifiedGesture在CCA、FGD和人类相似性方面优于最近的语音驱动手势生成方法。所有代码、预培训模型、数据库和演示均可通过以下网址向公众提供：此https URL.

评论：	16页，11图，ACM MM 2023
学科：	人机交互（cs.HC）; 人工智能；多媒体（cs.MM）
引用为：	arXiv公司：2309.07051【cs.HC】
	（或 arXiv公司：2309.07051v1【cs.HC】对于此版本）
	https://doi.org/10.48550/arXiv.2309.07051
相关DOI:	https://doi.org/10.1145/3581783.3612503

提交历史记录

发件人：杨思成[查看电子邮件]
[第1版]2023年9月13日星期三16:07:25 UTC（3774 KB）

计算机科学>人机交互

标题：统一手势：多骨骼的统一手势合成模型

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>人机交互

标题：统一手势：多骨骼的统一手势合成模型

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目