计算机科学>计算机视觉和模式识别
标题: 三维大场景中以人为中心的场景理解
摘要: 以人为中心的场景理解对于现实世界的应用具有重要意义,但由于存在各种人类姿势和动作、复杂的人机交互、人群中的严重遮挡等,因此具有极大的挑战性。在本文中,我们提出了一个用于以人为中心场景理解的大规模多模式数据集, 被称为HuCenLife,它收集在各种日常生活场景中,并带有丰富而精细的注释。 我们的HuCenLife可以使许多3D感知任务受益,例如分割、检测、动作识别等,我们还为这些任务提供基准,以促进相关研究。 此外,我们为基于激光雷达的分割和动作识别设计了新的模块,这些模块更适用于大规模的以人为中心的场景,并实现了最先进的性能。