计算机科学>计算机视觉与模式识别
标题: HyperSDFusion:为增强的3D文本2形状生成桥接语言和几何中的层次结构
摘要: 从文本中生成三维形状是三维表示学习中的一项基本任务。 文本形状对显示出层次结构, 其中像“椅子”这样的普通文本 “涵盖了椅子的所有3D形状,而更详细的提示指的是更具体的形状。此外,文本和3D形状都是固有的层次结构。然而,现有的Text2Shape方法,如SDFusion,并没有利用这一点。在这项工作中,我们提出了HyperSDFusion这一双分支扩散模型,它从 给定文本。 由于双曲线空间适合处理层次数据,我们建议学习双曲线空间中文本和3D形状的层次表示。 首先,我们引入双曲线文本图像编码器来学习双曲线空间中文本的顺序和多模态层次特征。 此外,我们设计了一个双曲线文本纹理卷积模块来学习双曲线空间中文本的层次特征。 为了充分利用这些文本特征,我们引入了一种双分支结构,将文本特征嵌入到三维特征空间中。 最后,为了赋予生成的三维形状层次结构,我们设计了双曲线层次损失。 我们的方法是首次探索用于文本到形状生成的双曲线层次表示。 在现有的文本到形状配对数据集Text2Shape上的实验结果达到了最先进的结果。 我们根据 此http URL .