计算机科学>计算机视觉与模式识别
标题: 语言条件下的流量生成
摘要: 仿真是现代自动驾驶发展的支柱。 模拟器有助于开发、测试和改进驾驶系统,而不会对人、车辆或其环境造成风险。 然而,模拟器面临着一个重大挑战:它们依赖于真实、可伸缩但有趣的内容。 虽然渲染和场景重建的最新进展在创建静态场景资源方面取得了长足进步,但对其布局、动力学和行为建模仍然具有挑战性。 在这项工作中,我们将语言作为动态交通场景生成的监控源。 我们的模型LCTGen将大型语言模型与基于变换器的解码器体系结构相结合,该解码器体系结构从地图数据集中选择可能的地图位置,并生成初始交通分布以及每辆车的动态。 在真实性和保真度方面,LCTGen在无条件和有条件交通场景生成方面都优于先前的工作。 代码和视频将在 此https URL .