×

视频流

swMATH编号: 35019
软件作者: 马诺伊·库马尔(Manoj Kumar)、穆罕默德·巴巴耶扎德(Mohammad Babaeizadeh)、杜米特鲁·埃尔汉(Dumitru Erhan
描述: 视频流:一种基于条件流的随机视频生成模型。原则上,能够建模和预测未来事件序列的生成模型可以学习捕捉复杂的现实世界现象,例如物理交互。然而,视频预测的一个主要挑战是,未来是高度不确定的:过去对事件的一系列观察可能意味着许多可能的未来。尽管最近的一些工作研究了可以表示不确定未来的概率模型,但此类模型要么在计算上非常昂贵,比如像素级自回归模型,要么不会直接优化数据的可能性。据我们所知,我们的工作是首次提出具有归一化流的多帧视频预测,它允许直接优化数据可能性,并产生高质量的随机预测。我们描述了一种潜在空间动态建模方法,并证明基于流的生成模型为视频生成建模提供了一种可行且具有竞争力的方法。
主页: https://arxiv.org/abs/1903.01434
关键词: 计算机视觉模式识别arXiv_cs。个人简历人工智能arXiv_cs。人工智能机器学习arXiv_cs。LG公司
相关软件: 国家科学基金PixelCNN(像素有线电视新闻网)++波浪辉光辉光亚当FloWaveNet公司流量++UCI-毫升PyTorch公司到岸价格MNIST公司EMNIST公司FFJORD公司n流量
引用于: 0个文档