摘要
我们引入了一个深度学习模型,该模型可以普遍近似正则条件分布(RCD)。该模型分为三个阶段:首先,它通过特征映射将给定度量空间$\mathcal{X}$到$\mathbb{R}^d$的输入线性化,然后深度前馈神经网络处理这些线性化的特征,然后将网络的输出转换到$1$-Wasserstein空间$\mathcal{P} _1个(mathbb{R}^D)$通过Bahdanau等人(2014)注意机制的概率扩展。我们的模型称为概率变换器(PT)},可以近似于从$\mathbb{R}^d$到$\mathcal的任何连续函数{P} _1个紧集上的(mathbb{R}^D)$一致,数量上。我们确定了两种方法,在接近$\mathcal时,PT可以避免维数灾难{P} _1个(\mathbb{R}^D)$值函数。第一个策略在$C(\mathbb{R}^d,\mathcal)中构建函数{P} _1个(\mathbb{R}^D))$,它可以有效地由PT近似,一致地在$\mathbb{R}^D$的任何给定紧子集上。在第二种方法中,给定$C(\mathbb{R}^d,\mathcal)中的任何函数$f${P} _1个(\mathbb{R}^D)$,我们建立了$\mathbb{R}^D$的紧子集,其中$f$可以有效地用PT近似。