我们探讨了如何通过仔细实施新开发的局部近似方案,将三大计算范式——对称多处理机、图形处理单元(GPU)和集群计算——结合起来,来解决大数据高斯过程(GP)回归问题。我们的方法学贡献主要集中在GPU计算上,因为这需要最仔细的考虑,也提供了最大的性能提升。然而,在我们的实证研究中,我们研究了所有三种范式的相对优点,以确定如何最好地结合它们。本文以两个案例研究作为结论。一个是真实的数据流体动力学计算机实验,这得益于我们近似的局部性质;第二个是一个合成示例,旨在找到最大的数据集,对于该数据集,可以在不到一小时的时间内对相应的预测集执行(准确的)GP仿真。
这是一篇来自SIAM/ASA不确定性量化杂志2 (2014): 564,数字对象标识代码:10.1137/130941912。经许可发布。