基于重心拉格朗日插值和双树遍历的GPU加速快速求和方法

@第{Wilson2020AGF条,title={一种基于重心拉格朗日插值和对偶树遍历的GPU加速快速求和方法},author={Leighton Wilson和Nathan Vaughn以及Robert Krasny},journal={Compute.Phys.Commun.},年份={2020年},体积={265},页码={108017},网址={https://api语义scholar.org/语料库ID:229153460}}

球面上的快速求和及其在正压涡度方程中的应用

本文提出了一种球面树编码,并将其应用于有效求解正压涡度方程的问题。

通过ESES桥接欧拉和拉格朗日泊松-玻尔兹曼解算器

本工作研究了欧拉溶剂排除曲面(ESES)软件用于绘制共轭欧拉和拉格朗日曲面表示的实用性,使其能够数值验证和比较欧拉PB解算器(如MIBPB解算器)和拉格伦日PB求解器(如TABI‐PB解算器)的质量。

某些函数空间中的最优Birkhoff插值和Birkhof数

本文研究了空间L∞[-1,1]和加权空间L p,ω[-1,1],1≤p<∞中一些函数空间的最优Birkhoff插值和Birkhoff-数,其中ω是连续的

TABI-PB 2.0:树码加速边界积分Poisson-Boltzmann解算器的改进版本。

这项工作描述了TABI-PB2.0,它是树加速边界积分Poisson-Boltzmann解算器的改进版本。该代码计算分子表面的静电势

用广义动量公式计算等离子体的粒子间方法

本文针对Vlasov-Maxwell系统,提出了一种新的粒子-细胞方法。在洛伦兹规范条件下,电磁场的麦克斯韦方程可以写成一个集合

一种GPU加速的重心拉格朗日树码

针对GPU上粒子相互作用的快速求和和以及GPU加速的BLTC性能,在几个测试用例上演示了内核相关重心拉格朗日树码(BLTC)的MPI+OpenACC实现。

基于重心拉格朗日插值的核无关树码

提出了一种用于快速求和成对粒子相互作用的核相关树码(KITC),并利用切比雪夫点的重心拉格朗日插值计算分离良好的粒子簇相互作用。

用于天体物理N体模拟的集成GPU上的双树遍历

FMM DTT的首次异构部署优于标准多核CPU,并与GPU和高端CPU性能相匹配,因此具有更高的成本和功耗效率。

PVFMM:一种用于粒子和体积势的并行核无关FMM

讨论了几种算法改进和性能优化,包括缓存局部性、矢量化、共享内存并行性和协处理器的使用,包括缓存区域性、向量化、共享存储并行性和使用协处理器。

CUDA上并行黑盒快速多极子方法的优化

CPU和GPU之间提供了广泛的算法和性能分析,并与以前发布的工作进行了比较,这表明黑盒FMM的当前实现对于此类FMM是最有效的。

异构体系结构上的大规模并行自适应快速多极子方法

提出了新的可扩展算法和与核无关的快速多极方法的新实现,其中采用分布式存储器并行和共享存储器/流并行来快速评估两体非振荡电位。

基于重心Hermite插值的静电粒子相互作用树码

库仑势和屏蔽库仑势的数值结果表明,树码的运行时间尺度类似于O(N log N),其中N是系统中的粒子数。
...