库库瓦

多粒子连续时间量子行走的GPU加速算法。多粒子连续时间量子行走(CTQWs)是量子技术中的一种资源,包括量子搜索算法和通用量子计算。为了在实际场景中设计和实现CTQWs,需要有效的哈密顿量模拟工具,即包含随机项的哈密顿量。为此,我们提出了一种基于演化算子泰勒级数展开的并行算法,并与基于哈密顿量精确对角化和四阶龙格-库塔积分的算法进行了性能比较。证明了Taylor级数展开和Runge-Kutta算法都是可靠的,并且计算量小,Taylor级数展开显示了不依赖计算精度的内存分配的额外优势。这两种算法在SIMT范式下也具有高度的并行性,因此适合GPGPU计算。反过来,我们对4个NVIDIA GPU和3个四核Intel cpu进行了测试,结果表明,相对于OPENMP并行化,GPU计算提供的加速在8x到20x之间,这取决于后处理的频率。因此,GPU加速代码可以克服对执行时间的担忧,并使模拟大晶格上的许多相互作用粒子成为可能,而设备上可用的内存是唯一的限制。