多GPU的分布式存储图着色算法
本文介绍了几种MPI+GPU着色方法,这些方法使用了Gebremedhin等人的分布式着色算法和Deveci等人的共享内存算法的实现,并提出了减少分布式图着色中通信的新方法。 多核平台上的高性能平衡并行图着色
将所提出的算法设计扩展为提出一种称为BalColorTM的平衡图着色算法,使用该算法,所有颜色类都包含几乎相同数量的顶点,以在实际终端应用程序的执行中实现高并行度和资源利用率。 多核体系结构中新的多线程排序和着色算法
新的多线程顶点排序和距离-k图着色算法非常适合多核平台,在排序算法中使用近似度计算,在着色算法中使用推测和迭代,作为打破序列性和实现有效并行化的主要工具。 硬件高效对称稀疏矩阵向量乘法的递归代数着色技术
递归代数着色引擎(RACE)是一种新的着色算法和开源库实现,它消除了以往着色方法在硬件效率和并行化开销方面的不足,适用于任何具有数据依赖性的稀疏矩阵运算,这些运算可以通过distance-k着色来解决。 硬件高效对称稀疏矩阵向量乘法的递归代数着色技术
本文提出了递归代数着色引擎(RACE),一种新的着色算法和开放源码库实现,消除了以往着色方法在硬件效率和并行化开销方面的缺点,适用于任何可以通过distance-k着色解决的数据相关性稀疏矩阵运算。 数值优化的并行距离k着色算法
算法的主要思想是在可用的处理器中平均地随机划分顶点集,让每个处理器使用已着色顶点的信息来推测其顶点的颜色,并行检测最终的冲突,最后按顺序重新着色冲突的顶点。 可伸缩并行图着色算法
提出了一种简单快速的并行图着色启发式算法,该算法非常适合于共享内存编程,并在PRAM模型上产生近似线性的加速。 一种快速高质量的不规则图的多级划分方案
本文提出了一种新的粗化启发式算法(称为重边启发式算法),其粗图分区的大小在多级细化后得到的最终分区大小的一小部分内,并提出了一个用于在解粗化期间进行细化的Kernighan-Lin(KL)算法的更快变体。