斯塔普

StarPU:异构多核架构任务调度的统一平台。配备加速器的多核机器越来越受欢迎。TOP500领先的RoadRunner机器可能是最著名的例子,它混合了IBM Cell宽带引擎和AMD opteron处理器。其他架构,包括GPU加速器,预计将在不久的将来出现。要充分挖掘这些混合机器的潜力,单纯的卸载方法是不够的,即应用程序的主要核心在常规处理器上运行,在加速器上卸载特定部件。真正的挑战是构建应用程序将永久性地分布在整个机器上的系统,也就是说,并行任务将在整个可用的处理单元集上动态调度。为了应对这一挑战,我们提出了一个新的运行时系统,能够在异构的、基于加速器的机器上调度任务。我们的系统具有一个提供弱一致性模型的软件虚拟共享内存。该系统跟踪加速器嵌入式内存中的数据副本,并具有数据预取引擎的功能。这种工具,再加上一个自调优的每个任务性能模型的数据库,可以用来极大地提高调度策略的质量。我们通过在运行时系统上对各种并行数值内核实现进行基准测试,来展示我们方法的相关性。在配备多个加速器的多核机器上,我们可以在各种典型工作负载下获得显著的加速和非常高的效率。


zbMATH参考文献(38篇文章引用)

显示结果1到20,共38个。
按年份排序(引用)
  1. Duff,Iain;Hogg,Jonathan;Lopez,Florent:使用后验阈值旋转的新稀疏(LDL^T)解算器(2020)
  2. Gratien,Jean-Marc:一种适用于具有大量核的多核体系结构的健壮和可扩展的多级域分解预处理器(2020)
  3. Henrio,Ludovic;Kessler,Christoph;Li,Lu:在异构系统内存一致性模型中利用访问模式声明(2020)
  4. Bremer,Maximilian;Kazhyken,Kazbek;Kaiser,Hartmut;Michoski,Craig;Dawson,Clint:HPX与传统并行化策略在间断Galerkin方法中的性能比较(2019)
  5. David Coulette;Franck,Emmanuel;Helluy,Philippe;Mehrenberger,Michel;Navoret,Laurent:用于动力学松弛近似的高阶隐式回文间断Galerkin方法(2019年)
  6. Sameh Abdulah,Yuxiao Li,Jian Cao,Hatem Ltaief,David E.Keyes,Marc G.Genton,Ying Sun:ExaGeostator:R(2019年)大规模地质统计学的一揽子计划阿尔十四
  7. Jayesh Badwaik;Boileau,Matthieu;Coulette,David;Franck,Emmanuel;Helluy,Philippe;Klingenberg,Christian;Mendoza,Laura;Oberlin,Herbert:隐式动力学方案的基于任务的并行化(2018)
  8. Duff,Iain;Hogg,Jonathan;Lopez,Florent:使用序列任务流实现对稀疏Cholesky的实验(2018)
  9. Duff,Iain;Lopez,Florent;Nakov,Stojce:并行计算机上的稀疏直接解(2018)
  10. Essadki,Mohamed;Jung,Jonathan;Larat,Adam;Pelletier,Milan;Perrier,Vincent:双曲守恒律简单数值解算器的任务驱动实现(2018)
  11. Jeannot,Emmanuel;Fournier,Yvan;Lorendeau,Benjamin:使用非结构化网格在传统计算流体动力学代码上试验基于任务的运行时(2018)
  12. 凯达德·西德豪姆(Kedad Sidhoum),萨非亚;蒙纳,弗洛伦斯;莫尼·格雷戈里(Mounié,Grégory);Denis Trystram:混合并行平台调度算法家族(2018)
  13. Malik,Avinash;Walker,Cameron;O'Sullivan,Michael;Sinen,Oliver:带通信延迟的任务图最优调度的可满足性模理论(SMT)公式(2018)
  14. Agullo,Emmanuel;Buttari,Alfredo;Guermouche,Abdou;Lopez,Florent:为具有顺序任务流运行时系统的多核体系结构实现多前沿稀疏解算器(2016)
  15. Ghysels,Pieter;Li,Xiaoye S.;Rouet,François Henry;Williams,Samuel;Napov,Artem:使用随机抽样的新型HSS结构多前额解算器的高效多核实现(2016)
  16. Gonnet,Pedro:混合共享/分布式内存体系结构上平滑粒子流体力学的高效可伸缩算法(2015)
  17. Huismann,Immo;Stiller,Jörg;Fröhlich,Jochen:利用硬件异构性的流体力学算法的两级并行化(2015)
  18. Tillenius,Martin:Superglue:一个共享内存框架,使用数据版本控制实现基于依赖关系的任务并行化(2015)
  19. Tillenius,Martin;Larsson,Elisabeth;Lehto,Erik;Flyer,Natasha:大气流的可伸缩RBF-FD方法(2015年)
  20. Bigot,Julien;Hou,Zhengxiang;Pérez,Christian;Pichon,Vincent:一种低层次组件模型,可简化HPC应用程序的性能可移植性(2014)ioport公司

更多出版物请访问:http://starpu.gforge.inria.fr/#出版物