OASIcs,第88卷

第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)



缩略图PDF

事件

PARMA-DITAM 20212021年1月19日,匈牙利布达佩斯

编辑

乔·比斯波
  • 葡萄牙波尔图大学
斯特凡诺·切鲁宾
  • Codeplay Software Ltd,英国伦敦
何塞·弗利奇
  • 西班牙瓦伦西亚政治大学

出版物详细信息

  • 发布时间:2021-03-02
  • 出版商:Schloss Dagstuhl–Leibniz Zentrum für Informatik
  • ISBN:978-3-95977-181-8
  • DBLP:db/conf/hipeac/parma2021

访问号码

文件

找不到与您的筛选器选择匹配的文档。
文件
完整卷
OASIcs,第88卷,PARMA-DITAM 2021,完整卷

作者:乔·比斯波、斯特凡诺·切鲁宾和何塞·弗利奇


摘要
OASIcs,第88卷,PARMA-DITAM 2021,完整卷

引用为

第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)。信息学开放获取系列(OASIcs),第88卷,第1-78页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2021)


将BibTex复制到剪贴板

@会议记录{bispo_et_al:OASIcs.PARMA-DITAM.2021,title={{OASIcs,第88卷,PARMA-DITAM 2021,完整卷}},booktitle={第十二届多核架构并行编程和运行时管理技术研讨会和第十届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)},页数={1--78},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/OASIcs.PARMA-DITAM.2021},URN={URN:nbn:de:0030-drops-136352},doi={10.4230/OASIcs.PARMA-DITAM.2021},annote={关键词:OASIcs,第88卷,PARMA-DITAM 2021,完整卷}}
文件
前部物质
封面、目录、前言、会议组织

作者:乔·比斯波、斯特凡诺·切鲁宾和何塞·弗利奇


摘要
封面、目录、前言、会议组织

引用为

第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)。信息学开放存取丛书(OASIcs),第88卷,第0:i-0:x页,达格斯图尔-莱布尼茨-泽特鲁姆信息学研究所(2021)


将BibTex复制到剪贴板

@会议记录{bispo_et_al:OASIcs.PARMA-DITAM.2021.0,author={比斯波,乔\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,title={{正文,目录,前言,会议组织}},booktitle={第十二届多核架构并行编程和运行时管理技术研讨会和第十届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)},页面={0:i--0:x},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2021.0},URN={URN:nbn:de:0030-drops-136364},doi={10.4230/OASIcs.PARMA-DITAM.2021.0},注释={关键词:前言、目录、前言、会议组织}}
文件
面向自适应多替代过程网络

作者:哈斯娜·布拉乌伊(Hasna Bouraoui)、查德利亚·杰拉德(Chadlia Jerad)和杰罗尼莫·卡斯特里隆(Jeronimo Castrillon)


摘要
随着语音控制系统的增加,基于语音的识别应用越来越受到重视。这些应用程序需要适应硬件平台以提供所需的性能。考虑到这些应用程序的流性质,数据流模型是在并行嵌入式平台上基于模型设计和执行的常见选择。然而,当今的大多数模型都是建立在经典静态数据流之上,并通过自适应扩展来表示数据并行性。在本文中,我们定义并描述了一种算法自适应性方法,以表示更丰富的变量集和权衡。为此,我们引入了多替代流程网络(mAPN),这是一种高级抽象表示,其中同一应用程序的多个流程网络共存。我们描述了一种自动生成所有可能备选方案的算法。mAPN包含丰富的元数据,用于为备选方案提供特定度量的注释,帮助根据可用的计算资源和应用程序/用户约束提取最合适的备选方案。我们通过自动字幕应用程序(ASA)作为用例来激励该方法,并在由12个随机选择的可能变体组成的mAPN样本上运行实验。

引用为

哈斯娜·布劳伊(Hasna Bouraoui)、查德利亚·杰拉德(Chadlia Jerad)和杰罗尼莫·卡斯特里隆(Jeronimo Castrillon)。迈向自适应多替代过程网络。第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)。信息学开放获取系列(OASIcs),第88卷,第1:1-1:11页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2021)


将BibTex复制到剪贴板

@会议记录{bouraoui_et_al:OASIcs.PARMA-DITAM.2021.1,author={布劳伊、哈斯纳和杰拉德、查德利亚和卡斯特里隆、杰罗尼莫},title={{Towards Adaptive Multi-Alternative Process Network}},booktitle={第十二届多核架构并行编程和运行时管理技术研讨会和第十届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)},页数={1:1--1:11},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2021.1},URN={URN:nbn:de:0030-drops-136378},doi={10.4230/OASIcs.PARMA-DITAM.2021.1},annote={关键词:高级过程网络,算法适应性,自动字幕应用}}
文件
BifurKTM:用于GPU的近似一致分布式事务内存

作者:塞缪尔·欧文、卢鹏、科斯塔斯·布施和Jih-Kwon Peir


摘要
我们介绍了第一个用于GPU集群的读优化分布式事务存储系统BifurKTM。BifurKTM的设计包括:GPU KoSTM,一种新的软件事务内存冲突检测方案,利用放松的一致性来提高吞吐量;KoDTM是一种分布式事务内存模型,它结合了数据流和控制流模型,大大减少了通信开销。尽管GPU具有巨大的加速能力,但由于其可编程性和对工作负载特性的极端敏感性,其使用受到了限制。在考虑分布式GPU集群时,这些问题令人担忧,程序员必须设计算法,通过利用数据规则性、高计算强度等来隐藏通信延迟。BifurKTM设计允许GPU程序员利用一个新的工作负载特征:只读工作负载的百分比(例如,读取但不修改共享内存),即使事先不知道这个百分比。程序员指定适合于近似一致性的事务,在近似一致性中,事务“看起来”是在最方便的时间执行的,以防止冲突。通过利用只读事务的近似一致性,BifurKTM运行时系统提供了改进的性能、应用程序灵活性和可编程性,而不会在共享内存中引入任何错误。我们的实验表明,在网络通信利用率适中且工作负载为读密集型的应用程序中,近似一致性可以将BkTM性能提高多达34倍。使用近似一致性,BkTM可以将GPU到GPU的网络通信减少99%,将中止次数最多减少100%,并在同样大小的CPU集群上实现18倍的平均加速,同时程序员只需付出最小的努力。

引用为

塞缪尔·欧文(Samuel Irving)、卢鹏(Lu Peng)、科斯塔斯·布施(Costas Busch)和Jih-Kwon Peir。BifurKTM:用于GPU的近似一致分布式事务内存。第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)。信息学开放获取系列(OASIcs),第88卷,第2:1-2:15页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2021)


将BibTex复制到剪贴板

@会议记录{irving_et_al:OASIcs.PARMA-DITAM.2021.2,author={欧文、塞缪尔和彭、卢和布施、科斯塔斯和佩尔、Jih-Kwon},title={{BifurKTM:GPU的近似一致分布式事务内存}},booktitle={多核心架构的并行编程和运行时管理技术第12次研讨会和多核心嵌入式计算平台的设计工具和架构第10次研讨会(PARMA-DITAM 2021)},页数={2:1--2:15},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2021.2},URN={URN:nbn:de:0030-drops-136386},doi={10.4230/OASIcs.PARMA-DITAM.2021.2},annote={关键词:GPU,分布式事务内存,近似一致性}}
文件
精度调整对嵌入式系统性能的影响:以现场定向控制为例

作者:Gabriele Magnani、Daniele Cattaneo、Michele Chiari和Giovanni Agosta


摘要
磁场定向控制(FOC)是控制感应电机和其他类型基于交流的电机的行业标准策略。这种控制方案在数字实现时具有很高的运算强度,尤其需要使用三角函数。这一要求与在需要时增加控制步进频率的必要性以及在节省电池寿命至关重要的应用(如无人机)中最小化功耗形成对比。然而,它也使FOC非常适合使用精确调整技术进行优化。因此,我们利用最先进的FixM方法,通过应用三角函数的精确调整来优化模拟典型FOC应用程序的迷你应用程序。对FixM方法本身进行了扩展,以实现额外的算法选择,从而在执行时间和代码大小之间进行权衡。通过在迷你应用程序上应用FixM,我们实现了278%的加速,但输出误差小于0.1%。

引用为

Gabriele Magnani、Daniele Cattaneo、Michele Chiari和Giovanni Agosta。精度调整对嵌入式系统性能的影响:以现场定向控制为例。第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)。信息学开放获取系列(OASIcs),第88卷,第3:1-3:13页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2021)


将BibTex复制到剪贴板

@会议记录{magnani_et_al:OASIcs.PARMA-DITAM.2021.3,作者={Magnani、Gabriele和Cattaneo、Daniele和Chiari、Michele和Agosta、Giovanni},title={{精度调整对嵌入式系统性能的影响:面向现场控制的案例研究}},booktitle={第十二届多核架构并行编程和运行时管理技术研讨会和第十届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)},页数={3:1--3:13},series={信息学开放存取系列(OASIcs)},ISBN={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/OASIcs.PARMA-DITAM.2021.3},URN={URN:nbn:de:0030-drops-136390},doi={10.4230/OASIcs.PARMA-DITAM.2021.3},annote={关键词:近似计算,面向现场的控制,精度调整}}
文件
Kubernetes基础设施中的资源感知GPU调度

作者:阿格洛斯·费里科格鲁(Aggelos Ferikoglou)、迪莫斯坦尼斯·马苏罗斯(Dimostenis Masouros)、阿奇利亚斯·齐内托普洛斯(Achilleas Tzenetopoulos)、索提里奥斯·西迪斯(Sotirios Xydis)和迪米特里奥斯·索德斯


摘要
如今,在云上推送和执行的人工智能推理工作负载越来越多。为了有效地服务和管理计算需求,数据中心运营商已经为其基础架构配置了加速器。特别是对于GPU,作为最先进的调度器和协调器,对高效管理的支持不足,这只会威胁到GPU作为典型的计算资源,而忽视其独特的特性和应用程序属性。这种现象再加上GPU过度配置问题,导致严重的资源利用不足。尽管之前的工作已经通过将应用程序合并到单个加速器设备来解决了这个问题,但其资源不可知的特性并没有解决资源利用不足和服务质量违规问题,尤其是对于延迟关键型应用程序。在本文中,我们设计了一个资源感知的GPU调度框架,能够在同一个GPU加速卡上高效地协作应用程序。我们将我们的解决方案与Kubernetes集成,Kubernete是使用最广泛的云编排框架之一。我们的调度器可以实现58.8%的端到端作业执行时间减少99%,同时在各种ML代表性工作负载下,GPU内存使用率提高52.5%,平均GPU利用率提高105.9%,平均能耗降低44.4%。

引用为

Aggelos Ferikoglou、Dimostenis Masouros、Achilleas Tzenetopoulos、Sotirios Xydis和Dimitrios Soudris。Kubernetes基础设施中的资源感知GPU调度。第12次多核架构并行编程和运行时管理技术研讨会和第10次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)。信息学开放存取系列(OASIcs),第88卷,第4:1-4:12页,Schloss Dagstuhl–Leibniz Zentrum für Informatik(2021)


将BibTex复制到剪贴板

@会议记录{ferikoglou_et_al:OASIcs.PARMA-DITAM.2021.4,author={Ferikoglou、Aggelos和Masouros、Dimostenis和Tzenetopoulos、Achilleas和Xydis、Sotirios和Soudris、Dimitrios},title={{Kubernetes基础设施中的资源感知GPU调度}},booktitle={第十二届多核架构并行编程和运行时管理技术研讨会和第十届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)},pages={4:1-4:12},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2021.4},URN={URN:nbn:de:0030-drops-136403},doi={10.4230/OASIcs.PARMA-DITAM.2021.4},annote={关键词:云计算,GPU调度,kubernetes,异构}}
文件
受邀论文
HPC应用程序云化:StreamFlow工具包(特邀论文)

作者:伊亚科波·科隆内利、芭芭拉·坎塔卢波、罗伯托·埃斯波西托、马蒂奥·佩尼西、康塞托·斯帕皮纳托和马尔科·阿尔迪努奇


摘要
寻找一种有效的方法来改善高性能计算设施的可访问性,仍然依赖于基于SSH的远程shell和基于队列的作业提交机制,这是计算机科学中的一个公开问题。这项工作提倡通过集群加速模式对HPC应用程序进行云化,在这种模式下,托管在云上的主执行流中计算要求较高的部分找到了提高高性能计算设施可访问性的有效方法,仍然依赖于基于SSH的远程shell和基于队列的作业提交机制,这是计算机科学中的一个公开问题。这项工作提倡通过集群作为加速器模式对HPC应用程序进行云化,在这种模式下,托管在云基础设施上的主要执行流中计算需求较高的部分可以卸载到HPC环境中,以加快它们的速度。我们引入了StreamFlow,这是一个新的工作流管理系统,它支持这样的设计模式,并且可以在没有共享存储的独立处理元素上运行标准工作流模型的步骤。我们验证了该方法在CLAIRE COVID-19通用管道上的有效性,即一种可重复的工作流,能够根据基于深度神经网络(DNN)的CT扫描图像自动比较(可能所有)最先进的管道,以诊断COVID-20间质性肺炎。

引用为

亚科波·科隆内利、芭芭拉·坎塔卢波、罗伯托·埃斯波西托、马特奥·佩尼西、康塞托·斯帕帕尼亚托和马可·阿尔迪努奇。HPC应用程序云化:StreamFlow工具包(特邀论文)。在第12次多核心体系结构并行编程和运行时管理技术研讨会和第10次多核心嵌入式计算平台设计工具和体系结构研讨会(PARMA-DITAM 2021)上。信息学开放获取系列(OASIcs),第88卷,第5:1-5:13页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2021)


将BibTex复制到剪贴板

@会议记录{colonnelli_et_al:OASIcs.PARMA-DITAM.2021.5,作者={Colonnelli、Iacopo和Cantalupo、Barbara和Esposito、Roberto和Pennisi、Matteo和Spampinato、Concetto和Aldinucci、Marco},title={{HPC应用程序云化:StreamFlow工具包}},booktitle={第十二届多核架构并行编程和运行时管理技术研讨会和第十届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2021)},页数={5:1--5:13},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-181-8},ISSN={2190-6807},年份={2021},体积={88},editor={Bispo,Jo\~{a} 哦基路宾、斯特凡诺、弗利奇、乔斯,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2021.5},URN={URN:nbn:de:0030-drops-136419},doi={10.4230/OASIcs.PARMA-DITAM.2021.5},annote={关键词:云计算、分布式计算、高性能计算、流、工作流管理系统}}

过滤器


问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件