OASIcs,第116卷

第15次多核架构并行编程和运行时管理技术研讨会和第13次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)



缩略图PDF

事件

PARMA-DITAM 20242024年1月18日,德国慕尼黑

编辑

乔·比斯波
  • 葡萄牙波尔图大学
Sotirios Xydis公司
  • 希腊雅典国立技术大学
塞雷娜·柯泽尔
  • 意大利米兰理工大学
路易斯·米格尔·索萨
  • 葡萄牙波尔图大学

出版物详细信息

  • 发布时间:2024-03-01
  • 出版商:Schloss Dagstuhl–Leibniz Zentrum für Informatik
  • 国际标准图书编号:978-3-95977-307-2
  • DBLP:db/conf/hipeac/parma2024

接入号码

文件

找不到与您的筛选器选择匹配的文档。
文件
完整卷
OASIcs,第116卷,PARMA-DITAM 2024,完整卷

作者:Joáo Bispo、Sotirios Xydis、Serena Curzel和Luís Miguel Sousa


摘要
OASIcs,第116卷,PARMA-DITAM 2024,完整卷

引用为

第15期多核架构并行编程和运行时管理技术研讨会和第13期多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放获取系列(OASIcs),第116卷,第1-88页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2024)


将BibTex复制到剪贴板

@会议记录{bispo_et_al:OASIcs.PARMA-DITAM.2024,title={{OASIcs,第116卷,PARMA-DITAM 2024,完整卷}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页数={1--88},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/OASIcs.PARMA-DITAM.2024},URN={URN:nbn:de:0030-drops-196938},doi={10.4230/OASIcs.PARMA-DITAM.2024},annote={关键词:OASIcs,第116卷,PARMA-DITAM 2024,完整卷}}
文件
前端事务
封面、目录、前言、会议组织

作者:Joáo Bispo、Sotirios Xydis、Serena Curzel和Luís Miguel Sousa


摘要
封面、目录、前言、会议组织

引用为

第15期多核架构并行编程和运行时管理技术研讨会和第13期多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放存取丛书(OASIcs),第116卷,第0:i-0:x页,达格斯图尔-莱布尼茨-泽特鲁姆信息学研究所(2024)


将BibTex复制到剪贴板

@会议记录{bispo_et_al:OASIcs.PARMA-DITAM.2024.0,author={比斯波,乔\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,title={{正文,目录,前言,会议组织}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页面={0:i--0:x},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2024.0},URN={URN:nbn:de:0030-drops-196947},doi={10.4230/OASIcs.PARMA-DITAM.2024.0},注释={关键词:前言、目录、前言、会议组织}}
文件
邀请的谈话
欧洲空间技术研究背景下的高水平综合发展(受邀演讲)

作者:法布里奇奥·费兰迪(Fabrizio Ferrandi)、米歇尔·菲奥里托(Michele Fiorito)、克劳迪奥·巴龙(Claudio Barone)、乔瓦尼·戈齐(Giovanni Gozzi)和塞雷娜·柯泽尔(Serena Curzel)


摘要
欧洲提高空间服务部门竞争力的努力促进了先进软件和硬件解决方案的研发。欧盟资助的HERMES项目通过鉴定抗辐射、高性能可编程微处理器和开发软件生态系统来促进复杂应用程序在此类平台上的部署,为这项工作做出了贡献。该项目的主要目标包括在欧洲航天局、法国国家空间研究中心和欧洲联盟的项目内开发的带有陶瓷密封包CGA 1752的radhard NG-ULTRA FPGA达到6级技术成熟度(即在相关环境中验证和演示)。该项目同样重要的一部分致力于开发和验证支持多核软件编程和FPGA加速的工具。HERMES项目选择Bambu High-Level Synthesis工具,在其开发生态系统中集成将C/C++代码转换为Verilog/VHDL的功能。在HERMES中,Bambu已经并将得到扩展,以支持新的FPGA目标、架构模型、基于模型的设计和输入应用程序。因此,FPGA提供的增强性能也可用于不具备硬件设计专业知识的软件开发人员。

引用为

法布里奇奥·费兰迪(Fabrizio Ferrandi)、米歇尔·菲奥里托(Michele Fiorito)、克劳迪奥·巴龙(Claudio Barone)、乔瓦尼·戈齐(Giovanni Gozzi)和塞雷娜·柯泽尔(Serena Curzel)。欧洲空间技术研究背景下的高水平综合发展(受邀演讲)。第15次多核架构并行编程和运行时管理技术研讨会和第13次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放获取系列(OASIcs),第116卷,第1:1-1:12页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2024)


将BibTex复制到剪贴板

@会议记录{ferrandi_et_al:OASIcs.PARMA-DITAM.2024.1,author={费兰迪、法布里奇奥和菲奥里托、米歇尔·巴龙、克劳迪奥·戈齐、乔瓦尼和柯泽尔、塞雷娜},title={{欧洲空间技术研究背景下的高水平综合发展}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页数={1:1--1:12},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2024.1},URN={URN:nbn:de:0030-drops-196951},doi={10.4230/OASIcs.PARMA-DITAM.2024.1},annote={关键词:高级合成,radhard FPGAs}}
文件
加速器驱动的数据安排以最小化多核架构上的变压器运行时间

作者:Alireza Amirshahi、Giovanni Ansaloni和David Atienza


摘要
人工智能中变压器模型的复杂性不断增加,增加了其计算成本、内存使用和能耗。硬件加速通过为变压器模型设计量身定制的处理器和加速器来解决随之而来的挑战,从而高效地支持其计算热点。然而,内存带宽可能会阻碍硬件加速器的改进。在此背景下,本文提出了一种新的内存安排策略,该策略由硬件加速器的内核大小控制,有效地减少了片外数据访问。这种安排对于端到端变压器模型推断尤其有益,其中大多数计算基于通用矩阵乘法(GEMM)操作。此外,我们还讨论了这种内存数据安排范围内的变压器模型中非GEMM操作的开销。我们的研究探讨了所提议的加速器驱动数据排列方法在单核和多核系统中的实施和有效性。我们的评估表明,当使用最先进的变压器执行推断时,我们的方法可以实现2.7倍的速度提升。

引用为

Alireza Amirshahi、Giovanni Ansaloni和David Atienza。加速器驱动的数据安排,以最小化多核架构上的变压器运行时间。在第15次多核心体系结构并行编程和运行时管理技术研讨会和第13次多核心嵌入式计算平台设计工具和体系结构研讨会(PARMA-DITAM 2024)上。信息学开放存取系列(OASIcs),第116卷,第2:1-2:13页,Schloss Dagstuhl–Leibniz Zentrum für Informatik(2024)


将BibTex复制到剪贴板

@会议记录{amirshahi_et_al:OASIcs.PARMA-DITAM.2024.2,author={Amirshahi、Alireza和Ansaloni、Giovanni和Atienza、David},title={{加速器驱动的数据安排以最小化多核架构上的变压器运行时间}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页数={2:1--2:13},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2024.2},URN={URN:nbn:de:0030-drops-196960},doi={10.4230/OASIcs.PARMA-DITAM.2024.2},annote={关键词:内存安排,数据布局,硬件加速器,变压器模型,多核,系统仿真}}
文件
使用非聚合共享内存进行零拷贝、最小断电虚拟机迁移

作者:安德烈亚斯·格拉文廷、费利克斯·埃伯哈特、托比亚斯·扎戈尼、安德烈亚斯·波兰、米歇尔·加泽蒂和克里斯蒂安·平托


摘要
我们提出了一种新的虚拟机实时迁移范式,称为零拷贝迁移。通过使虚拟机的工作集通过透明的字节寻址分列内存在目标主机上可用,我们消除了对复制前阶段的需要,同时减少了复制后阶段对性能的影响。我们描述了基于QEMU-KVM和libvirt的所提出范式的开源实现,并通过在使用ThymeisFlow实现的内存分解系统的功能硬件原型上进行部署来评估该方法的效率。使用一系列可配置的基准测试,我们表明迁移的提前期和中断时间与传统的预拷贝、后拷贝和混合方法的最佳情况相同。从虚拟机中运行的应用程序的角度来看,内存延迟和吞吐量等关键性能指标提高了三个数量级,从而提高了数据中心实时迁移的灵活性和响应能力。

引用为

安德烈亚斯·格拉文廷、费利克斯·埃伯哈特、托比亚斯·扎戈尼、安德烈亚斯·波兰、米歇尔·加泽蒂和克里斯蒂安·平托。使用非聚合共享内存进行零拷贝、最小断电虚拟机迁移。第15次多核架构并行编程和运行时管理技术研讨会和第13次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放获取系列(OASIcs),第116卷,第3:1-3:13页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2024)


将BibTex复制到剪贴板

@会议记录{grapentin_et_al:OASIcs.PARMA-DITAM.2024.3,作者={Grapentin,Andreas和Eberhardt,Felix和Zagorni,Tobias和Polze,Andreas和Gazzetti,Michele和Pinto,Christian},title={{Zero-Copy,Minimal-Blackout Virtual Machine Migrations Using Disaggregated Shared Memory}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页数={3:1--3:13},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2024.3},URN={URN:nbn:de:0030-drops-196972},doi={10.4230/OASIcs.PARMA-DITAM.2024.3},annote={关键词:分解,分解内存,vm实时迁移,胸腺流,power9,opencapi,性能评估,零拷贝}}
文件
Rust内存安全编程语言的精确调优

作者:加布里埃尔·马格纳尼(Gabriele Magnani)、列夫·杰尼索夫(Lev Jenisov)、丹尼尔·卡塔诺(Daniele Cattaneo)、乔瓦尼·阿戈斯塔(Giovanni Agosta)和斯特凡诺·切鲁宾(Stefano Cherubin)


摘要
精确调整是一种越来越常见的方法,用于在能效或加速与精度之间进行权衡。当必须从嵌入式平台等计算系统中提取最大性能时,其有效性尤其强。在这些背景下,当前的工程实践中,C和C++等内存-非安全编程语言占据主导地位。然而,由于这些语言的不安全性质导致了严重的软件漏洞,因此受到了严格审查。因此,有人建议用更安全的编程语言来替代,这些语言通过设计来防止与内存相关的错误。在这些更安全的编程语言中,最受欢迎的语言之一是Rust。在这项工作中,我们采用了最先进的精密调整工具TAFFO,以在Rust代码上运行。通过将PolyBench/C基准测试套件移植到Rust,我们表明,使用更安全的编程语言不会影响精度调整的有效性,而且可以成功地保留语言的安全属性。具体来说,由于使用了精确调整,使用TAFFO和Rust,我们比基本Rust代码实现了15倍的加速。

引用为

Gabriele Magnani、Lev Jenisov、Daniele Cattaneo、Giovanni Agosta和Stefano Cherubin。精确调整Rust Memory-Safe编程语言。第15次多核架构并行编程和运行时管理技术研讨会和第13次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放获取系列(OASIcs),第116卷,第4:1-4:12页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2024)


将BibTex复制到剪贴板

@会议记录{magnani_et_al:OASIcs.PARMA-DITAM.2024.4,作者={Magnani、Gabriele和Jenisov、Lev和Cattaneo、Daniele和Agosta、Giovanni和Cherubin、Stefano},title={{精确调整Rust Memory-Safe编程语言}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页数={4:1--4:12},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2024.4},URN={URN:nbn:de:0030-drops-196989},doi={10.4230/OASIcs.PARMA-DITAM.2024.4},annote={关键词:近似计算,内存安全,精度调整}}
文件
基于跨层并行化的嵌入式多核代码生成

作者:Oliver Oey、Michael Huebner、Timo Stripf和Juergen Becker


摘要
本文提出了一种使用跨层并行化优化嵌入式多核系统C代码的方法。该方法分为两个阶段。首先是在不优化目标平台的情况下开发算法。然后,第二步是跨四个定义层(即算法层、代码层、任务层和数据层)优化和并行化代码,以便在目标硬件上高效执行。每一层侧重于选定的硬件特性。通过使用迭代方法,单个内核和复合算法可以很好地适应硬件上的执行,而无需进一步调整算法本身。这种跨层并行化的实现包括算法识别、代码转换、任务分配以及插入同步和通信语句。该方法首先在公共核上进行评估,然后在样本图像处理算法上进行评估以展示该方法的优点。与仅依赖于其中两层或三层的其他方法相比,可以获得20%到30%的额外性能增益。

引用为

Oliver Oey、Michael Huebner、Timo Stripf和Juergen Becker。具有跨层并行化的嵌入式多核代码生成。第15次多核架构并行编程和运行时管理技术研讨会和第13次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放获取系列(OASIcs),第116卷,第5:1-5:13页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2024)


将BibTex复制到剪贴板

@会议记录{oey_et_al:OASIcs.PARMA-DITAM.2024.5,author={Oey、Oliver和Huebner、Michael和Stripf、Timo和Becker、Juergen},title={{具有跨层并行化的嵌入式多核代码生成}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},页数={5:1--5:13},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/OASIcs.PARMA-DITAM.2024.5},URN={URN:nbn:de:0030-drops-196990},doi={10.4230/OASIcs.PARMA-DITAM.2024.5},annote={关键词:并行化,多核处理器,基于模型的开发,代码生成}}
文件
用FPGA加速大尺度图形处理:经验教训和未来方向

作者:马可·普洛卡西尼、阿明·萨赫比、马可·巴本、韦恩·卢克、乔治·盖德贾吉耶夫和罗伯托·乔治


摘要
大规模处理图形会带来一系列困难,包括不规则的内存访问模式、设备内存限制以及分布式系统中有效分区的需要,所有这些都可能导致CPU和GPU等传统体系结构上的性能问题。为了应对这些挑战,最近的研究强调在分布式框架中使用现场可编程门阵列(FPGA),利用FPGA在分布式环境中的能力来加速图形处理。本文研究了多FPGA分布式体系结构与分区系统相结合提高数据局部性和减少分区间通信的有效性。该框架在更高级别上利用Hadoop,将图形映射到硬件,有效地将预处理的数据分发到FPGA。FPGA处理引擎集成到集群框架中,使用离线分区来进行大规模图形分发,从而优化数据传输。该框架的第一个评估基于流行的PageRank算法,该算法根据节点的重要性为图中的每个节点分配一个值。在大规模图形领域,单个FPGA解决方案的性能优于受内存容量限制的GPU解决方案,并且CPU加速比12x提高了26倍。此外,当单个FPGA设备因图形大小而受到限制时,我们的性能模型表明,具有多个FPGA的分布式系统可以将性能提高约12倍。这突出了我们的解决方案在处理超过芯片内存限制的大型数据集方面的有效性。

引用为

Marco Procaccini、Amin Sahebi、Marco Barbone、Wayne Luk、Georgi Gaydadjiev和Roberto Giorgi。用FPGA加速大尺度图形处理:经验教训和未来方向。第15次多核架构并行编程和运行时管理技术研讨会和第13次多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)。信息学开放获取系列(OASIcs),第116卷,第6:1-6:12页,Dagstuhl–Leibniz-Zentrum für Informatik Schloss(2024)


将BibTex复制到剪贴板

@会议记录{proccini_et_al:OASIcs.PARMA-DITAM.2024.6,author={普罗卡西尼、马可和萨赫比、阿明和巴本、马可与卢克、韦恩和盖德贾吉耶夫、乔治·乔治·罗伯托},title={{用FPGA加速大尺度图形处理:经验教训和未来方向}},booktitle={第十五届多核架构并行编程和运行时管理技术研讨会和第十三届多核嵌入式计算平台设计工具和架构研讨会(PARMA-DITAM 2024)},pages={6:1-6:12},series={信息学开放存取系列(OASIcs)},国际标准图书编号={978-3-95977-307-2},ISSN={2190-6807},年份={2024},体积={116},editor={Bispo,Jo\~{a} o个西迪斯、索提里奥斯和柯泽尔、塞雷娜和索萨、卢·米格尔,publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/OASIcs.PARMA-DITAM.2024.6下载},URN={URN:nbn:de:0030-drops-197003},doi={10.4230/OASIcs.PARMA-DITAM.2024.6},annote={关键词:图形处理、分布式计算、网格分区、FPGA、加速器}}

过滤器


问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件