研究论文

APEX：使用频繁子图分析的自动化处理元素设计空间探索框架

作者信息和声明

ASPLOS 2023:第28届ACM编程语言和操作系统架构支持国际会议记录，第3卷2023年3月第33-45页https://doi.org/10.1145/3582016.358202070

出版：2023年3月25日出版历史

ASPLOS 2023:第28届ACM编程语言和操作系统架构支持国际会议记录，第3卷

第33-45页

摘要

粗粒度可重构阵列（CGRA）处理单元（PE）的体系结构对运行在CGRA上的应用程序的性能和能效有着重要影响。本文介绍了APEX，一种为应用程序或应用程序域生成专用PE架构的自动化方法。APEX首先使用频繁子图挖掘分析应用程序域基准，以提取常见的计算子图。然后，APEX通过使用数据路径图合并算法合并子图来生成专门的PE。合并后的数据路径图被转换为PE规范，根据该规范，我们在Verilog中自动生成PE硬件描述，以及将应用程序映射到PE的编译器。PE硬件和编译器被插入到灵活的CGRA生成和编译工具链中，允许灵活评估CGRA。我们评估了两个领域的APEX，机器学习和图像处理。对于图像处理应用，与通用CGRA相比，我们使用专用PE自动生成的CGRA的面积减少了5%至30%，能耗减少了22%至46%。对于机器学习应用程序，我们自动生成的CGRA与通用CGRA相比，能耗减少16%至59%，面积减少22%至39%。这项工作为创建应用程序域驱动的设计空间探索框架铺平了道路，该框架可以自动生成高效的可编程加速器，而硬件和编译器生成的设计工作量要少得多。

工具书类

乔瓦尼·安萨洛尼（Giovanni Ansaloni）、保罗·邦齐尼（Paolo Bonzini）和劳拉·波齐（Laura Pozzi）。2008.表达粒度可重构阵列的设计和架构探索。2008年应用特定处理器研讨会。https://doi.org/10.109/SASP.2008.4570782谷歌学者数字图书馆
Kubilay Atasu、Laura Pozzi和Paolo Ienne。2003.自动应用程序特定指令-设置微体系结构约束下的扩展。第40届设计自动化年会（DAC’03）会议记录。计算机械协会，美国纽约州纽约市256–261。国际标准编号：1581136889https://doi.org/10.1145/775832.775897谷歌学者数字图书馆
Rick Bahr、Clark Barrett、Nikhil Bhagdikar、Alex Carsello、Ross Daly、Caleb Donovick、David Durst、Kayvon Fathalian、Kathleen Feng、Pat Hanrahan、Teguh Hofstee、Mark Horowitz、Dillon Huff、Fredrik Kjolstad、Taeyong Kong、Qiaoyi Liu、Makai Mann、Jackson Melchert、Ankita Nayak、Aina Niemetz、Gedeon Nyengele、Priyanka Raina、Stephen Richardson，Raj Setaluri、Jeff Setter、Kavya Sreedhar、Maxwell Strange、James Thomas、Christopher Torn、Leonard Truong、Nestan Tsiskaridze和Keyi Zhang。2020年，创建敏捷硬件设计流程。2020年，第57届ACM/IEEE设计自动化会议（DAC）。https://doi.org/10.109/DAC18072.2020.9218553谷歌学者交叉引用
Thilini Kaushalya Bandara、Dhananjaya Wijerathne、Tulika Mitra和Li-Shiuan Peh。2022.REVAMP：异构CGRA实现的系统框架。第27届ACM编程语言和操作系统体系结构支持国际会议论文集（ASPLOS’22）。美国纽约州纽约市计算机械协会：9781450392051https://doi.org/10.1145/3503222.3507772谷歌学者数字图书馆
克拉克·巴雷特和塞萨尔·蒂内利。2018年，可满足性模理论。在《模型检查手册》中，Edmund M.Clarke、Thomas A.Henzinger、Helmut Veith和Roderick Bloem（编辑）。施普林格国际出版公司。isbn:978-3-319-10575-8https://doi.org/10.1007/978-3-319-10575-8_11谷歌学者交叉引用
埃利·本德斯基。2013.LLVM代码生成器的更深入研究，第1部分。https://eli.thegreeplace.net/2013/02/25/a-deper-look-into-the-lvm-code-generator-part-1谷歌学者
Robert Brummayer、Armin Biere和Florian Lonsing。2008年。BTOR：模型检查的单词级问题的位精确建模。第六届可满足模理论国际研讨会和第一届位精确推理国际研讨会（SMT’08/BPR’08）联合研讨会论文集。美国纽约州纽约市计算机械协会：9781605584409https://doi.org/10.1145/1512464.1512472谷歌学者数字图书馆
皮埃尔·伊夫·卡兰德（Pierre-Yves Calland）、安妮·米格诺特（Anne Mignotte）、奥利维尔·佩兰（Olivier Peyran）、伊夫·罗伯特（Yves Robert）和费雷德里克·费雯（Frédéric Vivien）。1998年，重新定时DAG。IEEE集成电路和系统计算机辅助设计汇刊，https://doi.org/10.109/43.736571谷歌学者数字图书馆
洪成（Hong Cheng）、阎喜凤（Xifeng Yan）和韩嘉伟（Jiawei Han）。2010.挖掘图形模式。美国马萨诸塞州波士顿斯普林格市：978-1-4419-6045-0https://doi.org/10.1007/978-1-4419-6045-0_12谷歌学者交叉引用
詹森·聪（Jason Cong）、范一平（Yiping Fan）、韩国玲（Guoling Han）和张志如（Zhiru Zhang）。2004.可配置处理器体系结构的特定于应用程序的指令生成。2004年ACM/SIGDA第12届现场可编程门阵列国际研讨会论文集（FPGA'04）。美国纽约州纽约市计算机械协会：1581138296https://doi.org/10.1145/968280.968307谷歌学者数字图书馆
罗斯·戴利、卡莱布·多诺维奇、杰克逊·梅尔切特、拉杰克·塞塔卢里、内斯塔·齐斯卡里兹·布洛克、普里扬卡·雷纳、克拉克·巴雷特和帕特·汉拉罕。2022.使用SMT从RTL合成指令选择重写规则。在计算机辅助设计形式化方法会议（FMCAD）上。139–150. https://doi.org/10.34727/2022/isbn.978-3-85448-053-2_20谷歌学者交叉引用
罗斯·戴利（Ross Daly）、伦纳德·特朗（Leonard Truong）和帕特·汉拉汉（Pat Hanrahan）。2018.使用CoreIR从多个硬件语言调用和链接生成器。在开源EDA技术（WOSET）研讨会上。https://woset-workshop.github.io/PDFs/2018/a11.pdf谷歌学者
穆罕默德·埃尔西迪（Mohammed Elseidy）、埃哈布·阿卜杜勒哈米德（Ehab Abdelhamid）、斯皮洛斯·斯基亚多普洛斯（Spiros Skiadopoulos）和帕诺斯·卡尼斯（Panos Kalnis）。2014.GraMi：单个大图中的频繁子图和模式挖掘。程序。荷兰VLDB。，发行编号：2150-8097https://doi.org/10.14778/2732286.2732289谷歌学者数字图书馆
罗伯特。B·希区柯克、戈登·L·史密斯和大卫·D·程。1982.计算机硬件时序分析。IBM研究与开发杂志，https://doi.org/10.1147/rd.261.01万谷歌学者数字图书馆
Dillon Huff、Steve Dai和Pat Hanrahan。2021.时钟工作：FPGA上多速率图像处理应用的资源高效静态调度。2021年ACM/SIGDA现场可编程门阵列国际研讨会（FPGA’21）。美国纽约州纽约市计算机械协会：9781450382182https://doi.org/10.1145/3431920.3439457谷歌学者数字图书馆
Kalhan Koul、Jackson Melchert、Kavya Sreedhar、Leonard Truong、Gedeon Nyengele、Keyi Zhang、Qiaoyi Liu、Jeff Setter、Po-Han Chen、Yuchen Mei、Maxwell Strange、Ross Daly、Caleb Donovick、Alex Carsello、Taeyong Kong、Kathleen Feng、Dillon Huff、Ankita Nayak、Rajsekhar Setaluri、James Thomas、Nikhil Bhagdikar、David Durst、Zachary Myers、，内斯塔·齐斯卡里泽、斯蒂芬·理查德森、里克·巴尔、凯文·法塔哈利安、帕特·汉拉罕、克拉克·巴雷特、马克·霍洛维茨、克里斯托弗·托恩、弗雷德里克·克约尔斯塔德和普里扬卡·雷纳。2022.AHA：设计粗训练可重构加速器和编译器的敏捷方法。ACM嵌入式计算系统汇刊，7月，issn:1539-9087https://doi.org/10.1145/3534933谷歌学者数字图书馆
刘思浩（Sihao Liu）、王建翁（Jian Weng）、库普什（Dylan Kupsh）、阿特菲赫·索拉比扎德（Atefeh Sohrabizadeh）、王正荣（Zhengrong Wang）、郭立成（Licheng Guo）、刘久阳（Jiuyang Liu），朱林（Maxim Zulin）、马尼（Rishabh Mani）、张鹿城（Lucheng Zhang）、聪（Jason Cong）和托尼·诺瓦茨基（Tony Nowatzki）。2022.OverGen:通过特定域覆盖生成提高FPGA可用性。2022年，第55届IEEE/ACM国际微体系结构研讨会（MICRO）。https://doi.org/10.109/MICRO56248.2022.00018谷歌学者数字图书馆
Nahri Moreano、Edson Borin、Cid C.de Souza和Guido Araujo。2005.针对部分可重新配置架构的高效数据路径合并。IEEE集成电路和系统计算机辅助设计汇刊，https://doi.org/10.109/TCAD.2005.850844谷歌学者数字图书馆
Raghu Prabhakar、Yaqi Zhang、David Koeplinger、Matt Feldman、Tian Zhao、Stefan Hadjis、Ardavan Pedram、Christos Kozyrakis和Kunle Olukotun。2017年，《Plasticine：并行模式的可重构架构》。2017年ACM/IEEE第44届计算机体系结构国际年会（ISCA）。https://doi.org/10.1145/3079856.3080256谷歌学者数字图书馆
Jonathan Ragan Kelley、Connelly Barnes、Andrew Adams、Sylvain Paris、Frédo Durand和Saman Amarasinghe。2013年，Halide:一种用于优化图像处理管道中的并行性、局部性和重新计算的语言和编译器。SIGPLAN否。，发行编号：0362-1340https://doi.org/10.1145/2499370.2462176谷歌学者数字图书馆
爱德华·罗斯滕和汤姆·德拉蒙德。2006.高速拐角检测的机器学习。在《计算机视觉–ECCV 2006》中，AlešLeonardis、Horst Bischof和Axel Pinz（编辑）。柏林施普林格-海德堡，柏林，海德堡isbn:978-3-540-33833-8https://doi.org/10.1007/11744023_34谷歌学者数字图书馆
Yakun Sophia Shao、Jason Clemons、Rangharajan Venkatesan、Brian Zimmer、Matthew Fojtik、Nan Jiang、Ben Keller、Alicia Klinefelter、Nathaniel Pinckney、Priyanka Raina、Stephen G.Tell、Yanqing Zhang、William J.Dally、Joel Emer、C.Thomas Gray、Brucek Khailany和Stephen W.Keckler。2019.Simba：利用基于多芯片模块的架构扩展深度学习推断。在MICRO中。编号：9781450369381https://doi.org/10.1145/3352460.3358302谷歌学者数字图书馆
Cheng Tan、Chenhao Xie、Ang Li、Kevin J.Barker和Antonino Tumeo。2021.AURORA：粗训练可重构加速器的自动优化。2021年欧洲设计、自动化和测试会议及展览会（日期）。https://doi.org/10.23919/DATE51398.2021.9473955谷歌学者交叉引用
罗素·特西尔（Russell Tessier）、肯尼斯·波切克（Kenneth Pocek）和安德烈·德洪（AndréDeHon）。2015年。可重新配置的计算体系结构。程序。电气与电子工程师协会，https://doi.org/10.109/JPROC.2014.2386883谷歌学者交叉引用
Lenny Truong和Pat Hanrahan。2019.硬件描述语言的黄金时代：应用编程语言技术提高设计生产力。2019年5月16日至17日，第三届编程语言进步峰会，2019年SNAPL，美国RI普罗维登斯，Benjamin S.Lerner，Rastislav Bodik和Shriram Krishnamurthi（编辑）（LIPIcs）。达格斯图尔-莱布尼兹·泽特鲁姆宫（Schloss Dagstuhl-Leibniz-Zentrum für Informatik）。https://doi.org/10.4230/LIPIcs.SNAPL.2019.7谷歌学者交叉引用
阿特姆·瓦西利耶夫（Artem Vasilyev）、尼基尔·巴格迪卡尔（Nikhil Bhagdikar）、阿尔达文·佩德拉姆（Ardavan Pedram）、斯蒂芬·理查森（Stephen Richardson）、沙哈尔·克瓦廷斯基（Shahar Kvatinsky）和马克·。2016.评估成像和视觉应用程序的可编程架构。2016年第49届IEEE/ACM国际微体系结构研讨会（MICRO）。https://doi.org/10.109/MICRO.2016.7783755谷歌学者交叉引用
加内什·文卡泰什、杰克·桑普森、内森·古尔丁、萨图尼诺·加西亚、弗拉迪斯拉夫·布雷克辛、何塞·卢戈·马丁内斯、史蒂文·斯旺森和迈克尔·贝德福德·泰勒。2010年，《保护核心：减少成熟计算的能量》。第十五届编程语言和操作系统体系结构支持国际会议（ASPLOS XV）论文集。美国纽约州纽约市计算机械协会：9781605588391https://doi.org/10.1145/1736020.1736044谷歌学者数字图书馆
Ganesh Venkatesh、Jack Sampson、Nathan Goulding-Hotta、Sravanthi Kota Venkata、Michael Bedford Taylor和Steven Swanson。2011年，QsCores:利用准特定内核交易暗硅以获得可扩展的能效。第44届IEEE/ACM国际微体系结构研讨会（MICRO-44）论文集。美国纽约州纽约市计算机械协会：9781450310536https://doi.org/10.1145/2155620.2155640谷歌学者数字图书馆
Jian Weng、Sihao Liu、Vidushi Dadu、Zhengrong Wang、Preyas Shah和Tony Nowatzki。2020年，DSAGEN：合成可编程空间加速器。2020年，ACM/IEEE第47届计算机体系结构国际年会（ISCA）。https://doi.org/10.109/ISCA45697.2020.00032谷歌学者数字图书馆
Max Willsey、Vincent T.Lee、Alvin Cheung、Rastislav Bodík和Luis Ceze。2019.使用循环编译器迭代搜索可重新配置的加速器块。IEEE集成电路和系统计算机辅助设计汇刊，https://doi.org/10.109/TCAD.2018.2878194谷歌学者交叉引用

索引术语

APEX：使用频繁子图分析的自动化处理元素设计空间探索框架
1. 硬件
  1. 集成电路
    1. 可重构逻辑和FPGA

建议

通过运行时可重构硬件加速指纹图像处理

据作者所知，这是第一篇在动态部分自重构现场可编程门阵列（FPGA）下实现完整的基于指纹的自动认证系统（AFAS）应用的简介。主要。。。
阅读更多信息
使用算术级硬件设计空间探索——可配置多处理器平台的软件联合仿真

可配置的多处理器平台由FPGA设备上配置的多个软处理器组成。它们已经成为实现许多计算应用程序的一个有吸引力的选择。除了分发软件执行的各种方法之外。。。
阅读更多信息
CGRA上卷积神经网络分层并行执行的设计空间探索
SCOPES’20：第23届嵌入式系统软件和编译器国际研讨会会议记录

在这项工作中，我们系统地研究了卷积神经网络（CNN）到粗粒度可重构阵列（CGRA）的分层并行映射的吞吐量、能量和硬件成本的设计空间。我们推导出一个分析模型。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
ASPLOS 2023:第28届ACM编程语言和操作系统架构支持国际会议记录，第3卷
2023年3月
820页
国际标准图书编号：9781450399180
内政部：10.1145/3582016
总主席：
托尔·阿莫特
加拿大不列颠哥伦比亚大学
,
课程主席：
娜塔莉·恩里特·杰格
加拿大多伦多大学
,
迈克尔·斯威夫特
美国威斯康星大学麦迪逊分校
版权所有©2023 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布、在服务器上发布或重新分发到列表，需要事先获得特定许可和/或收取费用。从请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2023年3月25日
权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
CGRA公司
设计空间探索
特定领域加速器
图形分析
软硬件协同设计
处理元件
可重构加速器
子图
限定符
- 研究论文
会议

接受率
总体验收率535属于2713年提交文件，20%
资金来源
其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 692
  总下载次数
- 下载次数（过去12个月）447
- 下载量（最近6周）27
其他指标
查看作者指标
引用人
本出版物尚未被引用

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

APEX：使用频繁子图分析的自动化处理元素设计空间探索框架

ASPLOS 2023:第28届ACM编程语言和操作系统架构支持国际会议记录，第3卷

摘要

工具书类

引用人

索引术语

建议

通过运行时可重构硬件加速指纹图像处理

使用算术级硬件设计空间探索——可配置多处理器平台的软件联合仿真

CGRA上卷积神经网络分层并行执行的设计空间探索

评论