摘要
乔瓦尼·安萨洛尼(Giovanni Ansaloni)、保罗·邦齐尼(Paolo Bonzini)和劳拉·波齐(Laura Pozzi)。 2008.表达粒度可重构阵列的设计和架构探索。 2008年应用特定处理器研讨会。 https://doi.org/10.109/SASP.2008.4570782 谷歌学者 数字图书馆 Kubilay Atasu、Laura Pozzi和Paolo Ienne。 2003.自动应用程序特定指令-设置微体系结构约束下的扩展。 第40届设计自动化年会(DAC’03)会议记录。 计算机械协会,美国纽约州纽约市256–261。 国际标准编号:1581136889 https://doi.org/10.1145/775832.775897 谷歌学者 数字图书馆 Rick Bahr、Clark Barrett、Nikhil Bhagdikar、Alex Carsello、Ross Daly、Caleb Donovick、David Durst、Kayvon Fathalian、Kathleen Feng、Pat Hanrahan、Teguh Hofstee、Mark Horowitz、Dillon Huff、Fredrik Kjolstad、Taeyong Kong、Qiaoyi Liu、Makai Mann、Jackson Melchert、Ankita Nayak、Aina Niemetz、Gedeon Nyengele、Priyanka Raina、Stephen Richardson, Raj Setaluri、Jeff Setter、Kavya Sreedhar、Maxwell Strange、James Thomas、Christopher Torn、Leonard Truong、Nestan Tsiskaridze和Keyi Zhang。 2020年,创建敏捷硬件设计流程。 2020年,第57届ACM/IEEE设计自动化会议(DAC)。 https://doi.org/10.109/DAC18072.2020.9218553 谷歌学者 交叉引用 Thilini Kaushalya Bandara、Dhananjaya Wijerathne、Tulika Mitra和Li-Shiuan Peh。 2022.REVAMP:异构CGRA实现的系统框架。 第27届ACM编程语言和操作系统体系结构支持国际会议论文集(ASPLOS’22)。 美国纽约州纽约市计算机械协会:9781450392051 https://doi.org/10.1145/3503222.3507772 谷歌学者 数字图书馆 克拉克·巴雷特和塞萨尔·蒂内利。 2018年,可满足性模理论。 在《模型检查手册》中,Edmund M.Clarke、Thomas A.Henzinger、Helmut Veith和Roderick Bloem(编辑)。 施普林格国际出版公司。 isbn:978-3-319-10575-8 https://doi.org/10.1007/978-3-319-10575-8_11 谷歌学者 交叉引用 埃利·本德斯基。 2013.LLVM代码生成器的更深入研究,第1部分。 https://eli.thegreeplace.net/2013/02/25/a-deper-look-into-the-lvm-code-generator-part-1 谷歌学者 Robert Brummayer、Armin Biere和Florian Lonsing。 2008年。BTOR:模型检查的单词级问题的位精确建模。 第六届可满足模理论国际研讨会和第一届位精确推理国际研讨会(SMT’08/BPR’08)联合研讨会论文集。 美国纽约州纽约市计算机械协会:9781605584409 https://doi.org/10.1145/1512464.1512472 谷歌学者 数字图书馆 皮埃尔·伊夫·卡兰德(Pierre-Yves Calland)、安妮·米格诺特(Anne Mignotte)、奥利维尔·佩兰(Olivier Peyran)、伊夫·罗伯特(Yves Robert)和费雷德里克·费雯(Frédéric Vivien)。 1998年,重新定时DAG。 IEEE集成电路和系统计算机辅助设计汇刊, https://doi.org/10.109/43.736571 谷歌学者 数字图书馆 洪成(Hong Cheng)、阎喜凤(Xifeng Yan)和韩嘉伟(Jiawei Han)。 2010.挖掘图形模式。 美国马萨诸塞州波士顿斯普林格市:978-1-4419-6045-0 https://doi.org/10.1007/978-1-4419-6045-0_12 谷歌学者 交叉引用 詹森·聪(Jason Cong)、范一平(Yiping Fan)、韩国玲(Guoling Han)和张志如(Zhiru Zhang)。 2004.可配置处理器体系结构的特定于应用程序的指令生成。 2004年ACM/SIGDA第12届现场可编程门阵列国际研讨会论文集(FPGA'04)。 美国纽约州纽约市计算机械协会:1581138296 https://doi.org/10.1145/968280.968307 谷歌学者 数字图书馆 罗斯·戴利、卡莱布·多诺维奇、杰克逊·梅尔切特、拉杰克·塞塔卢里、内斯塔·齐斯卡里兹·布洛克、普里扬卡·雷纳、克拉克·巴雷特和帕特·汉拉罕。 2022.使用SMT从RTL合成指令选择重写规则。 在计算机辅助设计形式化方法会议(FMCAD)上。 139–150. https://doi.org/10.34727/2022/isbn.978-3-85448-053-2_20 谷歌学者 交叉引用 罗斯·戴利(Ross Daly)、伦纳德·特朗(Leonard Truong)和帕特·汉拉汉(Pat Hanrahan)。 2018.使用CoreIR从多个硬件语言调用和链接生成器。 在开源EDA技术(WOSET)研讨会上。 https://woset-workshop.github.io/PDFs/2018/a11.pdf 谷歌学者 穆罕默德·埃尔西迪(Mohammed Elseidy)、埃哈布·阿卜杜勒哈米德(Ehab Abdelhamid)、斯皮洛斯·斯基亚多普洛斯(Spiros Skiadopoulos)和帕诺斯·卡尼斯(Panos Kalnis)。 2014.GraMi:单个大图中的频繁子图和模式挖掘。 程序。 荷兰VLDB。, 发行编号:2150-8097 https://doi.org/10.14778/2732286.2732289 谷歌学者 数字图书馆 罗伯特。 B·希区柯克、戈登·L·史密斯和大卫·D·程。 1982.计算机硬件时序分析。 IBM研究与开发杂志, https://doi.org/10.1147/rd.261.01万 谷歌学者 数字图书馆 Dillon Huff、Steve Dai和Pat Hanrahan。 2021.时钟工作:FPGA上多速率图像处理应用的资源高效静态调度。 2021年ACM/SIGDA现场可编程门阵列国际研讨会(FPGA’21)。 美国纽约州纽约市计算机械协会:9781450382182 https://doi.org/10.1145/3431920.3439457 谷歌学者 数字图书馆 Kalhan Koul、Jackson Melchert、Kavya Sreedhar、Leonard Truong、Gedeon Nyengele、Keyi Zhang、Qiaoyi Liu、Jeff Setter、Po-Han Chen、Yuchen Mei、Maxwell Strange、Ross Daly、Caleb Donovick、Alex Carsello、Taeyong Kong、Kathleen Feng、Dillon Huff、Ankita Nayak、Rajsekhar Setaluri、James Thomas、Nikhil Bhagdikar、David Durst、Zachary Myers、, 内斯塔·齐斯卡里泽、斯蒂芬·理查德森、里克·巴尔、凯文·法塔哈利安、帕特·汉拉罕、克拉克·巴雷特、马克·霍洛维茨、克里斯托弗·托恩、弗雷德里克·克约尔斯塔德和普里扬卡·雷纳。 2022.AHA:设计粗训练可重构加速器和编译器的敏捷方法。 ACM嵌入式计算系统汇刊,7月,issn:1539-9087 https://doi.org/10.1145/3534933 谷歌学者 数字图书馆 刘思浩(Sihao Liu)、王建翁(Jian Weng)、库普什(Dylan Kupsh)、阿特菲赫·索拉比扎德(Atefeh Sohrabizadeh)、王正荣(Zhengrong Wang)、郭立成(Licheng Guo)、刘久阳(Jiuyang Liu),朱林(Maxim Zulin)、马尼(Rishabh Mani)、张鹿城(Lucheng Zhang)、聪(Jason Cong)和托尼·诺瓦茨基(Tony Nowatzki)。 2022.OverGen:通过特定域覆盖生成提高FPGA可用性。 2022年,第55届IEEE/ACM国际微体系结构研讨会(MICRO)。 https://doi.org/10.109/MICRO56248.2022.00018 谷歌学者 数字图书馆 Nahri Moreano、Edson Borin、Cid C.de Souza和Guido Araujo。 2005.针对部分可重新配置架构的高效数据路径合并。 IEEE集成电路和系统计算机辅助设计汇刊, https://doi.org/10.109/TCAD.2005.850844 谷歌学者 数字图书馆 Raghu Prabhakar、Yaqi Zhang、David Koeplinger、Matt Feldman、Tian Zhao、Stefan Hadjis、Ardavan Pedram、Christos Kozyrakis和Kunle Olukotun。 2017年,《Plasticine:并行模式的可重构架构》。 2017年ACM/IEEE第44届计算机体系结构国际年会(ISCA)。 https://doi.org/10.1145/3079856.3080256 谷歌学者 数字图书馆 Jonathan Ragan Kelley、Connelly Barnes、Andrew Adams、Sylvain Paris、Frédo Durand和Saman Amarasinghe。 2013年,Halide:一种用于优化图像处理管道中的并行性、局部性和重新计算的语言和编译器。 SIGPLAN否。, 发行编号:0362-1340 https://doi.org/10.1145/2499370.2462176 谷歌学者 数字图书馆 爱德华·罗斯滕和汤姆·德拉蒙德。 2006.高速拐角检测的机器学习。 在《计算机视觉–ECCV 2006》中,AlešLeonardis、Horst Bischof和Axel Pinz(编辑)。 柏林施普林格-海德堡,柏林,海德堡isbn:978-3-540-33833-8 https://doi.org/10.1007/11744023_34 谷歌学者 数字图书馆 Yakun Sophia Shao、Jason Clemons、Rangharajan Venkatesan、Brian Zimmer、Matthew Fojtik、Nan Jiang、Ben Keller、Alicia Klinefelter、Nathaniel Pinckney、Priyanka Raina、Stephen G.Tell、Yanqing Zhang、William J.Dally、Joel Emer、C.Thomas Gray、Brucek Khailany和Stephen W.Keckler。 2019.Simba:利用基于多芯片模块的架构扩展深度学习推断。 在MICRO中。 编号:9781450369381 https://doi.org/10.1145/3352460.3358302 谷歌学者 数字图书馆 Cheng Tan、Chenhao Xie、Ang Li、Kevin J.Barker和Antonino Tumeo。 2021.AURORA:粗训练可重构加速器的自动优化。 2021年欧洲设计、自动化和测试会议及展览会(日期)。 https://doi.org/10.23919/DATE51398.2021.9473955 谷歌学者 交叉引用 罗素·特西尔(Russell Tessier)、肯尼斯·波切克(Kenneth Pocek)和安德烈·德洪(AndréDeHon)。 2015年。可重新配置的计算体系结构。 程序。 电气与电子工程师协会, https://doi.org/10.109/JPROC.2014.2386883 谷歌学者 交叉引用 Lenny Truong和Pat Hanrahan。 2019.硬件描述语言的黄金时代:应用编程语言技术提高设计生产力。 2019年5月16日至17日,第三届编程语言进步峰会,2019年SNAPL,美国RI普罗维登斯,Benjamin S.Lerner,Rastislav Bodik和Shriram Krishnamurthi(编辑)(LIPIcs)。 达格斯图尔-莱布尼兹·泽特鲁姆宫(Schloss Dagstuhl-Leibniz-Zentrum für Informatik)。 https://doi.org/10.4230/LIPIcs.SNAPL.2019.7 谷歌学者 交叉引用 阿特姆·瓦西利耶夫(Artem Vasilyev)、尼基尔·巴格迪卡尔(Nikhil Bhagdikar)、阿尔达文·佩德拉姆(Ardavan Pedram)、斯蒂芬·理查森(Stephen Richardson)、沙哈尔·克瓦廷斯基(Shahar Kvatinsky)和马克·。 2016.评估成像和视觉应用程序的可编程架构。 2016年第49届IEEE/ACM国际微体系结构研讨会(MICRO)。 https://doi.org/10.109/MICRO.2016.7783755 谷歌学者 交叉引用 加内什·文卡泰什、杰克·桑普森、内森·古尔丁、萨图尼诺·加西亚、弗拉迪斯拉夫·布雷克辛、何塞·卢戈·马丁内斯、史蒂文·斯旺森和迈克尔·贝德福德·泰勒。 2010年,《保护核心:减少成熟计算的能量》。 第十五届编程语言和操作系统体系结构支持国际会议(ASPLOS XV)论文集。 美国纽约州纽约市计算机械协会:9781605588391 https://doi.org/10.1145/1736020.1736044 谷歌学者 数字图书馆 Ganesh Venkatesh、Jack Sampson、Nathan Goulding-Hotta、Sravanthi Kota Venkata、Michael Bedford Taylor和Steven Swanson。 2011年,QsCores:利用准特定内核交易暗硅以获得可扩展的能效。 第44届IEEE/ACM国际微体系结构研讨会(MICRO-44)论文集。 美国纽约州纽约市计算机械协会:9781450310536 https://doi.org/10.1145/2155620.2155640 谷歌学者 数字图书馆 Jian Weng、Sihao Liu、Vidushi Dadu、Zhengrong Wang、Preyas Shah和Tony Nowatzki。 2020年,DSAGEN:合成可编程空间加速器。 2020年,ACM/IEEE第47届计算机体系结构国际年会(ISCA)。 https://doi.org/10.109/ISCA45697.2020.00032 谷歌学者 数字图书馆 Max Willsey、Vincent T.Lee、Alvin Cheung、Rastislav Bodík和Luis Ceze。 2019.使用循环编译器迭代搜索可重新配置的加速器块。 IEEE集成电路和系统计算机辅助设计汇刊, https://doi.org/10.109/TCAD.2018.2878194 谷歌学者 交叉引用
建议
使用算术级硬件设计空间探索——可配置多处理器平台的软件联合仿真 可配置的多处理器平台由FPGA设备上配置的多个软处理器组成。 它们已经成为实现许多计算应用程序的一个有吸引力的选择。 除了分发软件执行的各种方法之外。。。 CGRA上卷积神经网络分层并行执行的设计空间探索 SCOPES’20:第23届嵌入式系统软件和编译器国际研讨会会议记录 在这项工作中,我们系统地研究了卷积神经网络(CNN)到粗粒度可重构阵列(CGRA)的分层并行映射的吞吐量、能量和硬件成本的设计空间。 我们推导出一个分析模型。。。