2021年第32届ASAP:虚拟活动,美国
-
第32届IEEE应用特定系统、架构和处理器国际会议,ASAP 2021,虚拟会议,美国,2021年7月7日至9日。 美国电气工程师协会 2021 ,国际标准图书编号 978-1-6654-2701-2 卢卡·贝尔塔奇尼 , 卢卡·贝尼尼 , 助理教练孔蒂 :
缓冲还是不缓冲? 超低功耗多核集群FFT加速器案例研究。 1-8 Yu Wang(王宇) , 彭丽 :
基于Hamilton Monte Carlo的无转角采样器FPGA加速算法与硬件协同设计。 9-16 宋世浩 , Twisha Titirsha公司 , Anup Das公司 :
通过智能突触映射提高神经形态系统的推理寿命。 17-24 宾·马素尔 , 丹尼尔·佩奇 , Thinh Hung Pham公司 :
RISC-V上ChaCha的轻量级ISE。 25-32 董文 , 姜静飞 , 徐金伟 , 王康(音译) , 陶晓 , 杨钊 , 勇斗 :
RFC HyPGCN:一种用于混合修剪的基于骨架的GCNs动作识别模型的运行时稀疏特征压缩加速器。 33-40 上野厚弘 , Atsushi Koshiba公司 , 肯塔罗·萨诺 :
用于高性能FPGA集群的具有灵活拓扑结构的虚拟电路交换网络。 41-48 维姆查克 , 杰森·海尔赫·安德森 :
CGRA中多上下文支持的功率、性能和区域后果。 49-52 卢卡斯·索默 , Michael Halkenhä用户 , 克里斯蒂安·阿克塞尼 , 安德烈亚斯·科赫 :
SPNC:加速CPU和GPU上的和积网络推断。 53-56 格兰特·布朗 , Valerio Tenace公司 , 皮埃尔·伊曼纽尔·盖拉登 :
NEMO-CNN:一种有效的卷积神经网络近记忆加速器。 57-60 于谦 , 程宝蕾 , 范建喜 , 王一峰 , 蒋若凡 :
超立方体线图中的边-直联生成树。 61-64 王世航(Shihang Wang) , 朱江汉 , 王琦(Qi Wang) , 他能 , 特里·陶冶(Terry Tao Ye) :
基于Winograd卷积加速的RISC-V定制说明。 65-68 曹燕鹏 , 王成诚 , 宋长军 , 唐永明 , 何莉 :
基于深度学习的4K视频实时超分辨率系统。 69-76 刘明硕 , 罗世毅(Shiyi Luo) , 他和搭档韩奇 , 博远 , 罗纳德·德马拉 , 于白 :
通过软硬件协同设计在资源受限硬件设备上实现高效的实时目标检测框架。 77-84 洪武鹏 , 周尚林 , 斯科特·威茨 , 李嘉欣 , 伊斯兰教圣人 , 童耕 , 李安(Ang Li) , 张伟(音译) , 明湖宋 , 谢咪咪(Mimi Xie) , 刘杭(Hang Liu) , 蔡文鼎 :
二进制复杂神经网络在FPGA上的加速:(特邀论文)。 85-92 Stylianos I.维涅利 , 约阿尼斯·帕诺普洛斯 , 伊利亚斯·莱昂蒂亚迪斯 , 伊阿科沃斯·维尼利斯 :
如何在消费类设备上实现实时人工智能? 可编程和自定义架构的解决方案。 93-100 徐元嘉 , 亨武(Heng Wu) , 张文波 , 陈阳 , 吴月文 , 贺兰高 , 王涛(音译) :
Talos:深度学习模型的加权加速软件设备放置。 101-108 小木正史 , 佐藤由纪 :
基于Hodgkin-Huxley的神经模拟,网络连接到近邻神经元。 109-116 志强鹊 , 王二伟 , 奥马尔·马里卡尔 , 埃里克·莫雷诺 , 詹妮弗·恩加迪乌巴 , 哈姆扎·贾维德 , 巴特洛米耶·博齐斯科夫斯基(Bartlomiej Borzyszkowski) , 蒂亚·阿雷斯塔德 , 弗拉基米尔·隆卡 , 西奥尼·萨默斯 , 毛里齐奥·皮耶里尼 , Peter Y.K.Cheung先生 , 韦恩·卢克 :
重力波实验中的加速递归神经网络。 117-124 克里希纳·特贾·奇蒂·文卡塔 , 阿伦·索马尼 :
阵列感知神经架构搜索。 125-132 郑贤敏(Hyunmin Jeong) , 陈德明 :
TwinDNN:两个深度神经网络的故事。 133-140 张丽萍 , 秦璐 :
基于交互机制和场景概念选择模块的图像字幕生成方法。 141-148 Cheng Tan公司 , 尼古拉斯·博姆·阿戈斯蒂尼 , 杰夫·张 , 马可·米努托利 , 维托·乔瓦尼·卡斯特拉纳 , 谢晨浩 , 童耕 , 李安(Ang Li) , 凯文·巴克尔 , 安东尼诺·图米奥 :
OpenCGRA:民主化粗粒度可重构阵列。 149-155 杰森·海尔赫·安德森 , 拉米·贝达斯 , 维姆查克 , 宣孝 , 孝义凌 , 奥马尔·拉盖布 , 王新元 , 天一余 :
CGRA-ME:CGRA体系结构和CAD研究的开源框架:(邀请论文)。 156-162 罗杰里奥·帕卢多 , 莱昂内尔·索萨 :
适用于基于格的全同态加密的数论变换体系结构。 163-170 苏卡恩·阿加瓦尔 , Shounak Chakraborty公司 :
ABACa:STT-RAM最后一级缓存中基于集合多保留的访问分配。 171-174 小虎 , 李明浩 , 景天 , 王忠峰 :
DARM:一种用于基于格的密码术的低复杂度快速模乘器。 175-178 Thinh Hung Pham公司 , 宾·马素尔 , 亚历山大·费尔 , Siew-Kei Lam先生 , 丹尼尔·佩奇 :
XDIVINSA:采用分散型施工剂缓解电力侧通道泄漏。 179-186 吉什努·班纳吉 , 萨希杜尔伊斯兰 , 伟伟 , 陈磐 , 朱大凯 , 谢咪咪(Mimi Xie) :
物联网设备的内存-软件高效深度学习机制。 187-194 本·李 , 精卫家滩 , 凯歌燕 :
AERO:使用近似执行实现MAV的能效自动飞行。 196-202 孙明健 , 袁丽(音) , 宋晨 , 易康 :
RISC-V处理器上用于深度学习的低功耗分支预测。 203-206 张焕文 , Yan Wang(王燕) , 范建喜 , 郭汝燕 :
折叠交叉立方体上独立支撑树的并行构造。 207-210 张思哲 , 王瑞轩 , 张俊杰(Jeff Jun Zhang) , 阿巴斯·拉希米 , 荀郊 :
评估超维计算对联想记忆中错误的鲁棒性:(特邀论文)。 211-217 张俊杰(Jeff Jun Zhang) , 尼古拉斯·博姆·阿戈斯蒂尼 , 宋世豪 , Cheng Tan公司 , 安库尔·利马耶 , 维纳·阿马蒂亚 , 约瑟夫·曼扎诺 , 马可·米努托利 , 维托·乔瓦尼·卡斯特拉纳 , 安东尼诺·图米奥 , 顾延伟 , 大卫·布鲁克斯 :
面向自动化和敏捷的AI/ML加速器设计和端到端综合。 218-225 藤原吉树 , Shinya Takamaeda-山崎 :
ASBNN:通过算法-硬件协同设计加速贝叶斯卷积神经网络。 226-233 于晨秋 , 赵晓 , 彭玲慧 , 王俊辉 , 资阳康 , 李世明 , 王磊(Lei Wang) :
一种用于神经形态处理器的新型环形小世界NoC。 234-241 王新元 , 天一余 , 宣孝 , 杰森·海尔赫·安德森 :
在粗训练可重构阵列中,双抽运互连以减少面积。 242-249 穆拉德·卡萨梅 , 约瑟夫·赞布雷诺 , 菲利普·琼斯 :
使用线性反馈移位寄存器的稀疏卷积的有效硬件架构。 250-257 刘新恒 , 姚晨 , 丛浩 , 阿舒托什·达尔 , 陈德铭(Deming Chen) :
WinoCNN:FPGA上高效卷积神经网络加速的内核共享Winograd收缩阵列。 258-265 恩于阳 , 天宇佳 , 大卫·布鲁克斯 , 顾延伟 :
FlexACC:一种具有特定应用ISA的可编程加速器,用于灵活的深层神经网络推断。 266-273