第53届MICRO 2020:希腊雅典
-
第53届IEEE/ACM国际微体系结构年会,MICRO 2020,希腊雅典,2020年10月17-21日。 电气与电子工程师协会 2020 ,国际标准图书编号 978-1-7281-7383-2
第1A部分: 安全与隐私I
Yeonhong公园 , 伍硕权 , 李一金(Eojin Lee) , 泰俊火腿 , 郑浩安 , Jae W.Lee(李在伟) :
石墨烯:坚固而轻便的行锤保护。 1-13 亚历山大·弗雷伊 , 首钢袁 , 周惠阳 , 严索林 :
持久级并行:简化完整性树更新以实现安全持久内存。 14-27 Zhi Zhang先生 , 程跃强 , 刘东溪 , 苏里亚尼泊尔 , 王志 , 尤瓦尔·亚罗姆 :
PThammer:通过隐式访问的跨用户-内核-边界行锤。 28-41 迪米特里奥斯·斯卡拉托斯 , 陈清荣 , 陈建彦 , 徐天音 , 约塞普·托雷拉斯 :
Draco:系统调用安全的体系结构和操作系统支持。 42-57
第1B部分: 采用新技术的机器学习加速器
石田浩(Koki Ishida) , 伊尔昆·拜恩 , 长冈一木 , 福满康介 , 田中正美 , 川上佐治 , 塔尼莫托(Teruo Tanimoto) , 小野高寿 , 金章武(Jangwoo Kim) , 井上康二 :
SuperNPU:一种使用超导逻辑器件的超快速神经处理单元。 58-72 穆罕默德·胡斯奈恩·穆巴里克 , 丹尼斯·D·韦勒 , 纳撒尼尔·布利埃 , 马修·托美 , 贾斯敏·阿加西·哈格曼 , 迈赫迪·B·塔霍里 , 拉凯什·库马尔 :
印刷机学习分类器。 73-87 阿克谢·克里希纳·拉马纳森 , Gurpreet S.Kalsi公司 , 斯利瓦萨·斯里尼瓦萨 , 塔伦·马克什·钱德兰 , 卡姆莱斯·皮莱 , Om Ji Omer先生 , 维杰里什南·纳拉亚南 , Sreenivas Subramoney公司 :
基于查找表的高速缓存节能处理支持神经网络加速。 88-101 阿舒托什·达尔 , 王晓浩 , 胡贝图斯·弗兰克 , 熊进军 , 黄健 , 文美·W·Hwu , 南宋金 , 陈德铭(Deming Chen) :
FReaC缓存:最后一级缓存中的折叠逻辑可重构计算。 102-117
第1C部分: 微体系结构I
Siavash Zangeneh公司 , 斯蒂芬·普鲁特 , 桑库·莱姆 , 耶鲁·N·帕特 :
BranchNet:预测难预测分支的卷积神经网络。 118-130 萨米拉·米尔巴盖尔·阿约尔帕兹 , 埃尔巴·加尔扎 , 吉尔斯·波卡姆 , 丹尼尔·吉梅内斯(Daniel A.Jiménez) :
CHiRP:控制流历史重用预测。 131-145 坦维尔·艾哈迈德·汗 , Akshitha Sriraman公司 , 约瑟夫·迪维蒂 , 吉尔斯·波卡姆 , 海纳·利茨 , 巴里斯·卡西奇 :
I-SPY:上下文驱动的条件指令预取与合并。 146-159 贾加迪什·科特拉 , 约翰·卡拉马蒂亚诺斯 :
提高x86处理器中微操作缓存的利用率。 160-172
第2A部分: 量子计算
凯西·杜克林 , 乔纳森·贝克 , 戴维·舒斯特 , 弗雷德里克·T·冲 :
虚拟化逻辑比特:纠错量子计算的2.5D体系结构。 173-185 普拉纳夫·戈哈勒 , 阿里·贾瓦迪·阿巴哈里 , 内森·厄内斯特 , Yunong Shi公司 , 弗雷德里克·T·冲 :
用OpenPulse优化近项算法的量子编译。 186-200 永善顶 , 普拉纳夫·戈哈勒 , 林福慧(Sophia Fuhui Lin) , 理查德·莱恩斯 , 托马斯·普罗普森 , 弗雷德里克·T·冲 :
通过频率软件编译实现超导量子比特的系统串扰抑制。 201-214 马哈布布尔·阿拉姆 , 阿卜杜拉·阿什萨基 , Swaroop Ghosh公司 :
量子近似优化算法的电路编译方法。 215-228
第2B部分: 鲁棒机器学习
齐玉丸 , 辛福 :
快速BCNN:贝叶斯卷积神经网络中的大规模神经元跳跃。 229-240个 甘一鸣 , 邱玉仙 , 镜文冷 , 郭敏义 , 朱玉豪 :
托勒密:强大深度学习的架构支持。 241-255年 吉尔·肖姆龙 , 乌里·维瑟(Uri C.Weiser) :
非阻塞同步多线程:拥抱深度神经网络的弹性。 256-269 怡和 , 普拉桑娜·巴拉普拉卡什 , 李燕京 :
FIdelity:深度学习加速器的高效弹性分析框架。 270-281
第2C部分: 记忆I
米内什·帕特尔 , 杰里米·S·金 , 塔哈·沙鲁迪 , 哈桑·哈桑 , Onur Mutlu公司 :
位精确ECC恢复(BEER):通过利用DRAM数据保留特性来确定DRAM片上ECC功能。 282-297 列夫·穆哈诺夫 , 迪米特里奥斯·尼科洛普洛斯 , 乔治奥斯·卡拉孔斯坦提斯 :
DStress:使用遗传算法自动合成DRAM可靠性应激病毒。 298-312 王耀华 , 路易斯·奥罗萨 , 彭向军 , 杨果(Yang Guo) , 索加塔鬼 , 米内什·帕特尔 , 杰里米·S·金 , 胡安·戈梅斯·卢纳 , 穆罕默德·萨德罗萨达蒂 , 尼卡·曼苏里·吉亚西 , Onur Mutlu公司 :
FIGARO:通过细粒度内存数据重新定位和缓存提高系统性能。 313-328 西米斯·梅利萨里斯 , 马科斯·马卡基斯 , 凯利·A·肖 , 玛格丽特·马托诺西 :
PerpLE:提高内存一致性测试的速度和效率。 329-341
第3A节: 近内存计算
陈迪贝 , 李兆石 , 天柱熊 , 刘志伟 , 杨军(Jun Yang) , 首义音 , 魏少军 , 刘雷波 :
CATCAM:具有可扩展内存体系结构的恒定时间变换三值CAM。 342-355 莫森·伊马尼 , 塞基山-帕姆帕纳 , 萨兰斯·古普塔 , 周敏轩 , Yeseong Kim先生 , 塔贾娜·罗辛 :
双重:使用基于数字的内存处理加速聚类算法。 356-371 何明轩 , Choungki Song先生 , 伊尔孔·金 , Chunseok Jeong先生 , 金世浩 , 伊尔公园 , 米图纳·托特霍迪 , T.N.维杰库玛 :
牛顿:DRAM制造商的内存加速器(AiM)机器学习架构。 372-385 徐朔涛 , 托马斯·布尔盖特 , 黄天豪 , Hojun Kim先生 , Sungjin Lee(李成金) , 阿尔文德 :
AQUOMAN:分析查询卸载机器。 386-399年 Salonik Resch公司 , S.Karen Khatamifard公司 , 赞谢德·乔杜里 , 马苏德·扎比希 , 赵正阳 , M.Hüsrev Cilasun先生 , 王建平 , Sachin S.Sapatnekar公司 , Ulya R.Karpuscu公司 :
老鼠:非易失性存储器中能量收集应用的推断。 400-414
第3B部分: 编译、建模和仿真
金湖江 , 董荣超 , 周忠军 , 宋长恒 , 王文文(Wenwen Wang) , 彭昌紫杉 , 张伟华 :
少花钱多办事-使用参数化为DBT派生更多翻译规则,少训练数据。 415-426 赵杰(音译) , 彭迪 :
通过在计算和数据上合成自动转换来优化内存层次结构。 427-441 亚历克斯·伦达 , 陈一申 , 查里斯·门迪斯 , 迈克尔·卡宾 :
DiffTune:使用学习到的不同替代优化CPU模拟器参数。 442-455 穆罕默德·阿格巴里亚 , 伊丹·亚尼夫 , 杰内尔·甘地 , 丹·萨弗里尔 :
虚拟内存研究中使用部分模拟预测执行时间:原因和方式。 456-470 英国诗人 , 约书亚·西科德 , 穆罕默德·巴哈拉尼 , 哈米德·塔布吉 :
gem5-SALAM:基于LLVM的加速器建模的系统架构。 471-482年
会议3C: 非易失性存储器
乔莉 , 叶敏(音) , 崔宇飞 , 梁实 , 李小强 , 崔伟国(Tei-Wei Kuo) , 薛俊杰(Chun Jason Xue) :
使用Sentinels快速读取高密度3D Flash的剃须重试。 483-495 王子轩 , 小刘 , 简阳 , 西奥多·迈克利迪斯 , 史蒂文·斯旺森 , 赵纪深(Jishen Zhao) :
非易失性存储器系统的特征描述和建模。 496-508 阿波斯托洛斯·科科利斯 , 托马斯·舒尔 , 黄健 , 约塞普·托雷拉斯 :
P-INSPECT:可编程非易失性内存框架的体系结构支持。 509-524 Jungi Jeong先生 , Jaewan Hong先生 , Seungryoul Maeng先生 , 郑昌熙(Changhee Jung) , Youngjin Kwon先生 :
混合DRAM/NVM内存系统的无边界硬件事务内存。 525-538 萨拉·马赫迪扎德·沙赫里 , 赛义德·阿明·瓦基尔·哈哈尼 , 阿希什·科利 :
(几乎)无障碍持续订购。 539-554
第4A部分: 微体系结构II
阿尔贝托·罗斯 , 斯特凡诺斯·卡西拉斯 :
存储原子性的推测性实施。 555-567 胡安·塞布赖恩 , 斯特凡诺斯·卡西拉斯 , 阿尔贝托·罗斯 :
通过存储预取突发提高存储缓冲区效率。 568-580 廖敏丽(Minli Julie Liao) , 杰克·桑普森 :
D-SOAP:用于多方向存储系统中缓存的动态空间方向相关性预测。 581-595 Quan M.Nguyen先生 , 丹尼尔·桑切斯 :
移液管:通过堆芯内管道并行性提高不规则应用的堆芯利用率。 596-608 张超(Chao Zhang) , 袁曾 , 约翰·沙尔夫 , 郭晓晨 :
RnR:一种软件辅助的录制和重放硬件预取器。 609-621年
第4B部分: 资源管理
圣春高 , 郑吉和 , 图沙尔·克里希纳 :
孔子:使用强化学习的DNN加速器自主硬件资源分配。 622-636 梁舟 , 拉克西米·N·布扬 , K.K.Ramakrishnan公司 :
双子座:学习管理关键潜伏期搜索引擎的CPU能力。 637-349 内拉杰·库尔卡尼 , 冈萨洛·冈萨雷斯-普马列加 , 阿穆利亚·库拉纳 , 克里斯汀·舒梅克 , 克里斯蒂娜·德利米特鲁 , 大卫·H·阿尔博内西 :
CuttleSys:可重构多核上交互式服务的数据驱动资源管理。 650-664 布莱恩·施威多克 , 内森·贝克曼 :
Jumanji:数据中心中的动态NUCA案例。 665-680 Soroush Ghodrati公司 , Byung Hoon Ahn先生 , 金俊京(Joon Kyung Kim) , 肖恩·金泽 , Brahmendra Reddy Yatham公司 , 纳瓦提亚·阿拉 , 哈迪克·夏尔马 , 穆罕默德·阿利安 , 艾曼·易卜拉希米 , 南宋金 , 克利夫·杨 , 哈迪·埃斯迈伊尔扎德 :
Planaria:深度神经网络空间多租户加速的动态架构裂变。 681-697
第4C节: 机器学习加速器I
卓然歌 , 吴飞扬 , 刘雪源 , 荆轲 , Naifeng Jing公司 , 梁晓尧 :
VR-DANN:通过解码器辅助的神经网络加速实现实时视频识别。 698-710 杨定庆 , 阿明·加塞马扎尔 , 任晓伟 , 马克西米利安·戈卢布 , 盖·勒米厄 , Mieszko Lis公司 :
Procrustes:稀疏深度神经网络训练的数据流和加速器。 711-724 Hyenjin Kim公司 , 宋武安 , Yunho哦 , 鲍吉尔·金 , Won Woo Ro公司 , 威廉·J·宋 :
双重:为GPU张量核提升深度神经网络的冗余内存访问。 725-737 刘刘 , 郑曲 , 雷登 , 图丰斌 , 李双晨 , 星虎 , 顾振宇 , 丁玉飞 , 袁燮 :
DUET:在双模块架构上提高深层神经网络效率。 738-750
第5A节: 机器学习加速器II
莫慧玉 , 刘雷波 , 胡文静 , 朱文平 , 李强 , 李安(Ang Li) , 首义音 , 陈健(Jian Chen) , 姜晓伟 , 魏少军 :
TFE:用于压缩和加速卷积神经网络的节能传递式过滤器引擎。 751-765 尼提什·库马尔·斯利瓦斯塔瓦 , 韩晨金 , 刘杰(音译) , 大卫·H·阿尔博内西 , 张志儒 :
MatRaptor:一种基于逐行乘积的稀疏稀疏矩阵乘法加速器。 766-780 穆斯塔法·马哈茂德 , 伊萨克·江户 , 阿里·哈迪·扎德 , 奥马尔·穆罕默德·阿瓦德 , Gennady Pekhimenko先生 , 豪尔赫·阿尔贝里西奥 , 安德烈亚斯·莫绍沃斯 :
TensorDash:利用稀疏性加速深层神经网络训练。 781-795 张晓文宫 , 侯祥基 , 克里斯托弗·弗莱彻 , 克里斯托弗·休斯 , 萨拉·巴格索基 , 约塞普·托雷拉斯 :
SAVE:用于加速CPU上DNN训练和推理的稀疏感知矢量引擎。 796-810 阿里·哈迪·扎德 , 伊萨克·江户 , 奥马尔·穆罕默德·阿瓦德 , 安德烈亚斯·莫绍沃斯 :
GOBO:量化基于注意的NLP模型,用于低延迟和节能推理。 811-824
第5B部分: 云和数据中心
平宿公园 , Heetaek Jeong先生 , 金章武(Jangwoo Kim) :
TrainBox:通过系统平衡操作实现的极端规模神经网络训练服务器架构。 825-838 苏拉夫·马拉 , 邓庆元 , 佐·易卜拉欣扎德 , 乔·加斯佩雷蒂 , 萨贾尔·贾因 , Parimala Kondety公司 , 蒂亚拉·奥尔蒂斯 , 黛布拉·维埃拉 :
超额订购数据中心中分布式电池的协调优先级感知充电。 839-851 阿米罗申·米洛塞尼 , 侯赛因·戈列斯塔尼 , 托马斯·韦尼施 :
超平面:软件数据平面的可扩展低延迟通知加速器。 852-867 克里斯蒂安·平托 , 迪米特里斯·西里维利斯 , 米歇尔·加泽蒂 , 帕诺斯·库茨瓦西利斯 , 安德烈亚·雷尔 , 科斯塔斯·卡特里尼斯 , H.彼得·霍夫斯蒂 :
ThymesisFlow:用于机架级内存分解的软件定义的硬件/软件联合设计互连堆栈。 868年至880年 刘天一 , Sen He先生 , 黄孙洲 , Danny H.K.Tsang , 凌家堂 , 杰森·马尔斯 , 王伟 :
云中交互式3D应用程序的基准测试框架。 881-894
第5C节: 特定于域的体系结构
彭城瑶 , 龙正 , 甄曾 , 于晃(音) , 创艺桂 , 廖晓飞 , Hai Jin(海进) , 薛晶凌 :
图形挖掘应用程序的本地感知节能加速器。 895-907 沙菲尔·拉赫曼 , Nael B.Abu Ghazaleh公司 , 拉吉夫·古普塔 :
GraphPulse:异步图形处理的事件驱动硬件加速器。 908-921 童耕 , 李安(Ang Li) , 石润斌 , 吴春树 , 王天奇 , 李燕飞 , 普亚哈吉 , 安东尼诺·图米奥 , 帅车 , 史蒂文·莱因哈特 , 马丁·赫伯特 :
AWB-GCN:具有运行时工作负载平衡的图卷积网络加速器。 922-936 藤木大池 , 吴顺浩 , 内森·奥佐格 , 库什·戈利亚 , 大卫·T·布拉乌 , 萨蒂什·纳拉亚纳萨米 , Reetuparna Das公司 :
SeedEx:一种用于亚极小空间优化比对的基因组测序加速器。 937-950 达姆拉·塞诺尔·卡利 , Gurpeet S.卡尔西 , 苏拉尔·宾格尔 , 费尔蒂娜(Can Firtina) , 拉瓦尼亚语Subramanian , 杰里米·S·金 , 拉查塔·奥萨瓦隆尼伦 , 穆罕默德·阿尔瑟 , 胡安·戈梅斯·卢纳 , 阿米拉利·博鲁曼 , 阿南特·诺里 , 艾利森·西比斯 , Sreenivas Subramoney公司 , Can Alkan公司 , 索加塔Ghose , Onur Mutlu公司 :
GenASM:用于基因组序列分析的高性能、低功耗近似字符串匹配加速框架。 951-966
第6A部分: GPGPU(通用图形处理器)
赵霞 , 马格努斯·贾勒 , Lieven Eeckhout公司 :
内存侧GPU缓存中的选择性复制。 967-980 袁海思周 , 克里斯托弗·吴 , 谢林·卡特尔 , 杰里米·伊坦 , 马修·D·辛克莱 , 约瑟夫·迪维蒂 , 蒂莫西·罗杰斯 , 托尔·阿莫特 :
确定性原子缓冲。 981-995 霍贾特·阿斯加里·埃斯费登 , 阿米尔·阿里·阿卜杜拉希迪 , 沙菲尔·拉赫曼 , 糖城市议员黄安祥 , Nael B.Abu Ghazaleh公司 :
BOW:在GPU中利用旁路的呼吸操作系统窗口。 996-1008 王璐 , 马格努斯·贾勒 , 阿尔穆塔兹·阿迪勒 , Lieven Eeckhout公司 :
MDM:GPU内存分歧模型。 1009-1021 马哈茂德·凯里 , 瓦迪姆·尼基福罗夫 , 大卫·W·内兰(David W.Nellans) , 蒂莫西·罗杰斯 :
针对大规模GPU的以位置为中心的数据和线程块管理。 1022-1036
第6B部分: 移动和嵌入式体系结构
于峰 , 田博元 , 徐天成 , 保罗·N·沃特莫 , 朱玉豪 :
Mesorasi:通过延迟聚合为点云分析提供架构支持。 1037-1050 贾瓦德·哈吉-叶海亚 , 穆罕默德·阿尔瑟 , 杰里米·S·金 , 路易斯·奥罗萨 , 埃夫拉伊姆·罗特姆 , 阿维·门德尔森 , Anupam Chattopadhyay公司 , Onur Mutlu公司 :
FlexWatts:节能微处理器的功率和工作负载感知混合电源传输网络。 1051-1066 薄玉 , 魏虎 , 徐雷蒙 , 杰唐 , 刘少山 , 朱玉豪 :
构建自主微动车辆计算系统:设计约束和结构优化。 1067-1081 金永根(Young Geun Kim) , 卡罗尔·让·吴 :
自动缩放:使用强化学习的随机边缘推断的能量效率优化。 1082-1096年 天宇佳 , 裕豪居 , 罗斯·约瑟夫 , 洁谷 :
NCPU:一种嵌入式神经CPU体系结构,用于资源节约型低功耗设备,实现实时端到端性能。 1097-1109
第6C部分: 安全与隐私II
托马斯·布尔盖特 , 朱尔斯·德雷恩 , 杨玉恒 , 蔡莉莲(Lillian Tsai) , 乔尔·埃默 , 孟家燕 :
CaSA:随机映射缓存的端到端定量安全分析。 1110-1123 萨米拉·米尔巴盖尔·阿约尔帕兹 , 吉尔斯·波卡姆 , 伊斯梅尔·穆罕默德·科鲁耶 , 埃尔巴·加尔扎 , Nael B.Abu-Ghazaleh公司 , 丹尼尔·吉梅内斯(Daniel A.Jiménez) :
PerSpectron:使用感知器检测微结构攻击的不变足迹。 1124-1137 赵子瑞Neil Zhao , 侯祥基 , 孟家燕 , 余继勇 , 克里斯托弗·弗莱彻 , 亚当-莫里森 , 达科·马里诺夫 , 约塞普·托雷拉斯 :
推测不变性(InvarSpec):通过程序分析更快地安全执行。 1138-1152 金永海 , Jaekyu Lee先生 , 海森·金 :
基于硬件的Always-On堆内存安全。 1153-1166