第54届MICRO 2021:虚拟活动,希腊
MICRO’21:2021年10月18日至22日,希腊,第54届IEEE/ACM微体系结构国际研讨会,虚拟活动。 ACM公司 2021 ,十亿 978-1-4503-8557-2
第1部分: 最佳论文集
谢志尧 , 徐晓青 , 梅特·沃尔克 , 约书亚·克内贝尔 , 库马拉古鲁宫 , 尼古拉斯·赫伯特 , 姜虎 , 杨焕瑞 , 陈一然 , Shidhartha Das公司 :
APOLLO:用于大容量商用微处理器运行时功耗内省的自动功耗建模框架。 1-14 比约恩·戈查尔 , Lieven Eeckhout公司 , 马格努斯·贾勒 :
提示:时间比例指令评测。 15-27 刘宇驰 , 洪伟曾 :
NDS:N维存储。 28-45 哈里尼·穆图克里希南 , 丹尼尔·卢斯蒂格 , 大卫·W·内兰(David W.Nellans) , 托马斯·韦尼施 :
GPS:一种用于多GPU内存管理的全球发布订阅模型。 46-58
第2A部分: 非易失性存储器
高聪明 , 欣欣 , 陆友友 , 张友涛 , 杨军(Jun Yang) , 《纪武书》 :
ParaBit:在基于NAND闪存的SSD中处理并行位操作。 59-70 阿波斯托洛斯·科科利斯 , 安东尼斯·普西斯塔基斯 , 本杰明·雷迪斯 , 黄健 , 约塞普·托雷拉斯 :
分布式数据持久性。 71-85 玛丽娜·维穆 , 亚历山大·达格利斯 :
COSPlay:利用任务级并行性实现高吞吐量同步持久性。 86-99 Minh S.Q.Truong先生 , 埃里克·陈 , 苏迪安(Deanyone Su) , 李廷申 , 亚历山大·格拉斯 , L.理查德·卡利 , 詹姆斯·A·贝恩 , 索加塔Ghose :
RACER:使用电阻存储器的位管道处理。 100-116 Hafizul Islam Chowdhuryy女士 , 穆罕默德·拉舍杜尔·哈克·拉舍德 , 阿姆罗·阿瓦德 , 里卡德·埃韦茨 , 范瑶 :
梯形图:为Crossbar Resistive Memorys构建内容和位置软件写入。 117-130
第2B部分: 能效和低功耗
Seunghak Lee先生 , Ki-Dong Kang公司 , 李焕君(Hwanjun Lee) , 现代公园 , 小勋儿 , 南宋金 , Daehoon Kim公司 :
GreenDIMM:具有子阵列粒度断电状态的DRAM的操作系统支持的DRAM电源管理。 131-142 Ki-Dong Kang公司 , 庆树公园 , Hyosang Kim先生 , 穆罕默德·阿利安 , 南宋金 , Daehoon Kim公司 :
NMAP:基于延迟关键工作负载的网络数据包处理模式转换的电源管理。 143-154 贾瓦德·哈吉-叶海亚 , Jisung公园 , 拉胡尔·贝拉 , 胡安·戈梅斯·卢纳 , 埃夫拉伊姆·罗特姆 , 塔哈·沙鲁迪 , 杰里米·S·金 , Onur Mutlu公司 :
BurstLink:用于传统和虚拟现实系统的节能视频显示技术。 155-169 曾建萍 , Jongouk Choi先生 , 辛威福(Xinwei Fu) , 阿杰·帕达尤鲁·什利帕蒂 , 东洋·李 , 昌宇敏 , 郑昌熙(Changhee Jung) :
ReplayCache:为能量采集系统启用易失性缓存。 170-182 金永根(Young Geun Kim) , 卡罗尔·让·吴 :
AutoFL:实现异构感知的节能联合学习。 183-198
第3A节: 安全与隐私I
鹿一康 , 薛玉琦 , 贾伟伟 , 王晓浩 , 金钟佑 , 昌焕Youn , Myeong Joon Kang(明俊康) , 林贤进(Hyung Jin Lim) , 布鲁斯·雅各布 , 黄健 :
IceClave:用于存储计算的可信执行环境。 199-211 哈尼埃·哈希米 , 王永勤 , 穆拉利·阿纳瓦拉姆 :
DarKnight:使用可信硬件保护深度学习的隐私和完整性加速框架。 212-224 傅永干 , 杨照 , 余启轩(Qixuan Yu) , 李超建 , 林英彦 :
二合一加速器:实现随机精确切换,以赢得对抗性鲁棒性和效率。 225-237 尼古拉·萨马尔季奇 , 阿克塞尔·费尔德曼 , 阿列克桑达尔·克拉斯特夫 , 斯里尼瓦斯·德瓦达斯 , 罗纳德·德雷斯林斯基 , 克里斯托弗·佩克特 , 丹尼尔·桑切斯 :
F1:全同态加密的快速可编程加速器。 238-252 迈克尔·勒梅 , Joydep Rakshit公司 , 谢尔盖·多伊奇 , 大卫·M·达勒姆 , Santosh Ghosh公司 , 阿南特·诺里 , 杰耶什·高尔 , 安德鲁·韦勒 , 萨尔敏苏丹国 , 卡兰维尔·格雷瓦尔 , Sreenivas Subramoney公司 :
加密能力计算。 253-267
第3B部分: 处理内存/近内存
载云公园 , 再见了,金 , 孙敏云 , 李一金(Eojin Lee) , 明秀·鲁 , 郑浩安 :
TRiM:用可伸缩的张量减少增强处理器-内存接口。 268-281 马西耶·贝斯塔 , Raghavendra Kanakagiri公司 , 格列戈兹·克瓦希涅夫斯基 , 拉查塔·奥萨瓦隆尼伦 , 雅库布·贝拉内克 , Konstantinos Kanellopoulos公司 , 卡普尔·詹达 , 苏尔·沃纳伯格-希马利亚 , 卢卡斯·吉亚尼纳齐 , 艾奥娜·斯特凡 , 胡安·戈梅斯·卢纳 , 雅库布·戈利诺夫斯基 , 马金·科皮克 , 卢卡斯·卡普·施瓦勒 , 萨尔瓦多·迪·吉罗拉莫 , 尼尔斯·布拉赫 , 马雷克·科尼奇尼 , Onur Mutlu公司 , 托尔斯滕·霍夫勒 :
SISA:处理器内存系统上图形挖掘的以集合为中心的指令集体系结构。 282-297 阿尼尔班·纳格 , Rajeev Balasubramonian公司 :
OrderLight:高效细粒度PIM计算的轻量级内存排序原语。 298-310 埃拉赫·萨德雷迪尼 , 雷扎·拉希米 , 莫森·伊马尼 , 凯文·斯卡德隆 :
杂项:实现低覆盖和可扩展的近数据模式匹配加速。 311-323 欣欣 , 郭亚南(Yanan Guo) , 张友涛 , 杨军(Jun Yang) :
SAM:加速Strided Memory访问。 324-336
第4A部分: 并行性
爱德华多·何塞·戈梅斯·埃尔南德斯 , 胡安·塞布赖恩 , J.鲁宾·蒂托斯·吉尔 , 斯特凡诺斯·卡西拉斯 , 阿尔贝托·罗斯 :
高效、分布式和非推测性多地址原子操作。 337-349 约瑟夫·扎克曼 , 大卫·吉里 , Jihye Kwon先生 , 保罗·曼托瓦尼 , 卢卡·卡洛尼 :
Cohmeleon:异构SoC中基于学习的加速器一致性协调。 350-365 万事达宝尼 , 阿达斯·米塔尔 , 古林达尔·索希 :
脂肪加载:利用同时加载操作中的局部性来优化缓存访问。 366-379 Aniket Anand Deshmukh公司 , 耶鲁·N·帕特 :
关键性驱动获取。 380-391 菲利普·贝杜基安 , 尼尔·阿迪特 , 埃德温·佩格罗 , 阿德里安·桑普森 :
多核结构上的软件定义向量处理。 392-406
第4B部分: 加速器I
阿拉什·普尔哈比比·扎兰迪 , 马克·萨瑟兰 , 亚历山德罗斯·达格利斯 , 巴巴克·法尔萨菲 :
脑波:在数据中心逃避RPC税。 407-420 马里奥·德鲁蒙德 , 路易斯·库隆 , 阿拉什·普尔哈比比·扎兰迪 , 艾哈迈特·卡内尔·尤祖格勒 , 巴巴克·法尔萨菲 , 马丁·贾吉 :
春分:关于自定义推理加速器的培训(免费)。 421-433 郑永康(Seongyoung Kang) , Jiyoung An公司 , 金碧儿(Jinpyo Kim) , 桑武俊 :
:用于高性能日志分析的近存储加速器。 434-448 林玉君 , 张哲凯 , 昊天汤 , 王汉瑞 , 宋汉 :
PointAcc:高效点云加速器。 449-461 萨加·卡兰迪卡尔 , 克里斯·利里 , 克里斯·肯内利 , 杰里·赵 , 迪内什·帕里米 , 鲍里沃耶·尼科利奇 , 克里斯特·阿萨诺维奇 , 帕塔萨拉西·兰加纳坦 :
协议缓冲区的硬件加速器。 462-478
第5A节: 加速器II
刘伟壮 , 薄玉 , 甘一鸣 , 刘强(音) , 杰唐 , 刘绍山 , 朱玉豪 :
Archytas:机器人定位加速器的综合和动态优化框架。 479-493 赵树林 , 张海波 , 青色Subhra Mishra , 桑迪帕·布扬 , 紫玉英 , 马赫穆特·泰兰·坎德米尔 , 阿南德·西瓦苏布拉曼尼亚 , 契塔·R·达斯 :
HoloAR:增强现实中3D全息处理的实时优化。 494-506 大卫·特里拉 , 约翰·戴维德·威尔曼 , Alper Buyuktosunoglu公司 , Pradip Bose公司 :
NOVIA:发现非传统内联加速器的框架。 507-521 阿梅尔·阿卜杜勒哈迪 , 尤金·沙 , 恰兰·班农 , 亨德里克·斯坦兰 , 安德烈亚斯·莫绍沃斯 :
Noema:用于神经群体模式检测的硬件高效模板匹配。 522-534 蒂莫西·邓恩 , 哈里桑卡·萨达西万 , 杰克·沃登 , 库什·戈利亚 , 陈冠宇 , 大卫·T·布拉乌 , Reetuparna Das公司 , 萨蒂什·纳拉亚纳萨米 :
SquiggleFilter:便携式病毒检测加速器。 535-549
第5B部分: 安全与隐私II
金俊雄(Joonsung Kim) , 哈米·张(Hamin Jang) , 李洪军(Hunjun Lee) , Seungho Lee先生 , 金章武(Jangwoo Kim) :
UC-Check:描述x86处理器中微操作缓存的特征及其在安全和性能方面的意义。 550-564 Jaeguk Ahn先生 , 吉荷·金 , 汉斯·卡桑 , 金志贤 , 莱拉·德尔沙德赫拉尼 , 宋文俊 , 阿贾·伊乔希 , 约翰·金 :
GPU中基于片上网络微架构的隐蔽通道。 565-577 巴勃罗·布伊拉斯 , 哈米德·内马蒂 , 安德烈亚斯·林德纳 , 罗伯托·关夏利 :
通过观测优化验证侧通道模型。 578-591 萨姆·安斯沃思 :
GhostMinion:一个用于减少Spectre的严格有序缓存系统。 592-606 Rutvik Choudhary公司 , 余继勇 , 克里斯托弗·弗莱彻 , 亚当-莫里森 :
推测性隐私跟踪(SPT):在不损害隐私的情况下,从推测性执行中泄漏信息。 607-622
第6A部分: 可靠性和验证
米内什·帕特尔 , 杰拉尔多·F·奥利维拉 , Onur Mutlu公司 :
HARP:实用有效地识别使用在线纠错代码的内存芯片中的不可纠正错误。 623-640 迈克尔·B·沙利文 , Nirmal R.萨克森那 , 奥康纳 , 李东赫 , 保罗·拉库纳斯 , 索拉巴·胡克里卡尔 , 蔡提摩西(Timothy Tsai) , Siva Kumar Sastry哈里 , 斯蒂芬·凯克勒 :
描述和缓解GPU DRAM中的软错误。 641-653 曾建萍 , 金红军(Hongjune Kim) , 李政宰 , 郑昌熙(Changhee Jung) :
收费公路:订购核心的轻量级软错误恢复能力。 654-666 努尔苏丹·卡比尔卡斯 , 汤米·索恩 , 什雷莎·斯里纳特 , 多时性Xekalakis , 何塞·雷诺 :
逻辑引信增强协同仿真的有效处理器验证。 667-678 萧瑶 , 多米尼克·P·穆里根 , Nikos Nikoleris公司 , 古斯塔沃·佩特里 , 卡罗琳·特里佩尔 :
从RTL合成硬件的形式化模型,以有效验证内存模型实现。 679-694
第6B部分: GPGPU(通用图形处理器)
张杰(音译) , Myoungsoo Jung先生 :
欧姆GPU:将新的光纤网络和异构内存集成到GPU多处理器中。 695-708 刘璐飞 , 韦斯利·张 , 弗朗索瓦·德穆林 , 袁海思周 , 穆罕默德·赛义德 , 大卫·潘克雷茨 , 泰勒·诺维基 , 托尔·阿莫特 :
用于加速GPU光线跟踪的交点预测。 709-723 塞萨尔·阿瓦洛斯·巴杜 , 马哈茂德·凯里 , 罗兰·N·格林 , 马蒂亚斯·帕耶 , 蒂莫西·罗杰斯 :
主核分析:一种可跟踪的方法来模拟缩放的GPU工作负载。 724-737 维杰·坎迪亚 , 斯科特·佩维尔 , 马哈茂德·凯里 , 潘俊瑞 , 阿莫·曼朱纳特 , 蒂莫西·罗杰斯 , 托尔·阿莫特 , 尼科斯·哈达维拉斯 :
AccelWatch:现代GPU的电源建模框架。 738-753 布莱斯·蒂恩 , 克里希娜·普拉文·雅拉马蒂(Krishna Praveen Yalamarthy) , Elsabbagh票价 , 海森·金 :
Vortex:为GPGPU和3D-Graphics扩展RISC-V ISA。 754-766
第7A课时: 微体系结构I
斯汀·埃弗曼(Stijn Eyerman) , 维姆·海尔曼 , 萨姆·范登·斯汀 , 易卜拉欣·胡尔 :
通过选择性刷新指令启用分支预测级别并行性。 767-778 尼兰詹·桑达拉扬(Niranjan K.Soundararajan) , 彼得·布劳恩 , 坦维尔·艾哈迈德·汗 , 巴里斯·卡西奇 , 海纳·利茨 , Sreenivas Subramoney公司 :
PDede:分区、重复数据消除、增量分支目标缓冲区。 779-791 亚瑟·佩雷斯 :
利用目标值预测释放新的硬件强度降低潜力。 792-803 斯蒂芬·普鲁特 , 耶鲁·N·帕特 :
分支超前:对于不可能预测分支的分支预测的替代方法。 804-815 坦维尔·艾哈迈德·汗 , 内森·布朗 , Akshitha Sriraman公司 , Niranjan K.Soundararajan公司 , 拉凯什·库马尔 , 约瑟夫·迪瓦蒂 , Sreenivas Subramoney公司 , 吉尔斯·波卡姆 , 海纳·利茨 , 巴里斯·卡西奇 :
Twig:数据中心应用程序的档案引导BTB预取。 816-829
第7B部分: 加速器III
蒂埃里·坦贝 , 科尔曼·霍珀 , 莉莲五旬节 , 天宇佳 , 恩于阳 , 马可·多纳托 , 维克托·桑 , 保罗·N·沃特莫 , 亚历山大·拉什 , 大卫·布鲁克斯 , 顾延伟 :
EdgeBERT:针对潜伏期感知多任务NLP推理的句子级能量优化。 830-844 姚玉涛 , 张正亚 :
HiMA:一种用于不同神经计算机的快速可扩展的基于历史的内存访问引擎。 845-856 奥马尔·穆罕默德·阿瓦德 , 穆斯塔法·马哈茂德 , 伊萨克·江户 , 阿里·哈迪·扎德 , 西兰·班农 , 阿南·贾亚拉扬 , Gennady Pekhimenko先生 , 安德烈亚斯·莫绍沃斯 :
FPRaker:加速神经网络训练的处理元件。 857-869 乌迪特·古普塔 , 塞缪尔·夏 , 杰夫·张 , 马克·威尔科宁 , 贾文·蓬布拉 , 李显新 , 顾延伟 , 卡罗尔·让·吴 , 大卫·布鲁克斯 :
RecPipe:共同设计模型和硬件,共同优化推荐质量和性能。 870-884 齐玉丸 , 夏浩君 , 张兴耀 , 列宁·王 , 宋帅文 , 辛福 :
Shift-BNN:通过记忆友好模式检索实现高效概率贝叶斯神经网络训练。 885-897
第8A部分: 超导与量子
张梦玉 , 谢磊(音) , Zhenxing Zhang(张振兴) , 乔年于 , 西广磊 , 张华良 , 刘福明 , Yarui Zheng先生 , 郑一聪 , 张胜宇(Shengyu Zhang) :
在超导量子比特的量子控制微结构中开发不同级别的并行性。 898-911 Farzaneh Zokaee公司 , 雷江 :
SMART:基于超导SFQ的收缩CNN加速器的异构暂存存储器架构。 912-924 费华 , 陈彦浩 , 金玉伟 , 张驰(Chi Zhang) , 阿里·海耶斯 , 张友涛 , 埃迪Z.张 :
AutoBraid:量子计算中实现高效表面代码通信的框架。 925-936 普拉米·达斯 , 斯瓦米特·斯坦努 , 莫努丁·库雷希 :
JigSaw:通过测量子集提高NISQ项目的保真度。 937-949 普拉米·达斯 , 斯瓦米特·斯坦努 , Siddharth Dangwal公司 , 莫努丁·库雷希 :
自适应:通过自适应动态解耦来减少Qubits中的Idling错误。 950-962
第8B部分: 稀疏处理
杭鲁 , 梁畅 , 李成龙 , 朱子轩 , 升建路 , 刘延欢 , 张明哲 :
提取位级稀疏并行度以实现通用深度学习加速。 963-976 陆立强 , 亿城金 , 韩瑞碧 , 罗紫章 , 彭丽 , 王涛(音译) , 云亮(Yun Liang) :
Sanger:使用可重构体系结构实现稀疏注意力的协同设计框架。 977-991 李世玉 , 爱德华·汉森 , 钱学海 , 李海(海伦) , 陈一然 :
ESCALATE:通过核分解提高稀疏CNN加速器的效率。 992-1004 Subhankar Pal公司 , 阿波罗·阿玛纳 , 冯思颖 , 迈克尔·F·P·奥博伊尔 , 罗纳德·德雷斯林斯基 , 克里斯托夫·杜巴赫 :
稀疏自适应:可重构加速器上稀疏线性代数的运行时控制。 1005-1021 亚历山大·鲁克 , 马修·维利姆 , 田昭 , 张亚琪 , 拉胡·普拉巴卡 , 昆勒·奥卢科顿 :
绞盘:稀疏的矢量RDA。 1022-1035
第9A部分: 图形处理
阿班蒂·巴萨克 , 郑渠 , 林季兰 , 阿拉·R·阿拉梅尔丁 , 泽山赤什提 , 丁宇飞 , 袁燮 :
使用输入知识提高流图处理性能。 1036-1050 童耕 , 吴春树 , 张永安 , Cheng Tan公司 , 谢晨浩 , 浩然游 , 马丁·赫伯特 , 林英彦 , 李安(Ang Li) :
I-GCN:通过孤岛化增强运行时局部性的图卷积网络加速器。 1051-1063 Quan M.Nguyen先生 , 丹尼尔·桑切斯 :
Fifer:实际加速可重构架构上的不规则应用程序。 1064-1077 张洁芳 , 张正亚 :
Point-X:基于图形的能量高效点云深度学习的空间-局部感知架构。 1078-1090 沙菲乌尔·拉赫曼 , 马哈博德·阿法林 , Nael B.Abu-Ghazaleh公司 , 拉吉夫·古普塔 :
JetStream:使用事件驱动硬件加速器对流数据进行图形分析。 1091-1105
第9B部分: 虚拟内存和预取
文卡特·斯里·赛拉姆 , 阿什什·潘瓦尔 , 阿尔卡普拉瓦·巴苏 :
Trident:在x86处理器中为所有页面大小利用架构资源。 1106-1120 拉胡尔·贝拉 , 康斯坦蒂诺斯·卡内洛普洛斯 , 阿南特·诺里 , 塔哈·沙鲁迪 , Sreenivas Subramoney公司 , Onur Mutlu公司 :
Pythia:使用在线强化学习的可定制硬件预取框架。 1121-1137 乔治·沃夫利奥蒂斯(Georgios Vavouliotis) , 卢克·阿尔瓦雷斯 , 鲍里斯·格罗 , 丹尼尔·吉梅内斯(Daniel A.Jiménez) , 马克·卡萨斯 :
Morrigan:复合指令TLB预取器。 1138-1153 李炳耀 , 尹杰明 , 张友涛 , 唐旭龙 :
通过共享和溢出感知TLB设计改进多GPU中的地址转换。 1154-1168 贾加迪什·B·科特拉 , 迈克尔·勒比恩 , 马赫穆特·坎德米尔 , 加布里埃尔·H·卢 :
通过利用未充分利用的片上资源增加GPU翻译范围。 1169-1181
会议10A:安全与隐私III
路易斯·奥罗萨 , 阿卜杜拉·吉雷·亚格利克西 , 罗浩聪 , 阿塔伯克·奥尔根 , Jisung公园 , 哈桑·哈桑 , 米内什·帕特尔 , 杰里米·S·金 , Onur Mutlu公司 :
深入了解RowHammer的敏感性:对真实DRAM芯片的实验分析以及对未来攻击和防御的影响。 1182-1197 哈桑·哈桑 , 叶海亚·坎·图格鲁 , 杰里米·S·金 , 维克托·范德维恩 , 卡维·拉扎维 , Onur Mutlu公司 :
揭示DRAM中的RowHammer保护机制:一种新的方法、自定义RowHammer模式及其启示。 1198-1213 卡齐·阿布·祖拜尔 , 苏丹瓦·古鲁穆蒂 , 维拉斯·斯里德哈兰 , 阿姆罗阿瓦德 :
Soteria:面向弹性完整保护和加密非易失性存储器。 1214-1226 亚历山大·弗雷伊 , 周惠阳 , 严索林 :
盆景Merkle森林:在安全持久记忆中高效实现崩溃一致性。 1227-1240 西京韩 , 詹姆斯·塔克 , 阿姆罗阿瓦德 :
Dolos:改进ADR支持的安全内存中持久应用程序的性能。 1241-1253
会议10B:微体系结构II
Vasileios Tsoutouras公司 , Orestis Kaparounakis公司 , 比尔格苏·阿里夫·比尔金 , 查图拉·萨马拉孔 , 詹姆斯·蒂莫西·米奇 , 扬·赫克 , 菲利普·斯坦利·马贝尔 :
用于跟踪数据不确定性的拉普拉斯微体系结构及其在RISC-V处理器中的实现。 1254-1269 Chanchal Kumar公司 , 阿尼鲁德·塞沙德里 , Aayush Chaudhary公司 , Shubham Bhawalkar公司 , 罗希特·辛格 , 埃里克·罗滕伯格 :
后加工微结构。 1270-1281 徐元超 , 穆罕默德·埃萨特·贝尔维兰利 , 沈喜鹏 , 杰弗里·维特 :
PCCS:以处理器为中心的异构系统芯片上的竞争软件慢降模型。 1282-1295 约苏·费利乌(JosuéFeliu) , 阿尔贝托·罗斯 , 曼纽尔·阿卡西奥 , 斯特凡诺斯·卡西拉斯 :
ITSLF:线程间存储,用于在同时多线程中加载转发。 1296-1308 刘刘 , 林季兰 , 郑渠 , 丁宇飞 , 袁燮 :
ENMC:通过近似筛选进行极端近记忆分类。 1309-1322
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)