2018年第51届MICRO:日本福冈
-
2018年10月20日至24日,日本福冈,2018年MICRO,第51届IEEE/ACM国际微体系结构年会。 IEEE计算机学会 2018 ,国际标准图书编号 978-1-5386-6240-3
1A: 加速器
阿努拉·穆卡拉 , 内森·贝克曼 , 马琳·阿贝代拉 , 马晓松 , 丹尼尔·桑切斯 :
通过硬件加速遍历调度在图分析中利用局部性。 1-14 徐达周 , 杜子东 , 齐国 , 刘少立 , 刘成思 , 王超(Chao Wang) , 周学海 , 凌莉 , 陈天石 , 陈云吉(Yunji Chen) :
Cambricon-S:通过软件/硬件协同方法处理稀疏神经网络中的不规则性。 15至28 卓有为 , 程静蕾(音译) , 秦一洛 , 冀东寨 , 王彦之(Yanzhi Wang) , 中智栾 , 钱学海 :
CSE:具有收敛集枚举的并行有限状态机。 29-41 达尼·沃伊采乔夫 , 奥隆港 , 尤夫·埃松(Yoav Etsion) :
多线程、可重构粗粒阵列中的线程间通信。 42-54 陈涛 , Shreesha Srinath公司 , 克里斯托弗·巴顿 , G.爱德华·苏 :
在可重构硬件上加速动态并行算法的体系结构框架。 55-67
1B类: 微体系结构
张思卓 , 安德鲁·怀特 , 托马斯·布尔盖特 , 阿尔文德 :
开放处理器设计的可组合构建块。 68-81 安藤秀树 :
通过优先处理不信任分支切片中的指令问题来提高性能。 82-94 阿尔贝托·罗斯 , 斯特凡诺斯·卡西拉斯 :
多余负载队列。 95-107 阿尔穆塔兹·阿迪勒 , 大卫·J·利尔贾 , Lieven Eeckhout公司 :
概率分支的体系结构支持。 108-120 Hidetsugu Irie公司 , 小泉彻 , 福田章文 , Seiya Akaki先生 , 中井佐治 , 尤塔罗·贝绍 , Ryota Shioya先生 , 诺苏高弘 , Katsuhiro Yoda先生 , 石原Teruo Ishihara , 水池酒井 :
直截了当:无寄存器重命名的无危险处理器体系结构。 121-133
第2章: ML加速器
穆斯塔法·马哈茂德 , 凯文·萧 , 安德烈亚斯·莫绍沃斯 :
Diffy:一个Déjàvu免费差分深度神经网络加速器。 134-147 权永根 , 明秀·鲁 :
超越记忆墙:以记忆为中心的深度学习HPC系统案例。 148-161 张兴耀 , 谢晨浩 , 王静(音译) , 张伟东 , 辛福 :
在移动GPU上实现内存友好的长短期内存网络(LSTM)。 162-174 李友杰 , Jongse公园 , 穆罕默德·阿利安 , 袁一凡 , 郑曲 , 裴天磐 , 王仁(音) , 亚历山大·施温 , 哈迪·伊斯梅尔扎德 , 南宋金 :
一种以网络为中心的硬件/算法协同设计,用于加速深层神经网络的分布式训练。 175-188年 邓春华 , 廖思玉 , 一谢 , Keshab K.Parhi公司 , 钱学海 , 博远 :
PermDNN:具有置换对角矩阵的高效压缩DNN体系结构。 189-202
2B类: 编译器和编程语言
蔡波安(Po-An Tsai) , 叶凌甘 , 丹尼尔·桑切斯 :
重新思考现代语言的记忆层次。 203-216 马克·杰弗里 , 维克多·A·英 , 苏维奈·苏布拉曼尼亚语 , 李贤龙 , 乔尔·埃默 , 丹尼尔·桑切斯 :
协调体系结构中的推测性执行和非推测性执行,以实现有序并行。 217-230 萨姆·西尔维斯特罗 , 刘洪宇 , 张彤(音译) , 郑昌熙(Changhee Jung) , 东洋·李 , 刘同平(音) :
采样器:基于PMU的采样,用于检测生产软件中潜在的内存错误。 231-244 史蒂夫·马格姆 , 阿米拉利·谢里菲安 , 阿帕拉·古哈 , Arrvindh Shriraman公司 , 吉尔斯·波卡姆 :
TAPAS:从并行程序生成并行加速器。 245-257 刘庆瑞 , 约瑟夫·伊兹拉列维茨 , 李世权 , 迈克尔·斯科特 , 山姆·H·诺 , 郑昌熙(Changhee Jung) :
iDO:非易失性内存的编译器定向故障原子性。 258-270
3A: 内存系统-I
Srikant Bharadwaj公司 , 吉尔赫梅·考克斯 , 图沙·克里希纳 , Abhishek Bhattacharjee公司 :
使用低延迟互连的可扩展分布式末级TLB。 271-284 本·林 , 迈克尔·B·希利 , 鲁斯塔姆·米夫塔赫季诺夫 , 菲利普·G·艾玛 , 耶鲁·N·帕特 :
重复缓存:通过数据复制缓解片外内存库和库组冲突。 285-297 王耀华 , 阿拉什·塔瓦库尔 , 路易斯·奥罗萨 , 索加塔Ghose , 尼卡·曼苏里·吉亚西 , 米内什·帕特尔 , 杰里米·S·金 , 哈桑·哈桑 , 穆罕默德·萨德罗萨达蒂 , Onur Mutlu公司 :
通过电荷级别感知的外观部分恢复减少DRAM延迟。 298-311 崔明恩 , 阿迪·富克斯 , 大卫·温茨拉夫 :
电缆:一种基于CAche的链路编码器,用于带宽目标多芯。 312-325 Seokin Hong公司 , Prashant Jayaprakash奈尔 , 巴伦特·阿巴利 , Alper Buyuktosunoglu公司 , 金圭贤 , 迈克尔·B·希利 :
附件:通过减少元数据带宽开销实现理想的内存压缩。 326-338
3B公司: GPGPU/GPU
文森·杨 , 阿默·贾勒尔 , Evgeny牛肝素 , 艾曼·易卜拉希米 , 大卫·W·内兰(David W.Nellans) , 奥瑞斯特别墅 :
结合硬件/软件机制提高多GPU系统的NUMA性能。 339-351 Seunghee Shin先生 , 迈克尔·勒比恩 , 严索林 , 阿尔卡普拉瓦·巴苏 :
用于不规则GPU应用程序的邻居软件地址转换。 352-363 Yunho哦 , Myung Kuk Yoon先生 , 威廉·J·宋 , Won Woo Ro公司 :
FineReg:用于增加GPU吞吐量的细粒度寄存器文件管理。 364-376 Farzad Khorasani公司 , 霍贾特·阿斯加里·埃斯费登 , Nael B.Abu-Ghazaleh公司 , 维维克·萨卡尔 :
具有虚拟持久处理器专业化的动态神经网络的寄存器内参数缓存。 377-389 安邹 , 镜文冷 , 新河 , 雅州组 , 克里斯托弗·D·吉尔 , 维杰·贾纳帕·雷迪 , 张宣 :
电压叠加GPU:一种控制理论驱动的跨层解决方案,用于GPU中的实际电压叠加。 390-402
4A: 安全-I
毛烨 , 克莱顿·休斯 , 阿姆罗阿瓦德 :
欧西里斯:一种低成本机制,用于恢复安全的非易失性存储器。 403-415 古鲁拉吉·塞利什瓦尔 , 普拉珊·奈尔 , 普拉卡什·拉姆拉赫亚尼 , 温迪·埃尔萨瑟 , 何塞·A·若昂 , 莫努丁·库雷希 :
可变形计数器:为低端安全内存启用紧凑完整性树。 416-427 孟家燕 , Jiho Choi先生 , 迪米特里奥斯·斯卡拉托斯 , 亚当-莫里森 , 克里斯托弗·弗莱彻 , 约塞普·托雷拉斯 :
InvisiSpec:使推测执行在缓存层次结构中不可见。 428-441 左鹏飞 , 余华 , Ming Zhao(赵铭) , 温州 , 郭运城 :
通过重复写入数据消除提高加密的非易失性主内存的性能和持久性。 442-454
4B类: 存储系统和技术
金俊雄(Joonsung Kim) , 平须公园 , Jaehyung Ahn先生 , 金纪勋(Jihun Kim) , 金正恩 , 金章武(Jangwoo Kim) :
SSD检查:及时准确地预测黑盒SSD中的不规则行为。 455-468 东贤沟 , Miryeong Kwon先生 , 张杰(音译) , Sungjoon Koh公司 , Wonil Choi先生 , 南宋金 , 马赫穆特·坎德米尔 , Myoungsoo Jung先生 :
琥珀色*:通过所有SSD资源的详细建模实现精确的全系统仿真。 469-481 Wonil Choi先生 , Myoungsoo Jung先生 , 马赫穆特·坎德米尔 :
提高高密度闪存读取性能的数据软件编码无效。 482-493 星虎 , 马修斯·奥格利利 , 赵纪深(Jishen Zhao) , 李双晨 , 阿班蒂·巴萨克 , 袁燮 :
持久性并行优化:从内存总线到RDMA网络的整体方法。 494-506
第五章: 内存系统-II
崔明恩 , 大卫·温茨拉夫 :
PiCL:非易失性主内存的软件透明持久缓存日志。 第507-519页 Jungi Jeong先生 , 昌贤公园 , Jaehyuk Huh先生 , Seungryoul Maeng先生 :
高效的硬件辅助日志记录,具有异步和永久内存的直接更新功能。 520-532 贾加迪什·科特拉 , 张海波 , 阿拉·R·阿拉梅尔丁 , 克里斯·威尔克森 , 马穆特·坎德米尔 :
CHAMELEON:一个动态可重构的异构存储系统。 533-545 埃沙·乔克斯 , 马坦·埃雷斯 , 阿拉·R·阿拉梅尔丁 :
压缩:语用主记忆压缩。 546-558 阿姆纳·沙哈卜 , 朱明灿 , 阿尔特米·马加里托夫 , 鲍里斯·格罗 :
再见我的共享有限责任公司! 服务器专用叠层DRAM缓存案例。 559-572
第五章: 测量、建模和仿真
扎卡里亚斯·哈吉兰布鲁 , 悉达多达斯 , 马可·A·安东尼亚德斯 , Yiannakis Sazeides公司 :
利用CPU电磁辐射进行电压噪声表征。 573-585 Hanhwi Jang先生 , Jae-Eon Jo公司 , Jaewon Lee先生 , 金章武(Jangwoo Kim) :
RpStacks-MT:一种用于多核处理器的高通量设计评估方法。 586-599 约书亚·圣米格尔 , 卡西克·甘尼桑(Karthik Ganesan) , 马里奥·巴德 , 春秋夏 , 罗丝·李 , 宣孝 , 娜塔莉·恩赖特·杰格 :
EH模型:间歇处理器体系结构的早期设计空间探索。 600-612 吕毅荣 , 孙斌(Bin Sun) , 罗庆义 , 王静(音译) , 于志斌 , 钱学海 :
CounterMiner:从硬件计数器中挖掘大型性能数据。 613-626年 Shenghsun Cho先生 , 阿莫加瓦尔沙·苏雷什 , 塔普蒂·帕利特 , 迈克尔·费德曼 , 尼玛·霍纳曼德 :
驯服杀手微秒。 627-640
6A: 近内存计算
蔡波安(Po-An Tsai) , 陈昌平 , 丹尼尔·桑切斯 :
非对称内存层次系统的自适应调度。 641-654 刘佳文 , 赵恒宇 , 马修斯·奥格利利 , 董丽(Dong Li) , 赵纪深(Jishen Zhao) :
高效能神经网络训练的内存处理:一种异构方法。 655-668 毛海宇(Haiyu Mao) , 宋明聪 , 陶莉 , 戴玉亭 , 《纪武书》 :
LerGAN:一种零自由、低数据移动和基于PIM的GAN架构。 669-681 Byungchul Hong先生 , Yeonju Ro公司 , 约翰·金 :
基于记忆中心架构的Winograd层多维并行训练。 682-695 李双晨 , 阿尔文·奥利弗·格洛瓦 , 星虎 , 彭古 , 迪明·纽 , 克里希纳·T·马拉迪 , 郑洪忠 , 鲍勃·布伦南 , 袁燮 :
范围:基于DRAM的现场加速器的随机计算引擎。 696-709
6B: 近内存计算
大张 , 维拉斯·斯里德哈兰 , 荀坚 :
探索和优化基于高密度NVRAM的持久内存芯片纠正。 710-723 贝扎德萨拉米 , 奥斯曼·S·安萨尔 , 阿德里安·克里斯塔尔·凯斯特曼 :
FPGA片上存储器电源电压欠定标的综合评估。 724-736 埃姆雷·奥泽 , 巴拉吉·维努 , Xabier Iturbe公司 , Shidhartha Das公司 , Spyros Lyberis公司 , 比格斯 , 彼得·哈罗德 , 约翰·彭顿 :
安全关键系统锁步处理器中的误差相关预测。 737-748 宾尼(Bin Nie) , 杨立山 , Adwait慢跑 , 叶夫根妮亚·斯米尔尼 :
GPGPU应用程序实际可靠性分析的故障点修剪。 749-761 迈克尔·B·沙利文 , Siva Kumar Sastry哈里 , 布莱恩·齐默 , Timothy Tsai , 斯蒂芬·凯克勒 :
SwapCodes:软硬件协同GPU管道错误检测的错误代码。 762-774
7: 最佳论文
莫努丁·库雷希 :
CEASER:通过加密地址和重新映射缓解基于冲突的缓存攻击。 775-787 亚丁·A·马内卡 , 丹尼尔·卢斯蒂格 , 玛格丽特·马托诺西 , 阿尔蒂·古普塔 :
PipeProof:微体系结构规范的自动内存一致性证明。 788-801 穆罕默德·阿利安 , Seungwon Min先生 , 哈迪·阿斯加里莫格哈德达姆 , 阿舒托什·达尔 , 王东凯 , 托马斯·荣威 , 亚当·麦克帕登 , 奥利弗·奥哈洛兰 , 陈德明 , 熊进军 , Daehoon Kim公司 , 文美·W·Hwu , 南宋金 :
具有内存通道网络的应用程序透明近内存处理体系结构。 802-814 Rui Zhang(张瑞) , 卡尔文·德意志 , 彭黄 , 辛西娅·斯图顿 :
用于验证处理器设计安全性的端到端自动利用漏洞生成。 815-827
8安: 非传统建筑
永善顶 , 亚当·霍姆斯 , 阿里·贾瓦迪·阿巴哈里 , 戴安娜·富兰克林 , 玛格丽特·马托诺西 , 弗雷德里克·T·冲 :
魔法状态功能单元:容错量子架构的多级蒸馏电路的映射和调度。 828-840 苏米萨·乔治 , 廖敏丽(Minli Julie Liao) , 江淮盘 , 贾加迪什·科特拉 , 马赫穆特·坎德米尔 , 杰克·桑普森 , 维杰里什南·纳拉亚南 :
MDACache:缓存多维访问内存。 841-854 阿南达·萨马杰达尔 , 帕斯·曼南 , 卡提凯·加格 , 图沙·克里希纳 :
GeneSys:通过硬件中的神经网络进化实现连续学习。 855-866
8B条: 移动和嵌入式体系结构
Prasanna Venkatesh Rengasamy公司 , 张海波 , 赵树林 , 纳奇亚潘奇丹巴拉姆纳奇亚潘 , 阿南德·西瓦苏布拉曼尼亚 , 马赫穆特·坎德米尔 , 奇塔·R·达斯 :
CritICs批评移动应用程序中的关键性。 867-880 穆米塔·戴伊 , 阿里雷扎·纳扎里 , 阿伦卡·G·扎吉克 , 米洛斯·普鲁沃维奇 :
EMPROF:通过物联网和手持设备中的EM-Emanation进行内存剖析。 881-893 贝扎德·博罗杰迪安 , 哈桑基因 , 斯里瓦桑·克里希南 , 崔文志 , 阿列克桑德拉·福斯特 , 维杰·贾纳帕·雷迪 :
MAVBench:微型飞行器基准测试。 894-907
9A: 特定于域的体系结构
刘洪源 , 穆罕默德·阿塞姆·易卜拉欣 , Onur Kayiran公司 , Sreepathi Pai公司 , Adwait慢跑 :
高效的大规模自动化处理的体系结构支持。 908-920 凯文·昂斯塔特 , Arun Subramaniyan公司 , 埃拉赫·萨德雷迪尼 , 雷扎·拉希米 , 凯文·斯卡德隆 , 维斯特利·威默尔 , Reetuparna Das公司 :
ASPEN:用于下推自动机的可扩展In-SRAM体系结构。 921-932 卡提克·赫格德 , 罗希特·阿格拉瓦尔 , 姚玉伦 , 克里斯托弗·弗莱彻 :
变形:基于3D CNN的视频理解的灵活加速。 933-946
9B: 证券-II
卡罗琳·特里佩尔 , 丹尼尔·卢斯蒂格 , 玛格丽特·马托诺西 :
CheckMate:硬件开发和安全Litmus测试的自动合成。 947-960 西安张 , 孙光裕 , 谢培晨 , 张超 , 刘延南(Yannan Liu) , 凌霄伟 , Qiang Xu(强旭) , 薛俊杰(Chun Jason Xue) :
阴影块:使用数据复制加速ORAM访问。 961-973 弗拉基米尔·基里安斯基 , 伊利亚·列别捷夫 , 萨曼·阿马拉辛格 , 斯里尼瓦斯·德瓦达斯 , 乔尔·埃默 :
DAWG:针对推测执行处理器中的缓存定时攻击的防御。 974-987