第47届ISCA 2020:虚拟活动/西班牙巴伦西亚
-
第47届ACM/IEEE计算机体系结构年度国际研讨会,ISCA 2020,虚拟活动/西班牙巴伦西亚,2020年5月30日至6月3日。 电气与电子工程师协会 2020 ,国际标准图书编号 978-1-7281-4661-4 巴伦特·阿巴利 , 巴特·布莱纳 , 约翰·雷利 , 马蒂亚斯·克莱因 , 阿什图什·米什拉 , 克雷格·B·阿格里科拉 , 贝德丽·森迪尔 , Alper Buyuktosunoglu公司 , 克里斯蒂安·雅各比 , 威廉·J·斯塔克 , 哈伦·迈尼尼 , 查理·王 :
IBM POWER9和z15处理器上的数据压缩加速器:工业产品。 1-14 格伦·亨利 , 帕维兹·帕朗普尔 , 迈克尔·汤姆森 , J.斯科特·加德纳 , 布莱斯·雅顿 , 吉姆·多纳休 , 金布尔猎犬 , 乔纳森·约翰逊 , 凯尔·奥布莱恩 , 斯科特·彼得森 , 本杰明·塞鲁西 , 泰勒·沃克 :
高性能深度学习协处理器,集成到x86 SoC中,具有服务器级CPU工业产品。 15-26 纳拉西姆哈·阿迪加 , 詹姆斯·博纳诺 , 亚当·科鲁拉 , 马蒂亚斯·海兹曼 , 布莱恩·普拉斯基 , 安东尼·萨波里托 :
IBM z15高频大型机分支预测器工业产品。 27-39 布莱恩·格雷森 , 杰夫·鲁普利 , 杰拉尔德·苏拉斯基 , 埃里克·昆内尔 , 丹尼尔·吉梅内斯(Daniel A.Jiménez) , 塔伦·纳卡拉 , 保罗凯钦 , 瑞安·汉斯莱 , 爱德华·布雷克鲍姆 , 维卡斯·辛哈 , 安基特·吉亚 :
三星Exynos CPU微体系结构的演变。 40-51 陈晨 , 小燕香 , 刘畅 , 云海上 , 任国 , 刘东奇 , 陆一民 , 子怡浩 , 罗家辉 , 陈志坚 , 李春强 , 于璞 , 孟建义 , 小浪燕 , 袁燮 , 齐晓宁 :
玄铁910:一款商用多核12级流水线无序64位高性能RISC-V处理器,带矢量扩展:工业产品。 52-64 安萨里 , 佩杰曼·洛特菲-卡姆兰 , 哈米德·萨巴齐·阿扎德 :
划分并克服前端瓶颈。 65-78 Sumeet Bandishte公司 , 杰耶什·高尔 , 泽夫·斯珀伯 , 丽湖拉波波特 , 阿迪·尤亚兹 , Sreenivas Subramoney公司 :
聚焦价值预测。 79-91 Adarsh Chauhan公司 , 杰耶什·高尔 , 泽夫·斯珀伯 , 弗兰克·萨拉 , 丽湖拉波波特 , 阿迪·尤亚兹 , Sreenivas Subramoney公司 :
关键分支的自动预测。 92-104 Vinesh Srinivasan公司 , 兰根·巴苏·罗伊·乔杜里 , 埃里克·罗滕伯格 :
重温滑流处理器:利用分支集。 105-117 塞缪尔·帕卡拉帕蒂 , 比斯瓦班丹大熊猫 :
指令指针簇:基于指令指针分类器的空间硬件预取。 118-131 萨姆·安斯沃思 , 蒂莫西·琼斯 :
MuonTrap:通过捕获推测状态来防止跨域类镜片攻击。 132-144 丹尼斯·阿布茨 , 乔纳森·罗斯 , 乔纳森·斯派林 , 马克·旺·文哈伦 , 马克斯·贝克 , 汤姆-霍金斯 , 安德鲁·贝尔 , 唐世璋 , Temesghen Kahsai公司 , 加林·金梅尔 , 詹妮弗·黄 , 丽贝卡·莱斯利·胡德 , 迈克尔·拜拜 , E.R.Creswick公司 , 马修·博伊德 , 马希莎·维尼加拉 , 埃文·拉福吉 , 乔·普迪 , 普鲁肖塔姆·卡马特 , 迪内什·马赫什瓦里 , 迈克尔·贝德勒 , 吉尔特·罗西尔 , 奥马尔·艾哈迈德 , 格勒布·加加林 , 理查德·切卡尔斯基 , 阿沙·雷恩 , 萨希尔·帕尔马 , 杰夫·沃纳 , 吉姆·斯普洛赫 , 阿德里安·马西亚斯 , 布莱恩·库兹 :
快速思考:用于加速深度学习工作负载的张量流处理器(TSP)。 145-158 维克多·A·英 , 马克·杰弗里 , 丹尼尔·桑切斯 :
T4:编译用于硬件中有效推测并行化的序列代码。 159-172 王墨洋(Moyang Wang) , 团塔 , 林成 , 克里斯托弗·巴顿 :
有效支持异构缓存相关系统上的动态任务并行。 173-186年 Shenghsun Cho先生 , 韩晨(Han Chen) , 谢尔盖·马达米诺夫 , 迈克尔·费德曼 , 彼得·米尔德 :
Flick:快速轻量级的ISA交叉调用异构ISA环境。 187-198 马克·萨瑟兰 , 悉达哈斯·古普塔 , 巴巴克·法尔萨菲 , 维伦德拉·J·马拉特 , 迪奥尼修斯·普内夫马提卡托斯 , 亚历山大·达格利斯 :
NEBULA RPC优化架构。 199-212 纳撒尼尔·布利埃 , 穆罕默德·侯赛因·穆巴里克 , 法尔汉·拉希德 , 贾斯敏·阿加西·哈格曼 , Mehdi B.Tahoori公司 , 拉凯什·库马尔 :
印刷微处理器。 213年至226年 贾瓦德·哈吉-叶海亚 , 穆罕默德·阿尔瑟 , 杰里米·S·金 , 阿卜杜拉·吉雷·亚格利克西 , 南迪塔·维杰库马尔 , 埃夫拉伊姆·罗特姆 , Onur Mutlu公司 :
SysScale:为节能移动处理器开发多域动态电压和频率缩放。 227-240 赵树林 , 张海波 , 桑迪帕·布扬 , 青色Subhra Mishra , 紫玉英 , 马赫穆特·坎德米尔 , 阿南德·西瓦苏布拉曼尼亚 , 契塔·R·达斯 :
DéjáView:“节能360°VR视频流的时空计算重用”。 241-253 泰俊火腿 , 大卫·布伦斯·史密斯 , 布伦丹·斯威尼 , Yejin Lee公司 , Seong Hoon Seo先生 , U.Gyeong Song公司 , 年轻的H.Oh , 克里斯特·阿萨诺维奇 , Jae W.Lee(李在伟) , 丽莎·吴·威尔斯 :
Genesis:基因组数据分析的硬件加速框架。 254-267 Jian Weng(建翁) , 刘思豪 , 维杜什大道 , 王正荣 , 波里亚斯·沙阿 , 托尼·诺瓦茨基 :
DSAGEN:合成可编程空间加速器。 268-281 尼古拉·萨马尔季奇 , 乔伟康 , 瓦比哈夫·阿加瓦尔 , 毛钟弗兰克·张 , 丛京生 :
盆景:高性能自适应合并树排序。 282-294 刚原·乔 , 希洪·金 , 杰索·李 , 李政宰 :
SOFF:FPGA的OpenCL高级综合框架。 295-308年 马修·维利姆 , 亚历山大·拉克 , 张亚琪 , 索菲娅·刘 , 昆勒·奥卢科顿 :
Gorgon:加速从关系数据中进行机器学习。 309-321 Jaeyoung Jang先生 , 荣成俊 , 郑孙敏(Sunmin Jeong) , Jun Heo先生 , 勋信 , 泰俊火腿 , Jae W.Lee(李在伟) :
对象序列化的专用架构,用于大数据分析。 322至334 伊尔昆·拜恩 , Min东月 , Gyu-hyeon Lee(李国贤) , Seongmin Na公司 , 金章武(Jangwoo Kim) :
CryoCore:用于低温计算的快速密集处理器架构。 335-348 苏里亚·纳拉亚南 , 卡尔·塔赫 , Rajeev Balasubramonian公司 , 爱德华·贾科明 , 皮埃尔·伊曼纽尔·盖拉登 :
SpinalFlow:专为尖峰神经网络量身定制的架构和数据流。 349-362 同行教师索娜莉·辛格 , 阿努普·萨玛 , 尼古拉斯·饶 , 阿舒托什·帕特奈克 , 森鲁(Sen Lu) , 杨克洲 , Abhronil Sengupta公司 , 维杰里什南·纳拉亚南 , 契塔·R·达斯 :
NEBULA:用于SNN和ANN的基于神经形态自旋的超低功耗架构。 363-376 狄武 , 李景杰 , 尹若凯 , 宣孝 , 金永云 , 约书亚·圣米格尔 :
UGEMM:GEMM应用程序的一元计算体系结构。 377-390 Ioannis Karageorgos公司 , 卡西克·斯里拉姆 , 贾恩·维塞尔 , 迈克尔·吴 , 马克·鲍威尔 , 大卫·A·波顿 , 拉吉特·马诺哈尔 , Abhishek Bhattacharjee公司 :
脑机接口的软硬件协同设计。 391-404年 朱新辉 , 魏祥江 , 刘方明 , 张奇霞 , 李攀 , 陈琼(音) , 资阳佳 :
热能发电:用于温水冷却数据中心的热能收集和回收。 405-418 杨一凡 , 李兆石 , 邓阳东 , 刘志伟 , 首义音 , 魏少军 , 刘雷波 :
图形ABCD:使用异步块坐标下降缩放图形分析。 419-432 Challapalle的Nagadastagiri , 萨希蒂·兰帕利 , 宋凌浩 , 南迪尼·昌德拉穆蒂 , 卡提克·斯瓦米纳坦 , 约翰·桑普森 , 陈一然 , 维杰里什南·纳拉亚南 :
GaaS-X:使用Crossbar架构支持稀疏数据表示的图形分析加速器。 433-445 维杰·贾纳帕·雷迪 , 克里斯汀·程 , 大卫·坎特 , 彼得·马特森 , Guenther Schmuelling公司 , 卡罗尔·让·吴 , 布莱恩·安德森 , 马克西米利恩·布鲁赫 , 马克·查勒鲍斯 , 威廉姆周 , 拉梅什·丘卡 , 科迪·科尔曼 , 萨姆·戴维斯 , 潘登 , 格雷格·迪亚莫斯 , 杰瑞德·杜克 , 戴夫·菲克 , J.斯科特·加德纳 , 伊泰·胡巴拉 , 萨钦·伊德根吉 , 托马斯·贾布林 , 焦杰夫(Jeff Jiao) , 汤姆·圣约翰 , 潘卡杰·坎瓦尔 , 大卫·李 , 杰弗里·廖 , 安东·洛克莫托夫 , 弗朗西斯科·马萨 , 彭蒙 , 保利乌斯·米切维希乌斯 , 科林·奥斯本 , Gennady Pekhimenko先生 , Arun Tejusve Raghunath Rajan , 迪利普·塞奎拉 , Ashish西拉索 , 孙飞 , 唐汉林 , 迈克尔·汤姆森 , Frank Wei(弗兰克·魏) , Ephrem Wu先生 , 徐凌杰 , 山田光一 , 冰雨 , 袁先智 , 钟亚伦(Aaron Zhong) , 张培钊 , 周雨晨 :
MLPerf推断基准。 446-459 马里奥·巴德 , 卡洛·德尔孔特 , 伊萨克·江户 , 拉迪卡·贾格塔普 , 马泰奥·安德烈奥齐 , 娜塔莉·恩赖特·杰格 :
模拟:捕捉专有移动架构的记忆行为。 460-472 马哈茂德·凯里 , 沈哲生 , 托尔·阿莫特 , 蒂莫西·罗杰斯 :
Accel-Sim:用于验证GPU建模的可扩展仿真框架。 473-486 阿列克谢·拉夫罗夫 , 大卫·温茨拉夫 :
HyperTRIO:I/O地址的超租户转换。 487-500 迪米特里奥斯·斯卡拉托斯 , 乌穆尔·达巴兹 , 巴加瓦·戈皮雷迪 , 南宋金 , 约塞普·托雷拉斯 :
BabelFish:集装箱的融合地址翻译。 501-514 克洛伊·阿尔维特 , Stratos Psomadakis公司 , 瓦西里厄斯·卡拉科斯塔斯 , 杰内尔·甘地 , 康斯坦蒂诺斯·尼卡斯 , 乔治奥斯·古玛斯 , Koziris油桃 :
增强和利用快速内存虚拟化的连续性。 515-528 普拉卡什·穆拉利 , Dripto M.Debroy公司 , 肯尼思·布朗 , 玛格丽特·马托诺西 :
设计噪音中等规模陷阱离子量子计算机。 529-542 程静蕾(音译) , 邓浩清 , 钱学海 :
AccQOC:加速基于量子最优控制的脉冲生成。 543-555 亚当·霍姆斯 , 穆罕默德·雷扎·约卡尔 , 加西姆·帕桑迪 , 永善顶 , 马苏德·佩德拉姆 , 弗雷德里克·T·冲 :
NISQ+:通过近似量子纠错提高量子计算能力。 556-569 永善顶 , 吴新川 , 亚当·霍姆斯 , 阿什·怀斯 , 戴安娜·富兰克林 , 玛格丽特·马托诺西 , 弗雷德里克·T·冲 :
SQUARE:Strategic Quantum Ancilla通过成本有效的非计算重用模块化量子程序。 570-583 苗才 , Chance C.Coats公司 , 黄健 :
HOOP:非易失性内存的高效硬件辅助异地更新。 584-596 Jian Zhou公司 , 阿姆罗阿瓦德 , 王军(Jun Wang) :
Lelantus:安全非易失性存储器的精细复制写入操作。 597-609 魏雪亮 , 丹凤 , 魏彤(Wei Tong) , 刘静宁 , 刘庆叶 :
MorLog:非易失性主内存中原子持久性的可变形硬件日志记录。 610-623 拉贾特·凯特加 , 内森·贝克曼 , 格雷戈里·甘格 :
TVARAK:直接访问NVM存储中冗余的软件管理硬件卸载。 624-637 杰里米·S·金 , 米内什·帕特尔 , 阿卜杜拉·吉雷·亚格利克西 , 哈桑·哈桑 , 罗克诺丁·阿齐兹 , 路易斯·奥罗萨 , Onur Mutlu公司 :
重温RowHammer:现代DRAM设备和缓解技术的实验分析。 638-651 瓦比哈夫·戈特 , 威廉·王 , 斯蒂芬·迪斯特霍斯特 , 彼得·M·陈 , 萨蒂什·纳拉亚纳萨米 , 托马斯·韦尼施 :
使用链持久性放松持久性排序。 652-665 罗浩聪 , 塔哈·沙鲁迪 , 哈桑·哈桑 , 米内什·帕特尔 , 阿卜杜拉·吉雷·亚格利克西 , 路易斯·奥罗萨 , Jisung公园 , Onur Mutlu公司 :
CLR-DRAM:一种低成本DRAM体系结构,支持动态容量-延迟权衡。 666-679 徐元超 , 叶晨成 , 严索林 , 沈喜鹏 :
基于硬件的域虚拟化用于持久内存对象的进程内隔离。 680-692 Joohyong Yoon公司 , 赢得Seob Jeong , Won Woo Ro公司 :
签入:利用基于闪存的SSD的键值存储系统的存储内检查点。 693-706 余继勇 , Namrata曼特里 , 约塞普·托雷拉斯 , 亚当-莫里森 , 克里斯托弗·弗莱彻 :
推测性数据发布执行:动员安全预测以实现安全高效的推测性执行。 707-720 穆罕默德卡泽姆塔拉姆 , Ashish文卡特 , 院长M.Tullsen :
数据包跟踪:通过缓存侧通道监视网络数据包。 721-734 梅萨姆·塔萨索里 , Rajeev Balasubramonian公司 , 悉达多·恰布拉 , 阿拉·R·阿拉梅尔丁 , 曼朱拉·佩迪雷迪 , 拉贾特·阿加瓦尔 , 瑞恩·斯图茨曼 :
紧凑无泄漏支持完整性和可靠性。 735-748 徐振宇 , 托马斯·莫尔丁 , 折翼药 , 裴淑仪 , 陶伟 , 青杨 :
总线身份验证和反路由体系结构扩展了基于CPU芯片及其以外的硬件可信计算。 749-761 拉苏尔·沙里菲 , 阿什什·文卡特 :
CHEx86:通过支持微码的功能对内存安全进行上下文敏感的强制执行。 762-775 中央公园 , Naegyeong Kang公司 , Taehoon Kim公司 , Youngjin Kwon先生 , Jaehyuk Huh先生 :
嵌套封装:支持SGX的细粒度分层隔离。 776-789年 刘科 , 乌迪特·古普塔 , 本杰明·杨家·赵 , 大卫·布鲁克斯 , 维卡斯·钱德拉 , 乌特库·迪里尔 , 阿明·费鲁兹沙汗 , 金·哈泽尔伍德 , 比尔·贾 , 李显新 , 孟莉 , 伯特·马赫 , 迪瓦萨·穆迪盖尔 , 马克西姆·诺莫夫 , 马丁·沙茨 , 米哈伊尔·斯梅尔扬斯基 , 王晓东 , 布兰登·里根 , 卡罗尔·让·吴 , 马可·亨普斯特德 , 张宣 :
RecNMP:通过近记忆处理加速个性化推荐。 790-803 彭古 , 谢新峰 , 丁宇飞 , 陈国洋(音) , 张伟峰 , Dimin Niu(牛迪敏) , 袁燮 :
iPIM:使用近库结构的可编程内存图像处理加速器。 804-817 本杰明·赵 , 永记权 , 桑库·莱姆 , 马坦·埃雷斯 :
通过并发主机访问实现近数据加速。 818-831 李维涛 , 徐鹏飞 , 杨钊 , 李海通 , 袁燮 , 林英彦 :
及时:将Pim加速器中的数据移动和接口推向本地和时域。 832-845 越查 , 李静 :
Hyper-Ap:通过全层优化增强关联处理。 846-859 R.大卫·埃文斯 , 刘璐飞 , 托尔·阿莫特 :
JPEG-ACT:通过基于变换的有损压缩加速深度学习。 860-873 纳奥林·侯赛因 , 卡罗琳·特里佩尔 , 玛格丽特·马托诺西 :
转换形式:正式指定瞬态模型并合成增强型石蕊测试。 874-887 尼古拉·奥斯瓦尔德 , 维杰·纳加拉扬 , 丹尼尔·索林 :
HieraGen:自动生成并发、分层缓存一致性协议。 888-899 法鲁克·古韦利尔 , 耶鲁·N·帕特 :
定制页面大小。 900-912 昌贤公园 , Sanghoon Cha公司 , Bokyeong Kim公司 , Youngjin Kwon先生 , 大卫·布莱克·夏弗 , Jaehyuk Huh先生 :
穿孔页面:支持大页面的碎片内存分配。 913-925 埃沙·乔克斯 , 迈克尔·B·沙利文 , 奥康纳 , 马坦·埃雷斯 , 杰夫·普尔 , 大卫·W·内兰(David W.Nellans) , 斯蒂芬·凯克勒 :
Buddy压缩:为GPU上的深度学习和HPC工作负载提供更大的内存。 926-939 恩金·贝克 , Dongup Kwon公司 , 金章武(Jangwoo Kim) :
一种多神经网络加速体系结构。 940-953 杨钊 , 陈晓涵(Xiaohan Chen) , 王悦(Yue Wang) , 李超建 , 浩然游 , 傅永干 , 袁燮 , 张扬·王 , 林英彦 :
SmartExchange:以高成本内存存储/访问换取低成本计算。 954-967 黄兰吉(Ranggi Hwang) , 金泰勋 , Youngeun Kwon公司 , 明秀·鲁 :
半人马座:基于碎片的混合稀疏密度加速器,用于个性化推荐。 968-981年 乌迪特·古普塔 , 塞缪尔·夏 , 维克拉姆·萨拉夫 , 王晓东 , 布兰登·里根 , 顾延伟 , 李显新 , 大卫·布鲁克斯 , 卡罗尔·让·吴 :
DeepRecSys:一个优化端到端大规模神经推荐推理的系统。 982-995 本杰明·克伦克 , 南江 , 格雷格·托森 , 拉里·丹尼森 :
用于加速共享内存多处理器集合的网络内体系结构。 996-1009 卓然歌 , Bangqi Fu先生 , 吴飞扬 , 姜兆明 , 李江 , Naifeng Jing公司 , 梁晓尧 :
DRQ:深度神经网络加速的基于动态区域的量化。 1010-1021 亚历山德鲁·杜图 , 马修·辛克莱 , 布拉德福德·M·贝克曼 , 大卫·A·伍德 , 马库斯·周 :
工作组的独立前进。 1022-1035 阿迪蒂亚·卡马特 , 阿尔文·A·乔治 , 阿尔卡普拉瓦·巴苏 :
ScoRD:用于GPU的Scoped Race检测器。 1036-1049 纳斯塔兰·哈吉纳扎尔 , Pratyush Patel公司 , 米内什·帕特尔 , 康斯坦蒂诺斯·卡内洛普洛斯 , 索加塔Ghose , 拉查塔·奥萨瓦隆尼伦 , 杰拉尔多·F·奥利维拉 , 乔纳森·阿帕沃奥 , 维韦克·塞沙德里 , Onur Mutlu公司 :
虚拟块接口:传统虚拟内存框架的灵活替代方案。 1050-1063年 张杰(音译) , Myoungsoo Jung先生 :
ZnG:使用新Flash构建GPU多处理器,用于可扩展数据分析。 1064-1075 本·范伯格 , 本杰明·海曼 , 达莉亚·米哈伊连科 , Ryan Wong(瑞安·王) , 安·C.Ho , 发动机Ipek :
交换数据重新排序:一种在稀疏推理工作负载上减少数据移动能量的新技术。 1076-1088 郑伯坚 , 南迪塔·维杰库马尔 , Gennady Pekhimenko先生 :
Echo:LSTM RNN训练中基于编译器的GPU内存占用减少。 1089-1102 李久顺 , 金文静(Wenjing Jin) , 元帅之歌 , Jeonghun宫 , 钟云裴 , 泰俊火腿 , Jae W.Lee(李在伟) , Jinkyu Jeong先生 :
基于硬件的需求寻呼案例。 1103-1116