ACM架构和代码优化汇刊,第15卷
第15卷第1期,2018年4月
Hochan Lee公司 , Mansureh S.Moghaddam公司 , 东莞苏 , 伯恩哈德·艾格 :
通过模调度压缩/解压缩提高粗粒可重构阵列的能效。 1:1-1:26 卡提克·桑加亚 , 迈克尔·路易斯 , 拉迪卡·贾格塔普 , 斯蒂芬·迪斯特霍斯特 , 西德哈斯·尼拉坎坦 , Ankit更多 , 巴里斯·塔斯金 , 马可·亨普斯特德 :
SynchroTrace:用于CMP和HPC工作负载的轻量级多核仿真的同步软件架构(Architecture)诊断跟踪。 2:1-2:26 龙正 , 廖晓飞 , 海金 :
具有符号执行的高效可缩放图形并行处理。 3:1-3:25 Jae-Eon Jo公司 , Gyu-hyeon Lee(李国贤) , Hanhwi Jang先生 , Jaewon Lee先生 , 穆罕默德·艾达里 , 金章武(Jangwoo Kim) :
DiagSim:系统诊断健康模拟的模拟器。 4:1-4:27 苏珊·孔杜利 , 迈克尔·C·黄 :
更有效、节能的涡轮增压案例。 5:1-5:22 陈宽中 , 陈忠浩 :
在同构多核系统上启用SIMT执行模型。 6:1-6:26 张明哲 , 金丁兰 , 鑫耀 , 王卓立 :
SIMPO:使用NVRAM进行可靠大数据计算的可扩展内存持久对象框架。 7:1-7:28 邓伯斌(Bobin Deng) , Sriseshan Srikanth公司 , 埃里克·海因 , 托马斯·孔戴 , 埃里克·德本尼迪克蒂斯 , 珍妮·库克 , 迈克尔·P·弗兰克 :
通过计算容错计算扩展摩尔定律。 8:1-8:27 戴夫·戴斯 , 赫利希 , 亚历克斯·科根 :
改进硬件事务内存中的并行性。 9:1-9:24 Namyung Kim公司 , 安俊华 , Kiyoung Choi先生 , 丹尼尔·桑切斯 , Donghoon Yoo公司 , Soojung Ryu先生 :
苯:多核系统的节能分布式混合缓存体系结构。 10:1-10:23 玉龙坳 , 朝阳 , 刘芳芳 , 万旺饮 , 丽娟江 , 乔孙 :
神威太湖光超级计算机上HPCG基准的性能优化。 11:1-11:20 赛义德·拉希迪 , 马吉德·贾利利 , 哈米德·萨巴齐·阿扎德 :
通过放宽中间阻力水平的写入和读取来提高MLC PCM性能。 12:1-12:31 赵文来 , 郝欢付 , 贾瑞芳 , 郑伟杰 , 林甘 , 杨广文 :
在神威太湖光超级计算机上优化卷积神经网络。 13:1-13:26 迪米特里奥斯·姆巴科伊安尼斯 , Tomoutzoglou先生 , 乔治·科纳罗斯 :
通过PCIe将数据卸载到基于FPGA的加速器的能量性能注意事项。 14:1-14:24 甄琳 , 迈克尔·曼托 , 周惠阳 :
GPU性能与线程级并行:可扩展性分析和改进TLP的新方法。 15:1-15:21 奥列克桑德·齐恩科 , 圣埃芬·霍特 , 塞德里克·巴斯托尔 :
多面体模型中的可视化程序操作。 16:1-16:25
第15卷第2期,2018年6月
穆斯塔法·M·希哈布 , 张杰(音译) , Myoungsoo Jung先生 , 马赫穆特·坎德米尔 :
RevenNAND:一款快速感知差异的弹性3D NAND闪存设计。 17:1-17:26 赛义德·马吉德·扎赫迪 , 宋春凡 , 本杰明·C·李 :
使用令牌管理异构数据中心。 18:1-18:23 Miquel Pericás公司 :
弹性位置:用于可扩展和可移植性能的自适应资源管理器。 19:1-19:26 马修·本杰明·奥尔森 , 约瑟夫·T·蒂格 , 迪瓦尼·拉奥 , 迈克尔·詹茨 , Kshitij A.Doshi公司 , 普拉萨德·库尔卡尼 :
跨层内存管理可提高DRAM能效。 20:1-20:27 戴维德·佐尼 , 卢卡·科伦坡 , 威廉·福纳西亚里 :
DarkCache:Adaptivey Power-Gating LLC Banks对平铺多核的能量性能优化。 21:1-21:26 杨章 , 丹凤 , 魏彤(Wei Tong) , 余华 , 刘静宁 , 谭志鹏 , 王成宁 , Bing Wu公司 , 郑丽 , 徐高翔 :
CACF:一种新的电路结构协同优化框架,用于提高基于ReRAM的主存储器系统的性能、可靠性和能量。 22:1-22:26 尼古拉·斯塔维诺加 , 托尼·菲尔德 :
可预测的螺纹粗化。 23:1-23:26 普罗比尔·罗伊 , 宋帅文 , 斯里拉姆·克里希纳莫奥斯蒂 , 阿比纳夫·维希努 , 迪潘詹·森古普塔 , 徐柳 :
NUMA-Caffe:NUMA-Aware深度学习神经网络。 24:1-24:26 阿赫森·埃贾兹 , 瓦西里奥斯·帕帕夫斯塔丘 , Ioannis Sourdis公司 :
DDRNoC:双数据速率片上网络。 25:1-25:24 英才 , 玉龙坳 , 朝阳 , 马文静(Wenjing Ma) , 赵海涛 :
1000万岩芯三维爆轰波的极限尺度高阶WENO模拟。 26:1-26:21
第15卷第3期,2018年10月
亚尼斯·斯法基亚纳基斯 , 克里斯托斯·科扎尼蒂斯 , 克里斯托斯·科兹拉基斯 , 安吉洛斯·比拉斯 :
库曼 :基于配置文件的群集利用率改进。 27:1-27:25 发动机Kayraklioglu , 迈克尔·P·弗格森 , 塔雷克·埃尔·加扎维 :
LAPPS:PGAS的本地感知高效预取支持。 28:1-28:26 阿克雷姆·贝纳提亚 , 伟星记 , 王一卓 , 冯石 :
BestSF:在GPU上优化SpMV的稀疏元格式。 29:1-29:27 皮埃尔·米肖 :
一个类似TAGE的替代条件分支预测器。 30:1-30:23 詹姆斯·加兰德 , 大卫·格雷格 :
加权共享卷积神经网络的低复杂度乘法累加单元。 31:1-31:24 金孝忠 , 拉米亚德·哈迪迪 , 李凤奈 , 海森·金 , 努万·贾亚塞纳 , Yasuko Eckert , Onur Kayiran公司 , 加布里埃尔·H·卢 :
CODA:支持多个GPU系统的计算和数据联合。 32:1-32:23 Madhavan Manivannan公司 , Miquel Pericás公司 , 瓦西里斯·帕帕夫斯塔丘 , 佩尔·斯坦斯特罗姆 :
任务并行程序的全局死区管理。 33:1-33:25 罗曼·加里夫 , 托比亚斯·格罗瑟 , 克鲁斯 :
高性能广义张量运算:一种面向编译器的方法。 34:1-34:27 埃尔维·伊维奎尔 , 劳罗·克鲁兹 , 吉多·阿劳霍 :
使用OpenMP Accelerator Model进行群集编程。 35:1-35:23 穆罕默德·卡瓦里·塔瓦纳 , 阿米尔·卡维安·齐亚巴里 , 大卫·R·凯利 :
区块合作:通过增加纠错码的使用来提高电阻存储器的寿命。 36:1-36:26 海金 , 刘波(Bo Liu) , 江文斌 , 杨马 , 宣化石 , 何炳生 , 赵少峰 :
以层为中心的内存重用和数据迁移,用于多核架构上的极端规模深度学习。 37:1-37:26 达尼·沃伊采乔夫 , 阿尔斯兰·祖尔菲卡尔 , 马克斯蒂芬森 , 马克·格布哈特 , 斯蒂芬·凯克勒 :
提高GPU寄存器文件利用率的软件导向技术。 38:1-38:23 林焕新 , 王卓立 , 刘洪源 :
用于减少分支发散的GPU线程上数据重映射。 39:1-39:24
第15卷第4期,2019年1月
斯特凡·克罗纳维特 , 克里斯蒂安·伦高 :
ExaStencils代码生成器中的多面体搜索空间探索。 40:1-40:25 徐静恒 , 郝欢付 , 《文史》 , 林甘 , 李宇轩 , 韦恩·卢克 , 杨广文 :
POWER8处理器上基于模板的应用程序的性能调整和分析。 41:1-41:25 王佳军 , 瑞娜熊猫 , 莉兹·K·约翰 :
SelSMaP:一种选择性跨步掩蔽预取方案。 42:1-42:21 邢素 , 廖祥科 , 郝江 , 杨灿群 , 薛晶凌 :
SCP:用于高性能GEMM的共享缓存分区。 43:1-43:21 费尔南多·马格诺·昆托·佩雷拉 , Guilherme V.Leobas公司 , 阿卜杜拉耶·加马蒂 :
无声商店的静态预测。 44:1-44:26 尼尔·克莱顿·克雷戈 , 马克斯蒂芬森 , 斯蒂芬·凯克勒 :
公开内存访问模式以提高GPU中的指令和内存效率。 45:1-45:23 张峰(音) , 薛晶凌 :
扑克:基于排列的SIMD通过路径编码执行密集树搜索。 46:1-46:28 尼古拉斯·贝利维尔 , 达米安·库鲁塞 , 卡琳·海德曼 , 亨利·皮埃尔·查尔斯 :
针对侧面通道攻击的群众自动化软件保护。 47:1-47:27 赵瑜 , 白月斌 , 孙清晓 , 杨海龙 :
通过将寄存器文件扩展到Scratchpad内存来提高GPU中的线程级并行性。 48:1-48:24 路易斯·奥罗萨 , 鲁道夫·阿泽夫多 , Onur Mutlu公司 :
AVPP:带值预取的地址-第一个值-下一个预测器,用于提高负荷值预测的效率。 49:1-49:30 张军 , 侯瑞 , 魏松 , 萨利·麦基 , 甄佳 , 陈政 , 陈明宇 , 张立新 , 丹蒙 :
RAGuard:针对ROP攻击的高效且用户透明的硬件机制。 50:1-50:21 王平(Ping Wang) , 卢克·麦克海尔 , 保罗·V·格拉茨 , 亚历克斯·斯普林特森 :
GenMatcher:一个通用的基于聚类的任意匹配框架。 51:1-51:22 丁永红 , 吴简扬 , 刘玉平 , 盛玉福 , 许维中 :
动态二进制翻译中的处理器跟踪引导区域形成。 52:1-52:25 Yu Wang(王宇) , 维克托·李 , 顾延伟 , 大卫·M·布鲁克斯 :
通过分析公共数据集预测新的工作负载或CPU性能。 53:1-53:21 Hyukwoo公园 , SungKook Kim先生 , Jung-Geun公园 , Soo-Book月亮 :
为JavaScript提前编译重用优化代码。 54:1-54:20 韩照 , 权晨 , 邱玉仙 , 吴铭(音) , 姚深 , 镜文冷 , 李超(音) , 郭敏义 :
具有带宽对称内存的多核架构的带宽和位置感知任务密封。 55:1-55:26 斯特凡·甘瑟 , 阿明·格兰杰 , 诺伯特·西格蒙德 , 斯文·阿佩尔 , 克里斯蒂安·伦高 :
使用代理性能模型加速迭代多面体调度优化。 56:1-56:27 宋武 , 方舟 , 向高 , 海金 , 任静蕾 :
双页检查点:内存应用程序高效数据持久性的体系结构方法。 57:1-57:27 莫森·基亚尼 , 阿米尔·拉贾布扎德 :
使用重用距离分析在GPU中进行高效缓存性能建模。 58:1-58:24 托马斯·德布朗纳 , 萨贾德·萨伊迪 , 保罗·H·J·凯利 :
AUKE:模拟SIMD焦平面传感器处理器阵列的自动内核代码生成。 59:1-59:26 游周 , 费武(Fei Wu) , 中海路 , 何旭斌 , 黄萍(Ping Huang) , 谢长生 :
SCORE:一种在NAND闪存中高效缓存超长ECC的新方案。 60:1-60:25 弗朗西斯科·安杜贾尔 , 萨尔瓦多·科尔 , 玛丽娜·阿隆索 , 佩德罗·洛佩斯 , Juan-Miguel Martínez公司 :
POWAR:具有开/关链路的HPC网络中的Power-Aware路由。 61:1-61:22 拉希姆·马马德利 , 菲利克斯·沃尔夫 , 阿里·詹内萨里 :
塑造深层神经网络的艺术。 62:1-62:21 斯塔夫罗斯·齐利斯 , 佩德罗·特拉科索 , Ioannis Sourdis公司 :
使用在线投影对异构多核进行节能运行时管理。 63:1-63:26 马修·凯·费·李 , 崔英南 , Thannirmalai Somu公司 , 陶罗 , 周军(音) , 外藤汤 , 王翁辉 , Rick Siow Mong Goh先生 :
基于RRAM的神经形态计算芯片的系统级模拟器。 64:1-64:24 埃文格洛斯·瓦西拉基斯 , 瓦西里斯·帕帕夫斯塔丘 , 佩德罗·特拉科索 , Ioannis Sourdis公司 :
解耦融合缓存:将解耦LLC与DRAM缓存融合。 65:1-65:23 彼得·皮尔克鲍尔 , 阿玛莉·威尔逊 , 克里斯蒂娜·彼得森 , 达米安·德切夫 :
Blaze-Tasks:计算任务并行约简的框架。 66:1-66:25 佐藤由纪 , Tomoya Yuki先生 , 东藤俊雄 :
通过迭代多面体编译实现分片代码可伸缩执行的自动调整框架。 67:1-67:23 S.Kazem Shekofteh公司 , 哈米德·努里 , 马哈茂德·纳希布扎德 , 哈迪·萨多吉·亚兹迪 , 霍尔格·弗罗宁 :
GPU内核分类的度量选择。 68:1-68:27 安吉洛斯·比拉斯 :
2018年度杰出评审人名单ACM TACO。 69:1