第32届ICS 2018:中国北京
-
第32届超级计算国际会议记录,ICS 2018,中国北京,2018年6月12日至15日。 ACM公司 2018 ,国际标准图书编号 978-1-4503-5783-8
文件系统、I/O和存储系统
曹金瑞 , 奥姆·拉梅什瓦·加特拉 , 麦郑 , 董岱 , 维迪亚·埃斯瓦拉帕 , 闫牧 , 陈勇 :
PFault:分析高性能并行文件系统可靠性的通用框架。 1-11 洁余 , 刘光明 , 刘欣(Xin Liu) , 文瑞东 , 李晓勇 , 刘玉生 :
考虑空间突发I/O的数据密集型应用节点分配策略再思考。 12-21 张文辉 , 羌曹 , 洪江 , 杰瑶 :
PA-SSD:一种支持页面类型的TLC SSD,用于提高写入/读取性能和存储效率。 22-32 安东尼·库卡斯 , 哈里哈兰·德瓦拉扬 , 孙贤和 :
IRIS:通过集成存储进行I/O重定向。 33-42
通用程序单元一: 执行模型
周虎生 , 索鲁什·巴泰尼 , 刘聪(音) :
GRU:通过部分GPU计算结果重用探索计算和数据冗余。 43-52 李昂 , 刘伟峰 , 王林南(Linnan Wang) , 凯文·巴克尔 , 宋帅文 :
Warp-Consolidation:一种新的GPU执行模型。 53-64 夏照 , 王志英 , Lieven Eeckhout公司 :
多任务GPU中有效SM划分的分类驱动搜索。 65-75
GPU II: GPU和算法
伯恩哈德·科尔布 , 迈克尔·肯泽尔 , 乔格·穆勒 , 迪特尔·施马尔斯蒂格 , 马库斯·斯坦伯格 :
代理队列:用于GPU上精细工作分发的快速、线性化FIFO队列。 76-85 本·卡辛 , 沃尔克·威彻特 , 亨利·卡萨诺娃 , 约翰·伊阿科诺 , 诺达里·西奇纳娃 :
GPU上基于比较的排序算法的分析驱动工程。 86-95 金成金(Jinsung Kim) , 阿拉文德·苏库马拉恩·拉贾姆 , 长湾红 , 阿贾伊·潘亚拉 , 罗希特·库马尔·斯利瓦斯塔瓦 , 斯里拉姆·克里希纳莫奥斯蒂 , P.萨达亚潘 :
优化CCSD(T)中的张量收缩以在GPU上高效执行。 96-106
建筑
金兆祥 , 索纳尔?安德 :
两阶段恢复机制。 107-117 Reena熊猫 , 莉齐·K·约翰 :
HALO:一种用于内存系统探索的分层内存访问本地建模技术。 118-128 何塞·安东尼奥·帕斯科尔 , 哈维尔·纳瓦里达斯 :
任意拓扑/路由的高性能、低复杂性死锁避免。 129-138
加速器
李东宇 , 宋伯康 , Kiyoung Choi先生 :
ComPEND:通过深度神经网络加速器中ReLU的早期阴性检测进行计算修剪。 139-148 郝燕 , 赫宾·R·切里安 , 伊桑·C·安 , 李德段 :
CELIA:基于STT-MRAM的深度学习加速的设备和架构协同设计框架。 149-159 雅各布·兰伯特 , 李赛永(Seyong Lee) , 金正元(Jungwon Kim) , 杰弗里·维特尔 , 艾伦·D·马洛尼 :
基于指令的、高级编程和FPGA高性能计算优化。 160-171
应用程序和编程框架
薛莉 , 张明兴(Mingxing Zhang) , 康晨 , 吴永伟 :
ReGraph:一个图形处理框架,它交替收缩和重新划分图形。 172-183 李秀红 , 云亮(Yun Liang) , 张文泰 , 刘泰德 , 李浩晨 , 罗国杰 , 蒋明 :
cuMBIR:一种在GPU上重建低剂量X射线CT图像的有效框架。 184-194 张峰(音) , 冀东寨 , 沈喜鹏 , Onur Mutlu公司 , 陈文光 :
Zwift:压缩数据高性能文本分析的编程框架。 195-206
运行时系统和库
艾萨克·桑切斯·巴雷拉 , Miquel Moretó , 爱德华·伊瓜德 , 杰苏斯·拉巴特 , 马特奥·瓦莱罗 , 马克·卡萨斯 :
通过利用计算相关性减少大型共享内存系统上的数据移动。 207-217 卢克·阿尔瓦雷斯 , 马克·卡萨斯 , 杰苏斯·拉巴特 , 爱德华·伊瓜德 , 马特奥·瓦莱罗 , Miquel Moretó :
任务并行程序中堆叠DRAM内存的运行时引导管理。 218-228 弗朗索瓦·特西尔 , 保罗·格雷西尔 , 文卡特拉姆·维什瓦纳 :
通过在大型系统上利用深层内存层次结构优化数据聚合。 229-239
项目分析
赖伟(音) , 约翰·梅勒·克鲁米 :
自动分析时间序列数据以了解并行程序行为。 240-251 张慧(音) , 杰弗里·霍林斯沃思 :
ChplBlamer:一个面向多尺度教堂项目的以数据为中心和以代码为中心的组合分析器。 252-262 沙沙文 , 露西·切尔卡索娃 , 林小珠(Felix Xiaozhu Lin) , 徐柳 :
ProfDP:一个轻量级分析器,用于指导异构内存系统中的数据放置。 263-273
系统设计
纳迪娅·彼得斯 , 桑扬公园 , 丹尼尔·克利福德 , S.Kyostila公司 , 罗斯·麦克罗伊 , Benedikt Meurer公司 , 汉内斯·佩耶 , 萨马尔吉特·查克拉博蒂 :
HMP平台上的Phase-Aware Web浏览器电源管理。 274-283 柯周 , Si Sun公司 , 王华(Hua Wang) , 黄萍(Ping Huang) , 何旭斌 , 瑞兰 , 李汶妍 , 刘文杰 , 杨天明 :
大规模解密照片存储的缓存策略:腾讯案例研究。 284-294 贾志浩 , 肖恩·特里克勒 , 盖伦·M·希普曼 , 帕特里克·S·麦考密克 , 亚历克斯·艾肯 :
等轴测:基于路径的分布式数据传输系统。 295-306
并行算法
杨友 , 詹姆斯·德梅尔 , 谢秋菊 , 理查德·瓦杜克 :
并行和分布式系统上精确、快速和可扩展的核岭回归。 307-317 翟科克 , 塔妮娅·班纳吉 , 大卫·兹威克 , 杰森·哈克尔 , 桑杰·兰卡 :
可压缩多相湍流的动态负载平衡。 318-327
编译器和操作系统
赵嘉诚 , 崔惠民 , 张亚林 , 薛晶凌 , 冯小兵 :
重温数据中心的循环平铺:Live和Let Live。 328-340 李世凯 , 成云公园 , 斯科特·马勒克 :
雕刻师:具有选择性动态环路穿孔的灵活近似。 341-351 Jee Ho Ryoo先生 , 莉齐·K·约翰 , 阿尔卡普拉瓦·巴苏 :
粒度感知页面迁移案例。 352-362
优化和性能调整
刘长西 , 谢碧薇 , 刘欣(Xin Liu) , 魏雪 , 杨海龙 , 徐柳 :
在Sunway Manycore Architectures上实现高效SpMV。 363-373 文卡特桑·查卡拉瓦尔西 , Jee W.Choi先生 , 道格拉斯·约瑟夫 , 普拉卡什·穆拉利 , Shivmaran S.Pandian公司 , Yogish Sabharwal瑜伽 , Dheeraj Sreedhar公司 :
稀疏张量的分布式Tucker分解优化。 374-384 贾亚拉曼·J·蒂亚加拉扬 , 尼基尔·贾恩 , 拉西尔·阿尼鲁德 , 阿尔弗雷多·吉梅内斯 , 拉胡尔·斯里达尔 , 阿尼鲁达·马拉特 , 王涛(音译) , 穆拉利·埃马尼 , Abhinav Bhatele公司 , 托德·甘布林 :
快速调整的引导参数空间探索。 385-395