2015年第29届ICS:美国加利福尼亚州纽波特海滩/欧文
Laxmi N.Bhuyan , Fred Chong(弗雷德·张) , 维维克·萨卡尔 :
2015年6月8日至11日,第29届ACM超级计算国际会议记录,ICS’15,美国加利福尼亚州纽波特比奇/欧文。 ACM公司 2015 ,国际标准图书编号 978-1-4503-3559-1
主题演讲一
阿尔伯特·柯恩 :
流式处理任务并行性。 1
GPU并行性
哈维尔·卡贝萨斯 , 路易斯·维拉诺娃 , 艾萨克·盖拉多 , 托马斯·贾布林 , 纳乔·纳瓦罗 , 吴文美 :
共享内存多GPU节点中内核的自动并行化。 3-13 玉龙于 , 肖卫军(Weijun Xiao) , 何旭斌 , 何过 , 王玉欣(Yuxin Wang) , Xin Chen(新晨) :
用于动态优化GPGPU中线程级并行性的失速感知扭曲调度。 15-24 Mehmet E.贝尔维兰利 , 彭登 , Laxmi N.Bhuyan , 拉吉夫·古普塔 , 齐朱 :
PeerWave:利用具有Peer-SM同步的GPU上的波前并行性。 25-35
通信和计算模型
Ozan调谐器 , 葡萄J.Leung , Ayse K.Coskun公司 :
PaCMap:非结构化通信模式到非连续分配的拓扑映射。 37-46 Raghesh Aloor公司 , V.克里斯纳·南迪瓦达 :
OpenMP的独特Worker模型。 47-56 本杰明·帕森斯 , Vijay S.Pai公司 :
利用过程不平衡改善分层系统中的MPI集合操作。 57-66
GPU缓存管理和数据结构
李超(音) , 宋帅文 , 戴洪文 , 阿尔伯特·塞德尔尼克 , Siva Kumar Sastry哈里 , 周惠阳 :
本地驱动的动态GPU缓存旁路。 67-77 纳比尔·阿尔萨伯 , 米林·库尔卡尼 :
SemCache++:语义感知缓存,用于高效的多GPU卸载。 79-88 Bin Wang(王斌) , 魏宽于 , 孙贤和 , 王新宁 :
DaCache:内存差异-软件GPU缓存管理。 89-98
GPU数据结构和调度
纳赛尔·塞达加蒂 , 特姆 , 路易斯·诺埃尔·普切特 , 斯里尼瓦桑Parthasarathy , P.萨达亚潘 :
GPU上稀疏矩阵表示的自动选择。 99-108 李安(Ang Li) , 格特·扬·范登·布拉克 , Henk下士 , 阿卡什·库马尔 :
GPU上的细粒度同步和数据流编程。 109-118 吴波 , 陈国洋(音) , 董丽(Dong Li) , 沈喜鹏 , 杰弗里·维特 :
通过SM-Centric程序转换在GPU上启用和开发灵活的任务分配。 119-130
主题演讲二
里卡多·比安奇尼 :
数据中心效率:下一步是什么? 131
大数据
周瑞金 , 陈慧翔 , 陶莉 :
大数据云时代的轻量级快速存储资源管理。 133-142 何文亭 , 崔惠民 , 滨滨路 , 赵嘉诚 , 李胜美 , 龚阮 , 薛晶凌 , 冯小兵 , 杨文森(Wensen Yang) , 阎友良 :
Hadoop+:为异构集群中的MapReduce应用程序建模和评估异构性。 143-153 马西耶·贝斯塔 , 托尔斯滕·霍夫勒 :
主动访问:高性能分布式数据中心计算的机制。 155-164 谢尔盖·舒德勒 , 亚历山德鲁·卡洛托乌 , 托尔斯滕·霍夫勒 , 亚历山大·斯特鲁贝 , 费利克斯·沃尔夫 :
扩展你的库:你的实现能满足你的期望吗? 165-175
模具计算
托比亚斯·吉西 , 托比亚斯·格罗瑟 , 托尔斯滕·霍夫勒 :
MODESTO:异构架构上复杂模具程序的以数据为中心的分析优化。 177-186 罗玉龙 , 谭光明 , 泽尧莫 , 孙宁辉 :
FAST:基于最优解空间模型的快速模具自动调整框架。 187-196 伊恩·贝尔托拉奇 , 凯瑟琳·奥尔沙诺夫斯基 , 本·哈什巴格 , 布拉德福德·L·张伯伦 , 大卫·G·温纳科特 , 米歇尔·米尔斯·斯特劳特 :
使用Chapel并行迭代器进行模板计算的参数化菱形贴片。 197-206 霍尔格·斯坦格尔 , 简·特里宾 , 乔治·海格 , 格哈德·韦利恩 :
使用Execution-Cache-Memory模型量化模具计算的性能瓶颈。 207-216
绿色计算
马里兰州Enamul Haque , 伊尼戈·戈伊里 , 里卡多·比安奇尼 , Thu D.Nguyen(星期四) :
GreenPar:在绿色数据中心调度并行高性能应用程序。 217-227 徐舟 , 羌曹 , 洪江 , 谢长生 :
绿色数据中心电网电力基础设施配置不足。 229-240 易庆华 , 李超(音) , 魏超堂 , 李江 , 梁晓尧 :
以低成本建造燃料驱动的超级计算数据中心。 241-250
新兴技术
柯晨 , 胜利(Sheng Li) , 郑浩安 , 纳文·穆拉利马诺哈 , 赵纪深(Jishen Zhao) , 丛旭 , Seongil O公司 , 袁燮 , 杰伊·布罗克曼 , 诺曼·乔比 :
用于高性能3D DRAM体系结构的历史辅助自适应粒度缓存(HAAG$)。 251-261 沈高 , 何炳生 , 徐建良 :
未来混合内存系统的实时内存检查点。 263-272 阿米尔·卡维安·齐亚巴里 , 何塞·L·阿贝兰 , 拉斐尔·乌巴尔 , 赵晨 , 阿贾·伊乔希 , 大卫·R·凯利 :
利用硅光子NoC设计可扩展GPU。 273-282
主题演讲三
马戈·I·萨尔茨 :
自动可扩展计算。 283
微体系结构
金兆祥 , 格尔基姆·阿西利奥格鲁 , 索纳尔?安德 :
割草机:一种新的无阻塞误报恢复设计。 285-294 沙泽恩·阿加 , 阿巴耶德拉·辛格 , 萨蒂什·纳拉亚纳萨米 :
zFENCE:高效围栏的无数据一致性。 295-305
异构系统
克里斯托斯·马吉奥拉斯 , 迈克尔·F·P·奥博伊尔 :
PALMOS:用于并行异构系统的透明、多任务加速层。 307-318 哈里·桑达尔 , 奥马尔·加塔斯 :
异构簇上自适应网格的嵌套划分算法。 319-328 卡莉亚·科洛纳基 , 亚历杭德罗·里科 , 罗莎·M·巴迪亚 , 爱德华·伊瓜德 , 杰苏斯·拉巴特 , 马特奥·瓦莱罗 :
异构体系结构的关键性感知动态任务调度。 329-338
数据结构
刘伟峰 , 布赖恩·温特 :
CSR5:一种高效的跨平台稀疏矩阵向量乘法存储格式。 339-350 托比亚斯·格罗瑟 , 贾加纳森·拉马努贾姆 , 路易斯·诺埃尔·普切特 , P.萨达亚潘 , 塞巴斯蒂安·波普 :
参数化阵列的优化轮廓化。 351-360 斯内哈西什·库马尔 , 纳文·维杜拉 , Arrvindh Shriraman公司 , 维贾亚拉克什米·斯里尼瓦桑 :
DASX:软件数据结构硬件加速器。 361-372
并行化和算法
邹云 , 桑杰·拉乔帕德耶 :
统一相关计算的自动节能并行化。 373-382 凯西侯 , 王浩(Hao Wang) , 吴俊峰 :
ASPaS:基于x86的多核处理器上并行排序的自动简化框架。 383-392 迭戈·卡巴列罗 , 萨拉·罗伊拉 , 罗杰·费雷尔 , 亚历杭德罗·杜兰 , 泽维尔·马托雷尔 :
优化用户定向矢量化中的重叠内存访问。 393-404
应用程序和建模
李赛永(Seyong Lee) , 杰里米·梅雷迪斯 , 杰弗里·维特 :
COMPASS:一个用于自动性能建模和预测的框架。 405-414 Mani Zandifar公司 , 穆斯塔法·阿卜杜勒·贾巴尔 , 阿里雷扎·马吉迪 , 大卫·E·凯斯 , 南希·M·阿马托 , 劳伦斯·劳什沃格 :
构建算法框架以表达高性能科学应用程序。 415-424 约阿尼斯·帕帕佐普洛斯 , 内森·L·托马斯 , 亚当·菲德尔 , 南希·M·阿马托 , 劳伦斯·劳什沃格 :
STAPL-RTS:应用程序驱动的运行时系统。 425-434
![](https://dblp.org/img/cog.dark.24x24.png)