SC 2017:美国科罗拉多州丹佛
伯恩德·莫尔 , 帕德玛·拉加万 :
《高性能计算、网络、存储和分析国际会议论文集》,2017年11月12-17日,美国科罗拉多州丹佛市,SC 2017。 ACM公司 2017 ,国际标准图书编号 978-1-4503-5114-0
ACM戈登·贝尔决赛
郝欢付 , 廖俊峰 , 南丁 , 段晓慧 , 林甘 , 梁一双 , 王新良 , 杨金哲 , 严政 , 刘卫国 , 王兰宁(Lanning Wang) , 杨广文 :
重新设计CAM-SE,用于在Sunway TaihuLight上实现千兆瓦级气候建模性能和超高分辨率。 1 郝欢付 , 何从惠 , 陈炳伟 , 泽坤·尹 , 张振国 , 张文强 , 张婷健 , 魏雪 , 刘卫国 , Wanwang Yin公司 , 杨广文 , 陈晓飞 :
18.9-Pflops Sunway TaihuLight上的非线性地震模拟:能够描绘18Hz和8米场景。 2 小王 , 阿米特·萨本 , Putt Sakdhnagool足球俱乐部 , 谢尔曼·J·基斯纳 , 查尔斯·布曼 , 塞缪尔·米奇夫 :
大规模并行3D图像重建。 三
技术论文
李思阳 , 陆友友 , 《纪武书》 , 杨虎 , 李涛 :
LocoFS:用于分布式文件系统的松散耦合元数据服务。 4 Hyogi Sim公司 , Youngjae Kim(金永嘉) , Sudharshan S.瓦日库代 , 杰弗里·瓦莱 , Seung-Hwan Lim先生 , 阿里·拉扎·布特 :
Tagit:用于文件系统的集成索引和搜索服务。 5 钱英金(Yingjin Qian) , 西丽 , 岩原水池 , 曾玲芳 , 尤尔根·凯撒 , 蒂姆·苏厄 , 安德烈·布林克曼 :
一个基于可配置规则的类令牌桶过滤网络请求调度程序,用于光泽文件系统。 6 托尔斯滕·库思 , 张健(Jian Zhang) , 纳达图尔·萨蒂什 , 埃文·拉卡 , Ioannis Mitliagkas公司 , Mostofa Ali Patwary医生 , 塔里克·M·马拉斯 , 纳拉亚南·桑达拉姆 , 瓦希德·比姆吉 , 米哈伊尔·斯莫卡洛夫 , 杰克·德斯利普 , 米哈伊尔·谢里耶夫 , 斯里尼瓦斯·斯里德哈兰 , 巴帕 , 普拉迪普·杜比 :
15PF深度学习:科学数据的监督和半监督分类。 7 李冠鹏 , Siva Kumar Sastry哈里 , 迈克尔·B·沙利文 , 蔡提摩西(Timothy Tsai) , 卡提克·帕塔比拉曼 , 乔尔·埃默 , 斯蒂芬·凯克勒 :
了解深度学习神经网络(DNN)加速器中的错误传播及其应用。 8 杨友 , 艾丁·布鲁索 , 詹姆斯·德梅尔 :
在GPU和骑士登陆集群上进行深度学习。 9 惠观 , 沈喜鹏 , 哈米德·克里姆 :
Egeria:通过多层自然语言处理自动合成HPC建议工具的框架。 10 廖春华 , 裴洪林 , 约书亚·阿斯普伦德 , 马库斯·斯科丹 , 伊恩·卡林 :
DataRaceBeach:一个用于系统评估数据竞赛检测工具的基准套件。 11 吴子贤 , 杰里·池原(Jerry Chi-Yuan Chou) , Shyng Hao先生 , Bin Dong(宾东) , 斯科特·克拉斯基 , 吴科申 :
通过数据分析和I/O建模优化块索引的查询性能。 12 卡齐姆·切什米 , Shoaib Kamil公司 , 米歇尔·米尔斯·斯特劳特 , 玛丽亚姆·梅赫里·德纳维 :
Sympiler:通过解耦符号分析转换稀疏矩阵代码。 13 埃利奥特屠宰场 , Wonchan Lee公司 , 肖恩·特里克勒 , 文章(Wen Zhang) , 迈克尔·鲍尔 , 盖伦·M·希普曼 , 帕特里克·S·麦考密克 , 亚历克斯·艾肯 :
控制复制:使用逻辑区域将隐式并行编译为高效的SPMD。 14 瓦西斯塔葡萄酒 , 库穆达·纳拉辛汉 , Siddharth Bhat公司 , 乌代·邦杜古拉 :
使用DSL方法优化几何多重网格方法计算。 15 艾米莉·池州 , 一帆功 , 何炳生 , 冀东寨 :
地理分布式云数据中心中的高效流程映射。 16 马塞洛·阿马拉尔 , 乔达·波罗 , 大卫·卡雷拉 , 塞塔拉米·塞拉姆 , 马尔戈扎塔·斯坦德 :
用于云环境中学习工作负载的拓扑感知GPU调度。 17 里奇·沃尔斯基 , 约翰·布雷维克 , 瑞恩·查德 , 凯尔·查德 :
Amazon现场实例执行持续时间的概率保证。 18 阿米尔·戈洛米 , 安德烈亚斯·芒 , 克劳迪斯·谢菲勒(Klaudius Scheufele) , 克里斯托斯·达瓦齐科斯 , 米里亚姆·梅尔 , 比洛斯 :
基于可缩放生物物理学的图像分析框架。 19 布莱恩·弗里森 , Mostofa Ali Patwary医生 , 布莱恩奥斯汀 , 纳达图尔·萨蒂什 , 扎卡里·斯利宾 , Narayanan Sundaram公司 , 黛博拉·巴德 , 丹尼尔·艾森斯坦 , 杰克·德斯利普 , 普拉迪普·杜比 , 巴帕 :
银河系:计算20亿星系的各向异性三点相关函数。 20 卡斯滕·厄普霍夫 , 塞巴斯蒂安·雷滕伯格 , 迈克尔·贝德 , 伊丽莎白·麦登 , 托马斯·乌尔里希 , 斯蒂芬妮·沃尔海尔 , 艾丽斯·阿格妮斯·加布里埃尔 :
2004年苏门答腊海啸大推力地震的极端规模多物理模拟。 21 迈克尔·勒比恩 , 哈立德·哈米杜什 , 布拉德·本顿 , 莫里西奥·布雷特尼茨 , 史蒂文·莱因哈特 , 莉齐·K·约翰 :
GPU触发内核内通信的联网。 22 马克·奥尔 , 帅车 , 布拉德福德·M·贝克曼 , 马克·奥斯金 , 史蒂文·莱因哈特 , 大卫·A·伍德 :
Gravel:由GPU发起的细粒度网络消息。 23 金光顺 , 尼拉德里什·查特吉 , 奥康纳 , 谢凯文(Kevin Xieh) :
实现标准化的近数据处理,为GPU提供不受限制的数据放置。 24 许继 , 王超(Chao Wang) , Nosayba El-Sayed公司 , 马晓松 , Youngjae Kim(金永嘉) , Sudharshan S.瓦日库代 , 魏雪 , 丹尼尔·桑切斯 :
了解整个范围内的对象级内存访问模式。 25 李安(Ang Li) , 刘伟峰 , 马德斯·鲁本·伯格多夫-克里斯滕森 , 布赖恩·温特 , 王浩(Hao Wang) , 凯西侯 , 安德烈斯·马尔克斯 , 宋帅文 :
探索和分析现代封装内存对HPC科学内核的真正影响。 26 鲍阮 , 花坛 , 张雪晨 :
通过非易失性字节寻址内存进行大规模自适应网格模拟。 27 丹尼尔·奥利维拉 , Laércio Lima Pilla女士 , 内森·德巴德尔本 , 肖恩·布兰查德 , 希瑟·奎因 , 以色列可兰经 , 菲利普·O·A·纳沃 , 保罗·里奇 :
Xeon Phi可靠性的实验和分析研究。 28 乔治·乔治库迪斯 , 伊格纳西奥·拉古纳 , 迪米特里奥斯·尼科洛普洛斯 , 马丁·舒尔茨 :
REFINE:通过基于编译器的工具进行真实的故障注入,以提高准确性、可移植性和速度。 29 Xin Liang(新亮) , 陈洁阳 , 丁文涛 , 李四环 , 吴潘若 , 李洪波 , 欧阳开明 , 刘元来 , 宋凤光 , 陈子忠 :
快速傅里叶变换中软误差的在线校正。 30 阿尼鲁达·马拉特 , 拉西尔·阿尼鲁德 , 尼基尔·贾恩 , Abhinav Bhatele公司 , 贾亚拉曼·J·蒂亚加拉扬 , 巴维亚·凯尔库拉 , Jae-Seung Yeom先生 , 巴里·朗特里 , 托德·甘布林 :
基于深度转移学习的资源约束下的绩效建模。 31 丹尼洛·卡拉斯坦·桑托斯 , 拉斐尔·德·卡马尔戈 :
通过仿真和机器学习获得动态调度策略。 32 托马斯·哈纳 , 达米安·斯泰格 :
45-qubit量子电路的0.5 PB模拟。 33 内森·塔伦特 , 达伦·科尔比森 , 阿道夫·霍西 :
代表性路径分析。 34 阿尔弗雷多·吉梅内斯 , 托德·甘布林 , Abhinav Bhatele公司 , 查德·伍德 , 凯瑟琳·肖加 , 阿尼鲁达·马拉特 , 同行蒂莫·布雷默 , 伯恩德·哈曼 , 马丁·舒尔茨 :
ScrubJay:从HPC性能数据的混乱中获取知识。 35 里德-普里德霍斯基 , 蒂姆·兰德斯 :
Charliecloud:HPC中用户定义的软件堆栈的非特权容器。 36 W.Cyrus Proctor公司 , 帕特里克·斯托姆 , 马修·汉隆 , 纳撒尼尔·门多萨 :
保护HPC:开发低成本、开源的多因素身份验证基础设施。 37 阿姆丽塔·马图里亚 , 叶洛 , 雷蒙德·克莱III , 阿诺尔·贝纳利 , 卢克·舒伦伯格 , 金正宁(Jeongnim Kim) :
迎接高效高效量子蒙特卡罗模拟的新时代。 38 弗拉基米尔·米罗诺夫 , 尤里·阿列克谢夫 , 克里斯托弗·凯佩特 , 迈克尔·德梅洛 , 亚历山大·莫斯科夫斯基 , 马克·S·戈登 :
第二代Intel Hartree-Fock方法的高效MPI/openMP并行化 ® 至强融核 ™ 处理器。 39 Shigeru Iwase先生 , 福村康夫(Yasunori Futamura) , 伊马库拉 , 樱井忠雄(Tetsuya Sakurai) , 小野富也 :
使用樱井-杉浦方法高效且可扩展地计算复杂带结构。 40 穆罕默德·苏鲁里 , 埃斯彭·伯格·拉克内斯 , 尼科·莱斯曼 , 约翰内斯·朗古特 , 丹尼尔·哈肯伯格 , 罗伯特·舍恩 , Per Gunnar Kjeldsberg公司 :
在现代多核架构上实现HPC应用程序的细粒度动态调整。 41 阎丽 , Kenneth Chang(肯尼思·张) , Oceane Bel公司 , 伊桑·L·米勒 , 达雷尔·D·E·朗 :
CAPES:使用基于神经网络的深度强化学习进行无监督存储性能调整。 42 菲利普·蒂莱特 , 大卫·D·考克斯 :
计算机绑定HPC内核的输入软件自动调整。 43 索拉巴·古普塔 , 蒂塔克·帕特尔 , 克里斯蒂安·恩格尔曼 , 德维什·蒂瓦里 :
大规模系统中的故障:长期测量、分析和影响。 44 Sudharshan S.瓦日库代 , 罗斯·G·米勒 , 德维什·蒂瓦里 , 克里斯托弗·齐默 , 王菲一 , Sarp口腔 , 拉古尔·古纳塞卡兰 , 德里尔·施泰纳 :
指南:一种可扩展的信息目录服务,用于收集、联合和分析日志,以了解领导层HPC设施的运营情况。 45 Seung-Hwan Lim先生 , Hyogi Sim公司 , 拉古尔·古纳塞卡兰 , Sudharshan S.瓦日库代 :
PB级文件系统中的科学用户行为和数据共享趋势。 46 埃德加·索洛莫尼克 , 马西耶·贝斯塔 , 弗拉维奥·维拉 , 托尔斯滕·霍夫勒 :
使用通信效率高的稀疏矩阵乘法缩放中心性。 47 Jordi Wolfson-Pou公司 , 周爱德蒙德(Edmond Chow) :
分布式southwell:一种低通信成本的迭代方法。 48 梁元 , 张云泉 , 彭国 , 单黄 :
镶嵌模具。 49 尼基尔·贾恩 , Abhinav Bhatele公司 , 路易斯·豪厄尔 , 大卫·博姆 , 伊恩·卡林 , 埃德加·莱昂 , 米斯巴·穆巴拉克 , 诺亚·沃尔夫 , 托德·甘布林 , 马修·莱宁格 :
预测不同脂肪树配置对性能的影响。 50 佩曼·费齐安 , Atiqul Mollah医学博士 , 周彤 , 鑫源 , 迈可·蓝恩 :
蜻蜓网络上SDN和自适应路由的比较研究。 51 Sudheer Chunduri公司 , 凯文·哈姆斯 , 帕克 , 维塔利A.莫罗佐夫 , 塞缪尔·奥申 , 纳文·切鲁库里 , Kalyan Kumaran公司 :
在基于Xeon Phi的cray XC系统上运行到运行的可变性。 52 陈汉·D·余 , 詹姆斯·莱维特 , Severin Reiz公司 , 比洛斯 :
用于压缩密集SPD矩阵的几何不经意FMM。 53 克里斯·塞卡 :
GPU上的低通信FMM加速FFT。 54 金京珠(Kyungjoo Kim) , 蒂莫西·B·科斯塔 , 穆罕默德·德韦西 , 安德鲁·M·布拉德利 , 西蒙·哈蒙德 , 穆拉特·伊夫·古尼 , 莎拉·克内珀 , 谢恩的故事 , 西瓦桑卡兰·拉贾马尼卡姆 :
设计向量友好的紧凑BLAS和LAPACK内核。 55 青松伟 , 王春东 , 程晨 , 杨叶超 , 杨军(Jun Yang) , Mingdi薛 :
具有高性能和崩溃一致性的事务性NVM缓存。 56 金俊元 , 李赛永(Seyong Lee) , 杰弗里·维特 :
PapyrusKV:用于分布式NVM架构的高性能并行密钥值存储。 57 吴凯(Kai Wu) , 黄英超 , 董丽(Dong Li) :
Unimem:基于非易失性内存的异构主内存上的运行时数据管理。 58 托尔斯滕·霍夫勒 , 萨尔瓦多·迪·吉罗拉莫 , 康斯坦丁·塔拉诺夫 , 瑞恩·格兰特 , 罗恩·布赖特威尔 :
sPIN:网络中的高性能流处理。 59 阿比纳夫·阿格拉瓦尔 , 加布里埃尔·H·卢 , 詹姆斯·塔克 :
利用近距离数据处理实现高性能检查点/重启。 60 嗜热Terraz , 亚历杭德罗·里贝斯 , 伊万·福尼尔 , Bertrand Iooss公司 , 布鲁诺·拉芬 :
梅丽莎:大规模在途敏感性分析,避免中间文件。 61 肯·拉斐内蒂 , 阿卜杜勒哈利姆·阿米尔 , 莉娜·奥登 , 查尔斯·阿彻 , 韦斯利·布兰德 , Hajime Fujita先生 , 郭燕飞 , 托米斯拉夫·扬朱西奇 , 德米特里·杜尔诺夫 , 迈克尔·布洛克索姆 , 最小Si , Sangmin Seo先生 , 阿基尔·兰格 , 耿彬正 , 高木正明 , 保罗·K·科夫曼 , 吉辛·何塞 , 苏尔Sayantan , 亚历山大·桑尼科夫 , 谢尔盖·奥布洛莫夫 , 迈克尔·丘韦列夫 , Masayuki Hatanaka公司 , 赵欣(音译) , 保罗·费舍尔 , 蒂利娜·拉特纳亚克 , 马修·奥顿 , Misun最小值 , 巴凡·巴拉吉 :
为什么MPI这么慢 分析实现MPI-3.1的基本限制。 62 李洪波 , 陈子忠 , 拉吉夫·古普塔 :
Parastack:大规模MPI程序的高效挂起检测。 63 穆罕默德·巴亚特普尔 , Sourav Chakraborty公司 , 哈里·苏布拉莫尼 , 小一路 , Dhabaleswar K.熊猫 :
具有基于数据分区的多领导者设计的可扩展缩减集合。 64