2018年南卡罗来纳州:美国德克萨斯州达拉斯
-
高性能计算、网络、存储和分析国际会议记录,2018年11月11日至16日,美国德克萨斯州达拉斯,SC 2018。 IEEE/ACM标准 2018
数据和存储
余英浩 , 黄仁飞 , 王伟(音译) , Jun Zhang(张军) , 哈立德·本·莱塔伊夫 :
SP-cache:具有选择性分区的负载平衡、无冗余集群缓存。 1:1-1:13 阿里·安瓦尔 , 岳成 , 海黄 , 金戈汉 , Hyogi Sim公司 , 东洋·李 , 弗雷德·道格利斯 , 阿里·拉扎·布特 :
bespoKV:应用定制的横向扩展键值商店。 2:1-2:16 Qing Zheng(郑青) , 查尔斯·德克兰纳 , 郭丹浩 , 格雷戈里·甘格 , 乔治·阿姆夫罗西亚迪斯 , 加思·吉布森 , Bradley W.Settlemyer公司 , 加里·格里德 , 范果 :
使用deltaFS缩放嵌入式原位索引。 3:1-3:15
下一代网络
马蒂亚斯·布鲁姆里奇 , 南江 , 拉里·丹尼森 :
利用高基数交换机中的空闲资源进行补充存储。 4:1-4:13 乔香 , J.Jensen Zhang(张延森) , 王新东尼(Xin Tony Wang) , Y.Jace Liu(刘杰斯) , Chin Guok(中国) , 弗兰克·勒 , 约翰·麦考利 , 哈维·纽曼 , 杨Richard杨 :
细粒度、多域网络资源抽象是实现高性能、协作数据科学的基本元素。 5:1-5:13 汉斯·埃伯勒 , 拉里·丹尼森 :
用于线速订购的轻量级协议。 6:1-6:12
弹性
克里斯托弗·齐默 , 唐·麦克斯韦 , 斯蒂芬·泰勒·麦克纳利 , 斯科特·阿奇利 , 苏达尔珊·瓦日库代 :
GPU年龄感知调度,以提高Titan上领导工作的可靠性。 7:1-7:11 郭栾正 , 董丽(Dong Li) , 伊格纳西奥·拉古纳 , 马丁·舒尔茨 :
FlipTracker:了解HPC应用程序中的自然错误恢复能力。 8:1-8:14 Anwesha Das公司 , 弗兰克·米勒 , 保罗·哈格罗夫 , 埃里克·罗曼 , 斯科特·巴登 :
末日:预测超级计算机上哪个节点会失败。 9:1-9:14
生物学应用
埃文格洛斯·乔治亚纳斯 , 罗布·伊根 , 史蒂文·霍夫梅尔 , 尤金·戈尔茨曼 , 比尔·阿恩特 , 安德鲁·特里特 , 艾丁·布鲁索 , 列奥尼德·奥利克 , 凯瑟琳·耶利克 :
超大规模从头开始的宏基因组组装。 10:1-10:13 托尼·C·潘 , 桑奇特·米斯拉 , 斯里尼瓦斯·阿鲁鲁 :
优化DNA的高性能分布式内存并行哈希表 k个 -摩尔计数。 11:1-11:13 段晓慧 , Ping Gao公司 , 张婷健 , 孟张(Meng Zhang) , 刘卫国 , 张武生 , 魏雪 , 郝欢付 , 林甘 , 陈德勋 , 孟祥旭 , 杨广文 :
重新设计LAMMPS,用于在Sunway TaihuLight上进行PBA级和千亿级原子模拟。 12:1-12:12
大尺度算法
李连登 , 滕瑜(Teng Yu) , 赵文来 , 郝欢付 , 王晨雨 , 李坦 , 杨广文 , 约翰·汤姆森 :
大规模分层 k平均值 用于异构多核超级计算机。 13:1-13:11 杨虎 , 刘杭(Hang Liu) , H.Howie Huang先生 :
三核:GPU上的平行三角形计数。 14:1-14:12 陈汉·D·余 , Severin Reiz公司 , 比洛斯 :
密集SPD矩阵的分布式内存分层压缩。 15:1-15:15
性能和能量分析
Nader Boushehrinejadmoradi先生 , 阿达斯瑜伽 , Santosh Nagarakatte公司 :
一个用于OpenMP程序的what-if分析的并行分析器。 16:1-16:14 马克·恩德雷 , 朝津 , 明戈丁 , 大卫·阿布拉姆森 , 海蒂·波克森 , 路易斯·德罗斯 , 布朗尼斯·德苏宾斯基 :
并行应用的能效建模。 17:1-17:13 约翰·麦卡宾 :
Xeon Platinum 8160处理器上的HPL和DGEMM性能可变性。 18:1-18:13
稀疏数据的算法
李佳佳 , 孙继萌 , 理查德·瓦杜克 :
HiCOO:稀疏张量的分层存储。 19:1-19:15 雅利安埃夫特哈里 , 马蒂亚斯·博尔霍夫 , 奥拉夫·申克 :
高性能计算体系结构上的分布式内存稀疏逆协方差矩阵估计。 20:1-20:12 塔辛·雷扎 , 马泰·里佩努 , 尼古拉斯·特里波尔 , 杰弗里·桑德斯 , 罗杰·皮尔斯 :
修剪果汁:修剪万亿边图形以获得精确的模式匹配解决方案。 21:1-21:17
性能优化研究
斯汀·埃弗曼(Stijn Eyerman) , 维姆·海尔曼 , 克里斯托夫·杜波依斯 , 约书亚·B·弗莱曼 , 易卜拉欣·胡尔 :
多核心图工作负载分析。 22:1-22:11 岩崎信太郎 , 阿卜杜勒哈利姆·阿米尔 , Kenjiro Taura公司 , 巴凡·巴拉吉 :
从分析用户级线程的动态升级中吸取的教训。 23:1-23:12 普雷蒂·马拉卡尔 , 托德·蒙森 , 克里斯托弗·奈特 , 文卡特拉姆·维什瓦纳 , 迈克尔·帕普卡 :
大规模分子动力学模拟的拓扑感知空间共享联合分析。 24:1-24:15
资源管理和干扰
马克西姆·马蒂纳索 , 米盖尔·吉拉 , 毛罗·比安科 , 萨达夫·R·阿拉姆 , 科林·麦克默特里 , 托马斯·舒尔赫斯 :
RM重播:用于资源管理的高保真度调整、优化和探索工具。 25:1-25:13 塞缪尔·波拉德 , 尼基尔·贾恩 , 斯蒂芬·赫本 , Abhinav Bhatele公司 :
在脂肪树集群上评估无干扰节点分配策略。 26:1-26:13 斯塔西·A·史密斯 , 克拉拉·克罗米 , 大卫·K·洛文塔尔 , 延斯·多姆克 , 尼基尔·贾恩 , 贾亚拉曼·J·蒂亚加拉扬 , Abhinav Bhatele公司 :
使用自适应流软件路由减轻作业间干扰。 27:1-27:15
MPI优化和表征
Sourav Chakraborty公司 , 穆罕默德·巴亚特普尔 , 贾汉泽布·马库尔·哈什米(Jahanzeb Maqbool Hashmi) , 哈里·苏布拉莫尼 , Dhabaleswar K.熊猫 :
合作交会协议可提高性能和重叠。 28:1-28:13 苏拉布希·贾因 , 拉希德·卡利姆 , 马克·加梅尔·巴尔马纳 , 阿基尔·兰格 , 德米特里·杜尔诺夫 , 亚历山大·桑尼科夫 , 玛丽亚·加扎兰 :
使用共享内存的可扩展节点内集合操作框架。 29:1-29:12 Sudheer Chunduri公司 , 帕克 , 巴凡·巴拉吉 , 凯文·哈姆斯 , 卡利安·库马兰 :
生产超级计算机上MPI使用的特征。 30:1-30:15
非易失性存储器
吴凯(Kai Wu) , 杰仁 , 董丽(Dong Li) :
用于任务并行程序的基于非易失性存储器的异构存储器上的运行时数据管理。 31:1-31:13 Pak Markthub公司 , 穆罕默德·贝尔维兰利 , 李赛永(Seyong Lee) , 杰弗里·维特 , 松冈佐治 :
DRAGON:通过直接NVM访问打破GPU内存容量限制。 32:1-32:13 常春藤博鹏 , 杰弗里·维特 :
锡耶纳:探索异构内存系统的设计空间。 33:1-33:14
基于任务的编程
Wonchan Lee公司 , 埃利奥特屠宰场 , 迈克尔·鲍尔 , 肖恩·特里克勒 , 托德·沃沙夫斯基 , 迈克尔·加兰德 , 亚历克斯·艾肯 :
动态跟踪:为基于任务的动态运行时存储任务图。 34:1-34:13 保罗·卡赫尼 , 卢克·阿尔瓦雷斯 , 马特奥·瓦莱罗 , Miquel Moretó , 马克·卡萨斯 :
任务并行程序中的运行时辅助缓存一致性停用。 35:1-35:12 戈卡普·德米尔西 , 伊万娜·马林西奇 , 亨利·霍夫曼 :
功率约束下DAG调度的分治算法。 36:1-36:12
云和分布式计算
乔治奥斯·安德烈亚迪斯 , 劳伦斯·维斯路易斯 , 费比安·马斯滕布鲁克 , 亚历山德鲁·伊索普 :
数据中心调度的参考体系结构:设计、验证和实验。 37:1-37:15 刘峰(音) , 凯特·凯希 , 皮埃尔·里托 , 乔恩·韦斯曼 :
在按需集群和批处理集群之间动态协商容量。 38:1-38:11 纳撒尼尔·克雷默·赫尔曼 , 本杰明·托瓦尔 , 道格拉斯·塞恩 :
适用于适当大小的主-工应用程序的轻量级模型。 39:1-39:13
物理学和张量应用
陈炳伟 , 郝欢付 , 魏燕文 , 何聪慧 , 张文强 , 李宇轩 , 五宾湾 , 张伟(音译) , 林甘 , 张伟(音译) , 张振国 , 杨广文 , 陈晓飞 :
在阳光太湖之光上用精确的地表地形模拟汶川地震。 40:1-40:12 Hua Huang公司 , 周爱德蒙德(Edmond Chow) :
用矢量积分和分批积分加速量子化学。 41:1-41:14 Jee W.Choi先生 , Xing Liu(刘星) , 文卡特桑·查卡拉瓦尔西 :
GPU集群上的高性能密集塔克分解。 42:1-42:11
弹性II
斯科特·利维 , 库尔特·费雷拉 , 内森·德巴德尔本 , 塔尼娅·西迪夸 , 维拉斯·斯里德哈兰 , 伊丽莎白·巴斯曼 :
从Cielo一生中观察到的记忆错误中吸取的教训。 43:1-43:12 扎伊姆·侯赛因 , Taieb Znati公司 , 拉米·梅尔赫姆 :
具有非均匀节点可靠性的HPC系统中的部分冗余。 44:1-44:11 张春凯 , 桑库·莱姆 , 尼古拉斯·凯利 , 迈克尔·B·沙利文 , 马坦·埃雷斯 :
评估和加速HPC的高保真误差注入。 45:1-45:13
算法和优化
普拉尚特·辛格·拉瓦特 , 阿拉文德·苏库马拉恩·拉贾姆 , 阿塔纳斯·鲁恩特夫 , 法布里斯·拉斯特罗 , 路易斯·诺埃尔·普切特 , P.萨达亚潘 :
关联指令重新排序以减轻寄存器压力。 46:1-46:13 阿扎姆·海达尔 , 斯坦尼米尔·托莫夫 , 杰克·J·东加拉 , 尼古拉斯·J·海姆 :
利用GPU张量核实现快速FP16算法,以加快混合精度迭代精化求解器的速度。 47:1-47:11 哈希塔·梅农 , 迈克尔·O·林 , 丹尼尔·奥塞·库福尔 , 马库斯·斯科丹 , 斯科特·劳埃德 , 凯瑟琳·莫罗 , 杰弗里·赫廷格 :
ADAPT:用于浮点精度调整的算法微分。 48:1-48:13
戈登·贝尔奖决赛#1
Tsuyoshi Ichimura一村 , 藤田浩平 , 山口Takuma Yamaguchi , 阿基拉·纳鲁塞 , 杰克·C·威尔斯 , 托马斯·C·舒尔茨 , Tjerk P.Straatsma公司 , 克里斯托弗·齐默 , 马克西姆·马蒂纳索 , 中岛贤吾 , 穆尼奥·霍里 , 拉里斯·马德盖达拉 :
基于人工智能和超精密计算的低阶非结构有限元非线性时间演化地震城市问题的快速可扩展隐式求解器。 49:1-49:11 罗伯特·巴顿 , J.特拉维斯·约翰斯顿 , 史蒂芬·R·杨 , 凯瑟琳·舒曼 , 唐·D·马奇 , 托马斯·波托克 , 德里克·C·罗斯 , Seung-Hwan Lim先生 , 托马斯·卡尔诺夫斯基 , 马克西姆·齐亚丁诺夫 , 谢尔盖·V·加里宁 :
167-为电子显微镜提供深度学习:从学习物理到原子操作。 50:1-50:11 托尔斯滕·库思 , 肖恩·特里克勒 , 约书亚·罗梅罗 , 玛尤尔·穆迪戈达 , 内森·卢尔 , 埃弗雷特·菲利普斯 , 安库尔·马赫什 , 迈克尔·马西森 , 杰克·德斯利普 , 马西米利亚诺·法蒂卡 , 巴帕 , 迈克尔·休斯顿 :
Exascale气候分析深度学习。 51:1-51:12
大规模系统部署
苏达尔珊·瓦日库代 , 布朗尼斯·德苏宾斯基 , 亚瑟·S·布兰德 , 阿尔·盖斯特 , 詹姆斯·塞克斯顿 , 吉姆·凯勒 , 克里斯托弗·齐默 , 斯科特·阿奇利 , Sarp口腔 , 唐·E·麦克斯韦 , 维罗尼卡·G·维加拉·拉雷阿 , 亚当·伯奇 , 罗宾·戈德斯通 , 韦恩·朱伯特 , 克里斯·钱伯劳 , 大卫·阿佩尔汉斯 , 罗伯特·布莱克摩尔 , 本·卡塞斯 , 乔治·乔奇亚 , 吉恩·戴维森 , 马修·艾泽尔 , 汤姆·古丁 , 埃尔萨·冈西罗夫斯基(Elsa Gonsiorowski) , 利奥波德·格林伯格 , 比尔·汉森 , 比尔·哈特纳 , 伊恩·卡林 , 马修·莱宁格 , 达斯汀·勒弗曼 , 克里斯·马洛金 , 亚当·穆迪 , 马丁·奥马赫 , 拉梅什·潘卡雅克珊 , 费尔南多·比萨诺 , 詹姆斯·H·罗杰斯 , 布莱恩·罗森堡 , 德鲁·施密特 , Mallikarjun Shankar公司 , 王飞毅 , 派·沃森 , 鲍勃·沃尔库普 , 兰斯·D·威姆斯 , 尹俊奇 :
CORAL考试前系统的设计、部署和评估。 52:1-52:12 格雷戈里·鲍尔 , 布雷特·博德 , 杰里米·伊诺斯 , 威廉·T·克莱默 , 斯科特·拉思罗普 , 塞尔索·L·门德斯 , 罗伯特·西斯内罗斯 :
部署和运行可持续的标准系统的最佳实践和经验教训:蓝海经验。 53:1-53:12 小松和彦 , Shintaro Momose公司 , Yoko Isobe公司 , 渡边修(Osamu Watanabe) , 明弘穆萨 , 横川三雄 , 青山俊彦 , 佐藤正彦 , 小林弘一(Hiroaki Kobayashi) :
矢量超级计算机SX极光TSUBASA的性能评估。 54:1-54:12
戈登·贝尔奖决赛#2
埃文·伯克维茨 , 迈克尔·克拉克 , 阿尔琼·辛格·甘比尔 , 肯尼斯·麦克埃尔文 , 艾米·尼克尔森 , 恩里科·里纳尔迪 , 帕夫洛斯·弗拉纳斯 , 安德烈·沃克(AndréWalker-Loud) , 张嘉诚 , 巴林特·乔奥 , 托尔斯滕·库思 , 科斯塔斯·奥吉诺斯 :
模拟 虚弱的 中子在飞秒级宇宙中的死亡和近exascale计算。 55:1-55:9 亨林(Heng Lin) , 朱晓伟 , 余伯温(Bowen Yu) , 熊巢汤 , 魏雪 , 陈文光 , 张璐飞 , 托尔斯滕·霍夫勒 , 马晓松 , 刘欣(Xin Liu) , 郑伟民 , 徐静芳 :
神图:在几秒钟内处理数百万核上的万亿边缘图。 56:1-56:11 韦恩·茹伯特 , 黛博拉·A·威吉尔 , 大卫·凯纳 , 莎莉登山车 , 艾米·贾斯汀 , 基尔斯滕·法格南 , 丹尼尔·雅各布森 :
打击阿片类流行病:确定慢性疼痛和阿片类成瘾的上位性和多效性遗传结构。 57:1-57:14
图形算法和系统
月德记 , 刘杭(Hang Liu) , H.Howie Huang先生 :
iSpan:用生成树并行识别强连通分量。 58:1-58:12 阿里夫·汗 , Krzysztof Choromanski公司 , 亚历克斯·波顿 , S.M.费尔多斯 , 马汉特斯·哈拉帕纳瓦尔 , 安东尼诺·图米奥 :
使用b边缘覆盖对数据进行自适应匿名化。 59:1-59:11 马丁·温特 , 丹尼尔·姆拉卡 , 拉勒布·扎耶 , 汉斯·佩特·塞德尔 , 马库斯·斯坦伯格 :
faimGraph:在GPU上的紧内存约束下对完全动态图进行高性能管理。 60:1-60:13
编程系统工具
顾义子 , 约翰·梅勒·克鲁米 :
OpenMP程序的动态数据竞争检测。 61:1-61:12 卡齐姆·切什米 , Shoaib Kamil公司 , 米歇尔·米尔斯·斯特劳特 , 玛丽亚姆·梅赫里·德纳维 :
ParSy:检查和转换稀疏矩阵计算的并行性。 62:1-62:15 芳可叶 , 赵继生 , 维维克·萨卡尔 :
通过部分程序符号执行检测MPI使用异常。 63:1-63:5
深度学习
兰德尔·皮特曼 , 惠观 , 沈喜鹏 , Seung-Hwan Lim先生 , 罗伯特·巴顿 :
探索灵活的通信方式,以简化DNN集合训练管道。 64:1-64:12 阿姆丽塔·马图里亚 , 黛博拉·巴德 , 彼得·门迪格拉 , 劳伦斯·梅多斯 , 詹姆斯·阿内曼 , 雷绍 , 何思玉 , Tuomas Karnä , 戴安娜·莫伊斯 , 西蒙·彭尼库克 , 克里斯汀·马斯霍夫 , 杰森·苏厄尔 , 纳里尼·库马尔 , 何雪莉(Shirley Ho) , 迈克尔·林根伯格 , 巴帕 , 维克多·W·李 :
CosmoFlow:利用深度学习在规模上了解宇宙。 65:1-65:11 埃文格洛斯·乔治亚纳斯 , Sasikanth Avancha公司 , 库纳尔·巴纳吉 , 迪拉杰·D·卡拉姆卡尔 , 格雷格·亨利 , 汉斯·帕布斯特 , 亚历山大·海内克 :
剖析SIMD体系结构上的高性能深度学习卷积。 66:1-66:12
弹性III: GPU(全球生产单位)
阿卜杜拉赫曼·马哈茂德 , Siva Kumar Sastry哈里 , 迈克尔·B·沙利文 , 蔡提摩西(Timothy Tsai) , 斯蒂芬·凯克勒 :
优化用于GPU错误检测的软件定向指令复制。 67:1-67:12 陈洁阳 , 李洪波 , 李四环 , Xin Liang(新亮) , 吴潘若 , 丁文涛 , 开明欧阳 , 刘元来 , 赵凯(Kai Zhao) , Qiang Guan(强关) , 陈子忠 :
具有GPU的异构系统上的容错单边矩阵分解。 68:1-68:12 查姆·卡拉 , 弗里茨·普雷维隆 , 李香玉 , 诺曼·鲁宾 , 大卫·R·凯利 :
PRISM:使用统计方法预测GPU应用程序的弹性。 69:1-69:14
天体物理学应用
穆罕默德·努法尔·法鲁奇 , 谭恩恩(Tan Nguyen) , 张伟群 , 安·S·阿尔姆格伦 , 约翰·沙尔夫 , Didem Unat公司 :
相位异步AMR执行,用于生产和性能天体物理流。 70:1-70:14 贾石 , 李瑞鹏 , 袁哲希 , 萨阿德 , Maarten V.de Hoop公司 :
使用高度并行的多项式滤波特征解算器计算行星内部法线模式。 71:1-71:13
文件系统: 数据移动和来源
德瓦西·戈沙尔 , 拉瓦尼亚·拉马克里希南 , 黛博拉·阿加瓦尔 :
Dac-Man:HPC系统上科学数据集的数据更改管理。 72:1-72:13 Pradeep Subedi公司 , 菲利普·戴维斯 , 段少华 , 斯科特·克拉斯基 , 赫曼斯·科拉 , Manish Parashar公司 :
Stacker:用于基于极端规模数据暂存的现场工作流的自主数据移动引擎。 73:1-73:11 格伦·洛克伍德 , 谢恩·斯奈德 , 王腾(Teng Wang) , 苏伦·拜纳 , 菲利普·卡尔斯 , 尼古拉斯·J·赖特 :
并行文件系统生命周期中的一年。 74:1-74:13