2019年国际比较项目:日本京都
-
第48届并行处理国际会议论文集,ICPP 2019,日本京都,2019年8月5日至8日。 ACM公司 2019 ,国际标准图书编号 978-1-4503-6295-5
2019年ICPP最佳论文
伊恩·博格尔 , 卡伦·D·迪瓦恩 , 毛罗·佩雷戈 , 西瓦桑卡兰·拉贾马尼卡姆 , 乔治·M·斯洛塔 :
分布式存储冰盖模拟中网格奇异性检测的并行图算法。 1:1-1:10
T1A: 内存体系结构
西王 , 安东尼诺·图米奥 , 约翰·D·莱德尔 , 李杰(音译) , 陈勇(音) :
MAC:用于3D堆叠内存的内存访问聚合器。 2:1-2:10 杰森·希贝尔 , 劳拉·布朗 , 王振林 :
细粒度硬件预取器控制的机器学习。 3:1-3:9 阿尔宾·埃尔德斯特·达姆林 , 佩德罗·特拉科索 , Ioannis Sourdis公司 :
AVR:通过近似值重建减少内存流量。 4:1-4:10 孙慧(音) , 刘伟(音译) , 黄建忠 , 宋福 , 芝巧 , 魏松石 :
基于LSM树的键值存储的近数据处理和时间软件压缩优化。 5:1-5:11
表1B: 工作流和数据分析系统
艾米莉·池周 , 姚晓 , 何炳生 , 沙迪·易卜拉欣 , 雷诺德·程 :
将概率优化用于数据处理工作流的资源提供。 6:1-6:10 玛丽亚·马利克 , 哈桑·加森姆扎德 , 蒂努什·莫赫塞宁 , 罗萨里奥·卡马罗塔 , 梁昭 , 阿维斯塔·萨桑 , 霍曼·霍马雍 , Setareh Rafatirad公司 :
ECoST:节能协同定位和自调整MapReduce应用程序。 7:1-7:11 邵武杰 , 费旭 , 李晨 , 郑浩岳 , 刘方明 :
阶段延迟调度:使用资源交错加快DAG类型的数据分析作业。 8:1-8:11 弗兰克·斯科内曼 , 雅罗斯瓦夫·佐拉 :
使用Apache Spark解决大型图中的所有路径最短问题。 9:1-9:10
T1C: 数据中心
侯晓峰 , 刘嘉诚 , 李超(音) , 郭敏义 :
释放微服务时代功率受限数据中心的可扩展潜力。 10:1-10:10 郑嘉琪 , 郑启明 , 高晓峰 , 陈桂海 :
带转换器的混合交换数据中心网络中的动态负载平衡。 11:1-11:10 马修·巴库 , 格雷戈伊尔·托德斯基 , 阿兰·查纳 , 丹尼尔·哈吉蒙特 :
无嵌套嵌套虚拟化。 12:1-12:10 侯晓峰 , 梁明玉 , 李超(音) , 郑文丽(Wenli Zheng) , 全晨 , 郭敏义 :
当电力超额订购遇到流量洪水攻击时:重新考虑数据中心峰值负载管理。 13:1-13:10
T2A: 内存优化
阿德里安·加西亚-加西亚 , 胡安·卡洛斯·塞兹 , 费尔南多·卡斯特罗 , 曼努埃尔·普列托·马蒂亚斯 :
LFOC:面向商品多核的轻量级公平缓存群集策略。 14时1分至14时10分 Konstantinos Nikas公司 , Nikela Papadopoulou , 迪米特拉·詹齐迪 , 瓦西里厄斯·卡拉科斯塔斯 , 乔治奥斯·古马斯 , Koziris油桃 :
DICER:Diligent Cache Partitioning以实现高效的工作负载整合。 15:1-15:10 耀城巷 , 叶晨成 , 王晓林 , 罗英伟 , 王振林 :
EMBA:高效内存带宽分配,提高Intel商品处理器的性能。 16:1-16:12 肖军(Jun Xiao) , 安迪·皮门特尔 , 徐柳 :
CPpf:一种支持预取的LLC分区方法。 17:1-17:10
T2B: 并行系统算法
胡锦斌 , 黄嘉伟 , 吕文军 , 李伟和 , 王建新 , 天河 :
TLB:数据中心网络中具有自适应粒度的流量软件负载平衡。 18:1-18:10 卡洛斯·费尔南德斯·穆索尔斯 , 丹尼尔·科卡 , 保罗·里士满 :
HyperPRAW:架构软件Hypergraph重新划分分区,以提高在高性能计算系统上运行的并行应用程序的性能。 19:1-19:10 王一丹 , 查希尔·塔里 , 黄晓然 , 阿尔伯特·Y·佐马亚 :
一种用于数据流处理的基于网络软件和分区的资源管理方案。 20:1-20:10 廖振宇(音) , 钱世友 , 曹健 , 曹燕华 , 薛广涛 , 贾迪余 , 朱延敏(Yanmin Zhu) , 李明露 :
PhSIH:基于内容的Pub/Sub系统中事件匹配的轻量级并行化。 21:1-21:10
T2C: NVRAM和SSD
蒙廷路 , 王芳(Fang Wang) , 丹凤 , 胡育冲 :
一种用于通过重复数据消除提高SSD读取性能的读级别数据分发方案。 22:1-22:10 徐高翔 , 丹凤 , 谭志鹏 , 张新燕 , 徐杰(音译) , 西蜀 , 朱一峰 :
RFPL:一种减少SSD RAID小写惩罚的恢复友好奇偶校验日志记录方案。 23:1-23:10 徐斌(Bin Xu) , 黄建忠 , 曹强 , 肖琴 :
TEA:内存商店的高效流量擦除编码存档方案。 24:1-24:10 刘嘉豪 , 王芳(Fang Wang) , 丹凤 :
CostPI:共享NVMe SSD的成本效益性能隔离。 25:1-25:10
T3A: 并行体系结构
穆罕默德·瓦哈尔·阿扎尔 , Miquel Pericás公司 , 佩尔·斯坦斯特罗姆 :
SaC:利用执行时间延迟来节省异构多核系统中的能量。 26:1-26:12 李云凡 , 狄朱 , 陈丽忠 :
基于NoC的多核平台的快速链接放置。 27:1-27:10 法泽莱赫·萨达特·霍西尼 , 阿拉斯·阿塔拉尔 , Philippas Tsigas公司 :
在现代建筑中模拟原子图元的性能。 28:1-28:11 Michihiro Koibuchi先生 , 藤原一枝 , 日本名古屋 , Tomohiro Totoki先生 , 平泽昭一 :
Water-Immersion电脑板案例。 29:1-29:10
T3B: 日程安排
李卓钊 , 沈海英(Haiying Shen) :
JobPacker:具有混合电/光数据中心网络的数据并行框架的作业调度。 30:1-30:10 马可·达米科 , 安娜·约卡诺维奇 , 朱利塔·科尔巴兰 :
可延展作业的整体慢驱动调度和资源管理。 31:1-31:10 安娜·盖纳鲁 , 纪尧姆·帕雷斯 , 孙洪阳 , 帕德玛·拉加万 :
随机HPC应用程序的推测调度。 32:1-32:10 刘国欣 , 沈海英(Haiying Shen) , 王浩宇 :
繁忙数据密集型并行计算集群的协同作业调度和数据分配。 33:1-33:11
T3C: I/O系统
谢萍(Ping Xie) , 朱元 , 黄建忠 , 肖琴 :
N代码:用于负载平衡和高I/O性能的最佳RAID-6 MDS阵列代码。 34:1-34:10 朱春杰 , 王芳 , 侯斌兵 :
BPP:一种用于I/O预测的实时块访问模式挖掘方案。 35:1-35:10 袁宁高 , 高晓峰 , 陈桂海 :
DeepHash:分布式文件系统中元数据管理的端到端学习方法。 36:1-36:10 曹士义 , 袁宁高 , 高晓峰 , 陈桂海 :
AdaM:一种用于分布式元数据管理的自适应细粒度方案。 37:1-37:10
T4A类: 节点优化
Seonmyeong Bak公司 , 郭燕飞 , 巴凡·巴拉吉 , 维维克·萨卡尔 :
通过用户定义的调度策略优化并行循环的执行。 38:1-38:10 尼古拉·德诺伊勒 , 布里斯·戈林 , 伊曼纽尔·詹诺 , 托马斯·罗帕斯 :
NUMA体系结构中的数据和线程放置:统计学习方法。 39:1-39:10 埃姆雷·阿特斯 , 张一佳 , 伯拉克阿克萨 , 吉姆·布兰特 , 葡萄J.Leung , 曼努埃尔·埃格尔 , Ayse K.Coskun公司 :
HPAS:用于再现性能变化的HPC性能异常套件。 40:1-40:10 丹尼尔·扎卡 , 布莱恩·科科洛基 , 凯特·基亚 :
减少内核表面积以实现隔离和可扩展性。 41:1-41:10
T4B类: 并行算法1
玉林车 , 卓行来 , 孙萱萱 , 琼洛 , 王悦(Yue Wang) :
加速三个处理器上的所有边缘公共邻域计数。 42:1-42:10 梁元 , 单黄 , 张云泉 , 杭曹 :
镶嵌星形模具。 43:1-43:10 西万·托莱多 , Amit Waisel公司 :
矩阵多项式计算的并行算法。 44:1-44:10 安西·莎拉·汤姆 , 乔治·卡里皮斯 :
分布式存储结构的二维并行三角形计数算法。 45:1-45:10
T4C类: 通信体系结构
尚小军 , 刘振华 , 杨元元 :
网络拥塞感知在线服务功能链布局和负载平衡。 46:1-46:10 罗希特·赞布雷 , 梅根·格罗多维茨 , 阿帕尔娜·钱德拉莫利什瓦兰 , 帕维尔·沙米斯 :
断带:高性能通信的崩溃。 47:1-47:10 杰斯珀·拉尔森·特罗夫 , 萨沙·胡诺德 :
笛卡尔集体沟通。 48:1-48:11
时间T5A: GPU的系统软件
阿克巴尔·马吉迪 , 高晓峰 , 朱顺佳 , 纳齐拉·贾汉巴赫 , 陈桂海 :
自适应路由重新配置以最小化基于SDN的数据中心网络中的流量成本。 50:1-50:10 大卫·特伦德尔 , 团塔 , Byunghyun Jang先生 :
用于在GPU上调度不规则工作负载的专用并发队列。 51:1-51:11 范凯杰 , 比亚吉奥·科森扎 , 本·H·H·朱林克 :
可预测的GPU频率缩放以实现能量和性能。 52:1-52:10 金贤俊(Hyunjun Kim) , 孙金·洪 , 李孝洙 , Euiseong Seo先生 , 韩焕洙 :
编译器辅助的GPU线程节流以减少缓存争用。 53:1-53:10分
T5B: 并行算法2
芮霞 , 戴海鹏 , 郑嘉琪 , 荣古 , 王晓宇(音译) , 陈桂海 :
安全:通过VNF扩展消除故障实现服务可用性。 54:1-54:10 伊通关 , 李传友 , 唐雪岩 :
分布式作业执行的最大最小公平资源分配。 55:1-55:10 Wei Zhou公司 , K.Preston怀特 , 余洪峰 :
使用Dice改进混合作业调度程序中的短作业延迟性能。 56:1-56:10 周廷哲 , Maged M.迈克尔 , 迈克尔·F·斯皮尔 :
实用、可扩展、放松优先级队列。 57:1-57:10
T5C: 网络
柯武 , 德尊侗族 , 村路李 , 单黄 , 一代 :
通过包保留避免网络拥塞。 58:1-58:10 李瑞 , 于鹏 , 金照 , 王欣(Xin Wang) :
两个(流)表的故事:揭开OpenFlow交换机中规则缓存的神秘面纱。 59:1-59:10 李雪冰 , 刘炳阳 , 杨晨 , 于晓(音) , 嘉信堂 , 王欣(Xin Wang) :
阿耳特弥斯:一个实用的低效率命名和路由系统。 60:1-60:10 白云仁 , 徐子汉 , 王海霞 , 王东生 :
非均匀流量网络中擦除编码簇的快速恢复技术。 61:1-61:10
T6A: 加速器应用程序
尤海·米奇 :
Volta GPU上的重力八叉树码性能评估。 62:1-62:10 罗宾·科布斯 , 丹尼尔·Jünger , 克里斯蒂安·亨特 , 贝蒂尔·施密特 :
绯闻:多GPU系统的高效通信原语。 63:1-63:10 阿里·艾克 , 巴里·威廉姆斯 , Kenneth Chiu先生 , 德米特里·波诺马列夫 :
受控异步GVT:加速多核集群上的并行离散事件模拟。 64:1-64:10 郭成新 , 洪晨(音) , 张峰(音) , 李翠萍 :
基于GPUDirect RDMA的多CPU集群分布式连接算法。 65分65秒-10秒
T6B: 容错性
Ji Zhang先生 , 柯周 , 黄萍(Ping Huang) , 何旭斌 , Zhili Xiao公司 , Bin Cheng先生 , 永光记 , 王银虎 :
基于传输学习的异构磁盘系统大型数据中心少数磁盘故障预测。 66分66秒10 卡洛斯·帕查霍 , 马库斯·列沃尼亚克 , 威尔弗里德·甘斯特尔 , 杰斯珀·拉尔森·特罗夫 :
如何使预处理共轭梯度法对多节点故障具有弹性。 67:1-67:10 应尧荣 , 吴伟刚 , 陈志光 :
COMBFT:基于冲突顺序匹配的拜占庭容错协议,具有高效性和健壮性。 68:1-68:10 大雁 , 郑景明 , 陈洪志 , 程龙 , Purushotham V.班加罗尔 :
类Pregel系统中的轻量级容错。 69:1-69:10
第6c页: 应用1-模拟
马尔基塔·埃利斯 , 朱利娅·吉迪 , 艾丁·布鲁索 , 列奥尼德·奥利克 , 凯瑟琳·耶利克 :
diBELLA:分布式长读取到长读取对齐。 70:1-70:11 冯宗浩 , 双秋 , 王力鹏 , 琼洛 :
在三个处理器上加速长读取对齐。 71:1-71:10 徐凯(Kai Xu) , 宋振亚 , 陈远东 , Shida Wang(王世达) , 孟祥旭 , 刘卫国 , 魏雪 :
基于Sunway太湖光的WRF模型重构与优化。 72:1-72:10 毛罗·德尔·本 , Osni Marques公司 , 安德鲁·坎宁 :
电子结构计算中本征解的改进无约束能量泛函方法。 73:1-73:11
T7A: 编程系统和运行时
卓杭莱 , 琼洛 , 谢小龙 :
异构系统上的高效数据并行基元。 74:1-74:10 D.布莱恩·拉金斯 , 约翰·斯尼德 , 詹姆斯·迪南 :
加速偷工。 75:1-75:10 Bibek Wagle公司 , 穆罕默德·阿劳尔·哈克·莫奈尔 , 凯文·哈克 , 艾伦·D·马洛尼 , 阿德里安·塞里奥 , 哈特穆特·凯泽 :
异步多任务运行时系统上的运行时自适应任务内联。 76:1-76:10 雅苏吉(Masahiro Yasugi) , 村上大辅 , 铃木平石 , Umatani先生 , 肯托·埃莫托 :
HOPE:基于层次省略的并行执行模型。 77:1-77:11
T7B: 性能建模
吴兴福 , 瓦莱丽·泰勒 , 贾斯汀·沃兹尼亚克 , 里克史蒂文斯 , 托马斯·布雷廷 , 芳芳霞 :
并行癌症深度学习CANDLE基准的性能、能量和可扩展性分析和改进。 78:1-78:11 桑迪普·马迪雷迪 , 普拉桑娜·巴拉普拉卡什 , 菲利普·卡尔斯 , 罗伯特·莱瑟姆 , 格伦·洛克伍德 , 罗伯特·B·罗斯 , 谢恩·斯奈德 , 斯特凡·M·怀尔德 :
应用程序性能建模中概念漂移的自适应学习。 79:1-79:11 法希姆·乔杜里 , 岳朱 , 托德·黑尔 , 索尔·帕雷德斯 , 亚当·穆迪 , 罗宾·戈德斯通 , 凯瑟琳·莫罗 , 魏宽于 :
BeeGFS用于深度学习的I/O特性和性能评估。 80:1-80:10 苏拉杰·库马尔 , 莱昂内尔·伊劳德·杜布瓦 , 斯里拉姆·克里希纳莫奥斯蒂 :
数据传输的性能模型:分子化学内核的案例研究。 81:1-81:10
T7C: 仿真技术
王浩钊 , 宋国 , 李瑞轩 :
OSP:用于快速机器学习的参数服务器中的重叠计算和通信。 82:1-82:10 扬·胡克尔海姆 , 纳夫霍特·库克雷加(Navjot Kukreja) , 斯里·克里希纳·纳拉亚南 , 法比奥·卢波里尼 , 杰勒德·戈尔曼 , 保罗·D·霍夫兰 :
相邻模具回路的自动微分。 83:1-83:10 西德哈特·库马尔 , 史蒂夫·佩特鲁扎 , Will Usher公司 , 瓦莱里奥·帕斯库奇 :
粒子数据的空间软件并行I/O。 84:1-84:10 刘毅(音) , 郭晓伟 , 李超(音) , 杨灿群 , 甘心标 , 张鹏(音译) , 王毅(Yi Wang) , 冉照 , 泗江扇 :
多尺度流体模拟的通信重叠混合分解并行算法。 85:1-85:12
T8A: 深度学习
郑浩岳 , 费旭 , 李晨 , Zhi Zhou公司 , 刘方明 :
辛西娅:为可预测的分布式深层神经网络培训提供经济高效的云资源。 86:1-86:11 郑文佳 , 迈克尔·泰恩斯 , 亨利·戈尔利克 , 应茂 , 龙城 , 侯盐田 :
FlowCon:容器化深度学习应用程序的弹性流配置。 87:1-87:10 杨成 , 李丹 , 郭志远 , 姜斌耀(Binyao Jiang) , 林嘉欣 , 西帆 , 耿金坤 , 余信义 , 魏白 , 雷区 , 冉姝 , 彭成 , 熊永强 , 吴建平 :
DLBooster:通过卸载数据预处理管道提高端到端的深度学习工作流。 88:1-88:11 魏高 , 贾瑞芳 , 赵文来 , 杨金哲 , 龙王 , 林甘 , 郝欢付 , 杨广文 :
swATOP:在SW26010多核处理器上自动优化深度学习操作员。 89:1-89:10
T8B: 工具及其使用
艾伦·D·马洛尼 , 斯里尼瓦桑·拉梅什 , 凯文·哈克 , 尼古拉斯·查莫夫 , 萨米尔·申德 :
TAU性能系统的插件体系结构。 90:1-90:11 王涛(音译) , 尼基尔·贾恩 , 大卫·贝金赛尔 , 大卫·伯姆 , 弗兰克·米勒 , 托德·甘布林 :
FuncyTuner:通过Per-loop编译自动调整科学应用程序。 91:1-91:10 雅库布·库扎克 , Yaohung M.Tsai先生 , 马克·盖茨 , 艾哈迈德·阿卜杜勒法塔赫 , 杰克·东加拉 :
大规模并行自动软件调整。 92:1-92:10 林志民 , 盛玉福 , 丁永红 , 刘玉平 , 吴建中(Jan-Jan Wu) , 许维中 :
在动态二进制翻译中利用矢量处理。 93:1-93:10
T8C: 应用程序2-新兴应用程序
周静亚 , 涧西扇 , 金旺(Jin Wang) :
Cosin:可控社会影响最大化及其在大规模社会网络中的分布式实现。 94:1-94:10 华谊金 , 吴晨涛 , Xin Xie(新谢) , 李杰(音译) , 郭敏仪 , 郝琳 , 张剑锋 :
近似代码:一种用于云系统中分层视频存储的经济高效的擦除编码框架。 95:1-95:10 陈章 , 羌曹 , 杰瑶 , 圆圆洞 , 杨普元 :
VScan:通过模型联合机制高效分析监控视频。 96:1-96:10 Xin Chen(新晨) , 德米特罗·科诺布里茨基 , 托马斯·塔克 , 托马斯·库费斯 , 理查德·瓦杜克 :
用于数控铣削应用的高分辨率快速并行碰撞检测。 97:1-97:10
T9A: 神经网络
王德广 , 沈俊忠 , 梅文 , 张春元 :
在多FPGA平台上加速复杂连接CNN的有效设计流程。 98:1-98:10 王乐元 , Zhi Chen先生 , 刘益智 , 姚旺 , 郑连敏 , 穆力 , 王义达(Yida Wang) :
集成GPU上CNN模型推断的统一优化方法。 99:1-99:10 安德烈·魏恩伯格 , 贝蒂尔·施密特 :
GPU上的大规模并行ANS解码。 100:1-100:10
T9B: 并行数据结构
刘梦兴 , 邢建凯 , 康晨 , 吴永伟 :
使用HTM构建可扩展的基于NVM的B+树。 101:1-101:10 本杰明·布洛克 , 艾丁·布鲁索 , 凯瑟琳·耶利克 :
BCL:一个跨平台的分布式数据结构库。 102:1-102:10 财新功 , 何水兵 , 伊犁宫 , 雷迎春 :
日志结构合并树中追加与合并的集成。 103:1-103:10
T9C: 物联网和边缘计算
徐子川 , 张宇通 , 梁伟发 , 秋芬霞 , 奥马尔·拉纳 , 亚历克斯·加利斯 , 吴国伟 , 潘舟 :
在具有资源共享的移动边缘云中支持NFV的多播。 104:1-104:10 柯莉 , 黄浩伟 , 高晓峰 , 范武 , 陈桂海 :
QLEC:一种基于机器学习的节能聚类算法,用于延长高维空间物联网的网络寿命。 105:105:10 亚历山大·达·席尔瓦·维思 , 菲利佩·罗德里戈·德索萨 , 马科斯·迪亚斯·德阿桑桑 , 劳伦·莱夫维尔(Laurent Lefèvre) , 朱利奥·塞萨尔·桑托斯·多斯·安霍斯 :
边缘计算数据流分析重构的多目标强化学习。 106:1-106:10