2017年第46届ICPP:英国布里斯托尔
-
2017年8月14日至17日在英国布里斯托尔举行的第46届平行处理国际会议(ICPP 2017)。 IEEE计算机学会 2017 ,国际标准图书编号 978-1-5386-1042-8
重点论文(S1-T1)
常春藤博鹏 , 罗伯托·乔奥萨 , Gokcen Kestor公司 , 埃尔文·劳雷 , 斯特凡诺·马基迪斯 以下为:
为Exascale时代准备HPC应用程序:解耦策略。 1-10 郭敬聪 , Onkar Bhardwaj公司 , 冯敏伟 以下为:
一种用于深度学习应用的高效分布式随机梯度下降算法。 11-20 王英瑞 , 李磊生 , 荣天 以下为:
非均匀团簇上光滑粒子流体力学方法的大尺度并行化。 21-30
图分析与ML(S2-T1)
埃里克·维尔米吉 , 莱安德罗·菲奥林 , 克里斯托弗·哈格莱特纳 , 科恩·贝特尔斯 以下为:
通过近数据处理提高HPCG和Graph500的效率。 31-40 韩东(Han Dong) , 陶莉 , 加冰冷 , 灵岩港 , 白刚 以下为:
GCN:基于GPU的Cube CNN高光谱图像分类框架。 41-49 马尔利佩迪·哈迪克 , 迪普·桑卡·班纳吉 , 基兰·拉杰·拉莫尔西 , 基肖尔·科塔帕利 , 坎南·斯利纳坦 以下为:
异构算法的近似平衡工作划分。 50-59
增强编程运行时系统(S2-T2)
阿德里安·卡斯特略 , Sangmin Seo先生 , 拉斐尔·梅奥 , 巴凡·巴拉吉 , 恩里克·金塔纳·奥尔蒂 , 安东尼奥·佩尼亚 以下为:
GLTO:关于OpenMP实现的轻量级线程方法的充分性。 60-69 Jordyn Maglalang公司 , 斯里拉姆·克里希纳莫奥斯蒂 , 库纳尔·阿格拉瓦尔 以下为:
本地感知的动态任务图调度。 70-80 周廷哲 , Pantea Zardoshti公司 , 迈克尔·F·斯皮尔 以下为:
事务锁省略的实际经验。 81-90
线性代数算法(S2-T3)
哈特维格·安斯特 , 杰克·J·东加拉 , 戈兰·弗莱加 , 恩里克·金塔纳·奥尔蒂 以下为:
小矩阵的可变规模批量LU及其集成到块Jacobi预处理中。 91至100 长崎优助 , 阿基拉·努卡达 , 松冈佐治 以下为:
NVIDIA Pascal GPU的高性能和节省内存的稀疏通用矩阵乘法。 101-110 沙登·史密斯 , 亚历克·贝里 , 乔治·卡里皮斯 以下为:
带加速AO-ADMM的约束张量因子分解。 111-120
数据和网络(S3-T1)
维克托·加西亚(Victor Garcia-Flores) , 爱德华·伊瓜德 , 安东尼奥·佩尼亚 以下为:
异构系统上的高效数据共享。 121-130 维克拉姆·纳拉亚纳 , 帅孙 , 阿明·迈赫拉比安 , 沃尔克·J·索格 , 塔雷克·埃尔·加扎维 以下为:
HyPPI NoC:将混合等离子体技术引入光电芯片网络。 131-140 胡晓康 , 王章 , 李健 , 马如辉 , 冯武 , 海冰关 以下为:
ES2:以最佳虚拟I/O事件路径为目标。 141-150
GPU和运行时系统(S3-T2)
阿克谢·文卡泰什 , 哈立德·哈米杜什 , 斯雷拉姆·波特鲁里 , 戴维德·罗塞蒂 , 清朝楚国 , Dhabaleswar K.熊猫 以下为:
MPI-GDS:具有GPUDirect-aSync的高性能MPI设计,用于CPU-GPU控制流解耦。 151-160 清朝楚国 , 小一路 , 阿马尔·艾哈迈德·阿旺 , 哈里·苏布拉莫尼 , 贾汉泽布·马库尔·哈什米(Jahanzeb Maqbool Hashmi) , 布雷西·埃尔顿 , Dhabaleswar K.熊猫 以下为:
用于深度学习的GPU集群上高效且可扩展的多源流媒体广播。 161-170 伯拉克巴斯滕 , Didem Unat公司 , 张伟群 , 安·S·阿尔姆格伦 , 约翰·沙尔夫 以下为:
GPU上的重叠数据传输和计算(带分片)。 171-180
图和网络(S3-T3)
孙佳文 , 汉斯·范迪伦敦克 , 迪米特里奥斯·尼科洛普洛斯 以下为:
通过利用图分区的内存位置来加速图分析。 181-190年 哈里·桑达尔 , 帕梅什瓦尔·库尔德 以下为:
计算相对邻域图中循环的并行算法。 191-200 米荷·贝 , Junho Eum公司 , 东勋·金 , Sangyoon噢 以下为:
使用BSP风格的通信和平衡分布对Web级RDF数据进行高性能查询处理。 201-210
存储(S4-T1)
小阳区 , 吉光湾 , 宋凤光 , 小赵庄 , 费武(Fei Wu) , 谢长生 以下为:
OptiMatch:实现绿色能源与可再生能源动力存储系统的各种工作负载之间的最佳匹配。 211-220 李鲁豫 , 侯祥基 , 吴晨涛 , 李杰(音译) , 郭敏义 以下为:
有利块优先:加速三磁盘容错阵列部分条带恢复的综合缓存方案。 221-230 谢燕文 , 丹凤 , 王芳(Fang Wang) 以下为:
具有不同冗余方案的分布式存储系统的非顺序分条。 231-240
IO和云(S4-T2)
易素 , 丹凤 , 余华 , 詹氏 以下为:
预测云对象存储系统的响应延迟百分比。 241-250 穆罕默德·法提赫·阿克塔斯 , 哈维尔·迪亚兹·蒙特斯 , 伊万·罗德罗 , Manish Parashar公司 以下为:
WA-数据空间:探索广域分布式科学工作流的数据分段抽象。 251-260 马修·柯蒂斯·马里 , 拉姆·凯萨万 , Mrinal K.Bhattacharjee先生 以下为:
WAFL文件系统中的可扩展写分配。 261-270
数值应用(S4-T3)
郑敏英(Minyoung Jung) , 金宇公园 , 约翰·布利伯格 , 伯恩德·伯格斯特勒 以下为:
共享内存多核上同时确定性有限自动机的并行构造。 271-281 Sudip K.印章 , Mark R.Cianciosa公司 , 史蒂文·希尔斯曼 , 安德烈亚斯·温根 , 罗伯特·威尔科克斯 , Ezekial A.Unterberg公司 以下为:
等离子体约束装置中三维磁流体动力学平衡的并行重建。 282-291 雅典娜·埃拉弗洛 , 乔治奥斯·古玛斯 , Koziris油桃 以下为:
现代多核处理器上稀疏矩阵向量乘法的性能分析与优化。 292-301
网络(S5-T1)
雷阳 , 曹建农 , 王振宇 , 吴伟刚 以下为:
移动边缘云中的网络感知多用户计算分区。 302-311 陈西秋 , 沈海英(Haiying Shen) 以下为:
无线网络中的抗衰落链路调度。 312至321 Ryota Yasudo先生 , Michihiro Koibuchi先生 , 中野浩二 , Hiroki Matsutani公司 , 天野秀春 以下为:
顺序/基本问题:走向低端到端延迟互连网络。 322-331
云调度(S5-T2)
穆罕默德·雷扎·霍塞尼·法拉巴迪 , 贾维德·塔赫里 , 查希尔·塔里 , 阿尔伯特·Y·佐马亚 以下为:
Lambda体系结构的动态资源控制器。 332-341 Sunimal Rathnayake公司 , Dumitrel Loghin公司 , 雍梦涛(Yong Meng Teo) 以下为:
CELIA:云上弹性应用程序的成本-时间性能。 342-351 埃尔维·伊维奎尔 , 吉多·阿劳霍 以下为:
云作为OpenMP卸载设备。 352-361
GPU应用程序(S5-T3)
Takumi Honda公司 , 山本信诺 , Hiroaki本田 , 中野晃二 , 伊藤康树 以下为:
Voronoi映射和欧氏距离映射的简单快速并行算法,以及GPU实现。 362-371 库比拉亚塔苏 , 托马斯·帕内尔 , 塞莱斯汀·德纳 , 米歇尔·弗拉科斯 , 哈拉兰普斯·波齐迪斯 以下为:
在CPU/GPU集群上使用协同集群进行高性能推荐系统培训。 372-381 戈弗特·布林克曼 , 克里斯蒂安·弗里特维尔(Kristian F.D.Rietveld) , 弗兰克·W·塔克斯 以下为:
利用GPU实现大规模网络的快速力导向可视化。 382-391
数据和IO(S6-T1)
龙城 , 王颖(音) , 贝玉龙 , 迪克·H·J·埃佩马 以下为:
用于高性能数据分析的基于协同流的协同优化框架。 392-401 李志鹏 , 许银龙 , 李永坤 , 田成锦 , 白友慧 以下为:
PDS:一种用于奇偶分簇数据布局的I/O高效缩放方案。 402-411 杨旺(Yang Wang) , 何水兵 , 范晓鹏 , 徐成忠 , 约瑟夫·卡尔伯森 , 约瑟夫·霍顿 以下为:
下一代移动云服务中的数据缓存,在线与离线。 412-421
计算优化(S6-T2)
丽娟江 , 朝阳 , 玉龙坳 , Wanwang Yin公司 , 马文静(Wenjing Ma) , 乔孙 , 刘芳芳 , 林荣芬 , 张鹏(音译) 以下为:
在新兴的SW26010多核处理器上实现高效DGEMM。 422-431 詹姆斯·林 , 徐志耕 , 阿基拉·努卡达 , Naoya Maruyama先生 , 松冈佐治 以下为:
SW26010多核处理器上两个计算约束科学内核的优化。 432-441 徐世雄 , 大卫·格雷格 以下为:
位片向量:在具有SIMD扩展的处理器上实现可定制数据精度的软件方法。 442至451
数据分析(S6-T3)
杨友 , 詹姆斯·德梅尔 以下为:
机器学习数据集的运行时数据布局调度。 452-461 卡梅什·阿鲁穆加姆 , 德什·兰扬 , 穆罕默德·朱巴伊尔 , 巴尔萨·特尔齐克 , 亚历山大·戈杜诺夫 , Tunazzina伊斯兰 以下为:
一种在GPU上高效并行模拟束流动力学的机器学习方法。 462-471 夏拉兰波斯Stylianopoulos , 马格努斯·阿尔姆格伦 , 奥拉夫·朗西德尔 , 玛丽娜·帕帕特里安塔菲卢 以下为:
网络安全应用的多模式匹配:通过矢量化加速。 472-482
图形算法(S7-T1)
埃里克·索尔 , 迪内什·潘查纳南 , 亚历山大·霍尔 , 文武堂 , 埃里克·德尔梅尔 以下为:
并行时空核密度估计。 483-492 彭妮 , 河井正太郎 , 谭文君 , 陈旺 , 蔡文桐 以下为:
时态图中单信源最早到达问题的并行算法。 493-502 穆斯塔法·凯末尔·塔斯 , 卡梅尔·卡亚 , 埃里克·绍尔 以下为:
贪婪是好的:基于多核架构的二部图局部着色的并行算法。 503-512
异构平台(S7-T2)的性能和功率调整
伊苏鲁·迪兰卡·费尔南多 , 萨纳特·贾亚塞纳 , 米琳达·费尔南多 , 哈里·桑达尔 以下为:
异构集群的可扩展分层半分离库。 513-522 罗伯特·V·林 , 博亚娜·诺里斯 , 艾伦·D·马洛尼 以下为:
通过静态和预测分析自动调整GPU内核。 523-532 Aniket查克拉巴蒂 , 斯里尼瓦桑Parthasarathy , 克里斯托弗·斯图尔特 以下为:
异构系统数据分析的帕累托框架:对绿色能源使用和性能的影响。 533-542
各种并行算法(S8-T1)
艾哈姆·卡斯布 , Jean-Marc尼科德 , 劳伦特·菲利普 , 维罗妮卡·雷恩·索尼戈 以下为:
功率约束下独立任务的并行调度。 543-552 爱德华多·莫斯科索·鲁比诺 , 阿尔贝托·何塞·阿尔瓦雷斯 , 劳尔·玛丽·普拉德斯 , 佩德罗·桑斯·瓦莱罗 以下为:
一种适用于通用处理器的新型最小时间并行二维离散小波变换算法。 553-562 Harshvardhan Das公司 , 苏博德·库马尔 以下为:
一种基于TSP的并行平衡图划分算法。 563-570
弹性和功率感知调度(S8-T2)
刘薰云 , 亚伦·哈伍德 , 沙尼卡·卡鲁塞凯拉 , 本杰明·I.P.鲁宾斯坦 , 布亚 以下为:
E-Storm:分布式流处理系统中基于复制的状态管理。 571-580 爱曼·方 , 奥雷连·卡弗兰 , 伊维斯·罗勃特 , 安德鲁·钱恩 以下为:
具有潜在错误的模具计算的弹性。 581-590 荣歌 , 邹鹏飞 , 冯锡洲 以下为:
功率受限NUMA多核系统上的应用软件功率协调。 591-600