2016年第45届ICPP:美国宾夕法尼亚州费城
-
2016年8月16日至19日,美国宾夕法尼亚州费城,第45届并行处理国际会议,ICPP 2016。 IEEE计算机学会 2016 ,国际标准图书编号 978-1-5090-2823-8
第1A部分: 数据中心和云1
段军 , 杨元元 :
Fat-Tree数据中心中可变大小虚拟机的高效虚拟网络嵌入。 1-10 朱廷伟 , 丹凤 , 余华 , 王芳(Fang Wang) , 青玉石 , 刘嘉豪 :
MIC:数据中心网络中的高效匿名通信系统。 11-20 Dian Shen公司 , 罗俊洲 , 方东 , 张俊雪 :
AppBag:云环境中虚拟机的应用软件带宽分配。 21-30 莱昂纳多·皮加 , 因德拉尼·保罗 , 魏黄 :
电力约束型HPC集群中通信失衡下的性能提升机会。 31-40 李振华 , 杨元元 :
RRect:一种新型的以服务器为中心的高可用性数据中心网络。 41-46
第1B部分: 架构1
Yi Lin(译林) , 黄浦春 , 刘铎 , 小朱 , 梁亮 :
使内存频繁模式挖掘持久且节能。 47-56 青大湖 , 《纪武书》 , 杰凡 , 陆友友 :
并行GPGPU应用程序的运行时性能估计和面向公平的调度策略。 57-66 李夏青 , 张光艳 , H.Howie Huang先生 , 王朱凡 , 郑伟民 :
基于GPU的卷积神经网络性能分析。 67-76 双松 , 孟莉 , 郑心年 , 迈克尔·勒比恩 , Jee Ho Ryoo先生 , Reena熊猫 , 安德烈亚斯·格斯特劳尔 , 莉齐·K·约翰 :
异构集群上图形处理工作负载的代理引导负载平衡。 77-86 雷翠 , 志余浩 , 王崇华 , 费海强 , 镇泉丁 :
Piccolo:虚拟机集群的快速高效回滚系统。 87-92
第2A部分: 并行算法
帕特里克·麦基 , 罗伯特·刘易斯 :
多共享内存体系结构的并行k-Means++。 93-102 奥古斯·卡亚 , 博拉乌萨尔 :
稀疏张量Tucker分解的高性能并行算法。 103-112 Moohyeon Nam公司 , 金勇勋(Jinwoong Kim) , Beomseok Nam公司 :
GPU上最近邻查询的并行树遍历。 113-122 安妮·本诺特 , 洛伊克·波蒂埃 , 伊维斯·罗勃特 :
弹性应用程序与处理器重新分发协同调度。 123-132 杰西卡·马克兰托克 , 安东尼·沃思 :
k-中心聚类的高效并行算法。 133-138
第2B部分: 架构2
王欣(Xin Wang) , 纪晓峰 , 卢云平 , 李毅 , 周伟佳 , 张伟华 , 赵文云 :
了解EDA算法的体系结构特征。 139-148 王静(音译) , 刘彦军(Yanjun Liu) , 张伟功 , 科中路 , 邱基尼(Keni Qiu) , 辛福 , 陶莉 :
探索近阈值计算下的可变软件容错缓存。 149-158 郑丽 , 王芳(Fang Wang) , 丹凤 , 余华 , 韦彤 , 刘静宁 , 刘翔(音) :
俄罗斯方块写作:探索更多考虑PCM不对称的写作并行性。 159-168 黄萍(Ping Huang) , 刘文杰 , 坤堂 , 何旭斌 , 柯周 :
ROP:通过在冻结周期中恢复内存系统来减少刷新开销。 169-178 于志斌 , Lieven Eeckhout公司 , 徐成忠 :
线程相似矩阵:可视化GPGPU程序中的分支分歧。 179-184
第3A节: 编程技巧1
萨扬·戈什 , 杰夫·哈蒙德 , 安东尼奥·佩尼亚 , 巴凡·巴拉吉 , 阿瑟夫·哈迪什·盖布雷梅欣 , 芭芭拉·查普曼 :
使用MPI-3 RMA进行矩阵运算的单面接口:Elemental的案例研究。 185-194 孟锦涛 , Sangmin Seo先生 , 巴凡·巴拉吉 , 魏燕杰(Yanjie Wei) , 王炳强 , 盛中锋 :
SWAP汇编程序2:极端规模的De Novo基因组汇编程序的优化。 195-204 英德拉尼尔·罗伊 , 安基特·斯里瓦斯塔瓦 , 斯里尼瓦斯·阿鲁鲁 :
自动处理器编程技术。 205-210 金苏公园 , Woongki Baek公司 :
RCHC:一个用于并发异构计算的整体运行时系统。 211-216
第3B部分: 并行算法2
马修·格雷琴 , 约瑟夫·伊兹拉列维茨 , 迈克尔·斯科特 :
无边界非阻塞双端队列。 217-226 韩建军 , 辛涛 , 朱大凯 , 哈坎·艾丁 :
多核混合临界系统的临界感知分区。 227-235 多米尼克·拉萨尔 , 乔治·卡里皮斯 :
一种用于图形划分的并行爬山细化算法。 236-241 伊万杰利亚·西塔里迪 , 勒内·米勒 , 蒂姆·卡尔杜威 , 盖伊·M·洛曼 , 肯尼思·罗斯 :
大规模并行无损数据解压缩。 242-247
第4A部分: 数据云和云2
普拉桑娜·巴拉普拉卡什 , 维塔利A.莫罗佐夫 , 拉吉库马尔·凯蒂穆图 , 卡利安·库马兰 , 伊恩·T·福斯特 :
通过直接搜索优化提高数据传输吞吐量。 248-257 亚历山大·丹尼斯 , 弗朗索瓦·特拉海 :
MPI重叠:基准和分析。 258-267 张杰(音译) , 陆小一 , Dhabaleswar K.熊猫 :
InfiniBand群集上基于容器的HPC云的高性能MPI库。 268-277 瑞汉(Rui Han) , 黄四光 , 费唐 , 富贵昌 , 詹建峰 :
AccuracyTrader:针对云在线服务中的低尾延迟和高结果准确性的精确感知近似处理。 278-287 普拉迪普·苏贝迪 , 黄萍(Ping Huang) , 刘彤(音译) , 约瑟夫摩尔 , 斯坦·斯克尔顿 , 何旭斌 :
CoARC:擦除编码Hadoop中的协同、主动恢复和故障缓存。 288-293
第4B部分: 网络物理系统1
高国驹 , 肖明军(Mingjun Xiao) , 赵振华 :
移动出租车招呼系统的最优多轴调度。 294-303 贾刘 , Bin Xiao先生 , 刘璇 , 陈丽君 :
快速RFID轮询协议。 304-313 何宗建 , 张大强 , 曹建农 , 刘雪峰 , 范晓鹏 , 徐成忠 :
利用出租车轨迹开发实时红绿灯调度。 314-323 安库尔·萨克 , 陈西秋 , 沈海英(Haiying Shen) , 安德烈亚·吉尔 , 约阿希姆·泰伯 , 马什鲁·乔杜里 , 吉姆·马丁 , Mac Devine公司 , 安德鲁·林多斯 :
一种高效的无线电力传输系统,用于平衡电动汽车的充电状态。 324-333 陈慧杰 , 范丽 , Yu Wang(王宇) :
EchoLoc:使用COTS设备进行准确的无设备手动定位。 334-339
第5A节: 并行算法3
中野浩二 , 高藤大辅 , 藤田佐治 , 松谷博树 , 藤原一枝 , Michihiro Koibuchi先生 :
低速互联网络的随机优化网格图。 340-349 大卫·弗雷 , 希查姆·拉赫勒夫 , 米歇尔·雷纳尔 :
无线同步广播/接收树网络中的最佳无冲突距离-2着色。 350-359 巴皮·查特吉 , 伊万·瓦卢里亚 , Philippas Tsigas公司 :
帮助优化和语言可移植的无锁并发数据结构。 360-369 薛正元 , 李瑞轩 , 张恒(Heng Zhang) , 西乌谷 , 徐志勇 :
DC-Top-k:一种新的Top-k选择算法及其并行化。 370-379 Napath Pitaksirianan公司 , 芝拉·努里 , 易成图 :
GPU上的高效双体统计计算:并行化及超越。 380-385
第5B部分: 存储系统
彼得·丹兹 , 马修·柯蒂斯·马里 , 维奈天神 :
思考全局,行动局部:WAFL文件系统中全局排序和并行处理的缓冲区缓存设计。 386-395 朱莉(Chu Li) , 丹凤 , 余华 , 王芳(Fang Wang) :
使用耐用的SSD缓存提高RAID性能。 396-405 唐厚军 , 苏伦·拜纳 , 史蒂夫·哈伦伯格 , 张文钊 , 邹晓成 , 丹尼尔·马丁 , Bin Dong(宾东) , 达什·德文德兰 , 吴科申 , 大卫·特雷博蒂奇 , 斯科特·克拉斯基 , Nagiza F.萨马托娃 :
用于AMR时空读取访问的原位存储布局优化。 406-415 萨加尔·塔帕利亚 , Purushotham V.班加罗尔 , 杰伊·洛夫斯特德 , 凯瑟琳·莫罗 , 亚当·穆迪 :
管理共享突发缓冲系统中的I/O干扰。 416-425 郝文 , 大卫·洪昌都 , 米兰·歇提 , 沃伊特 , 李珊珊 :
有保障的重拳出击:用有保障的服务质量为VDI应用程序建模。 426-431
第6A部分: 编程技巧2
贝诺·普拉代尔 , 贝诺·梅斯特 , 穆图·曼尼坎丹·巴斯卡兰 , 阿萨纳西奥斯·康斯坦蒂尼迪斯 , 托马斯·亨利蒂 , 理查德·莱廷 :
可缩放层次多面体编译。 432-441 曾静娜 , 乔·佩德罗·巴雷托 , 塞夫·哈里迪 , 路易斯·罗德里格斯 , 保罗·罗曼诺 :
事务内存的未来。 442-451 桑杰·查特吉 , 尼克·弗维洛 , 佐兰·布迪姆利奇 , 凯瑟琳·克诺贝 , 维维克·萨卡尔 :
并行程序中局部性的声明性调整。 452-457 Vivekanandan Balasubramanian语 , 安东斯·特里卡利斯 , 奥利·韦德纳 , Shantenu Jha公司 :
集成工具包:任务集成的可扩展和灵活执行。 458-463
第6B部分: 网络物理系统2
赵子棋 , 范武 , 任少雷 , 高晓峰 , 陈桂海 , 崔勇(音) :
TECH:用于定位需求响应的热软件和成本效益机制。 464-473 侯赛姆·奇胡布 , 克里斯汀·科莱 :
智能计量系统数据管理方法的可扩展性比较研究。 474-483 约翰·罗梅因 :
无线电天文信号处理算法加速器结构的比较。 484-489 康晨 , 沈海英(Haiying Shen) :
MobiSensing:利用人的移动性实现低用户干预的多应用移动数据传感。 490-495
第7A课时: 性能建模
阿克雷姆·贝纳提亚 , 伟星记 , 王一卓 , 冯石 :
GPU上SpMV稀疏矩阵格式的多类SVM选择。 496-505 杰弗里日报 , 阿南斯·卡利亚纳拉曼 , 斯里拉姆·克里希纳莫奥斯蒂 , 任斌 :
关于加宽向量寄存器对序列比对的影响。 506-515 荣格 , 西洲峰 , 杨阳河 , 邹鹏飞 :
功率受限系统上的跨部件功率协调案例。 516-525 石莎 , 吴洁文 , 明凡 , 任少雷 , 刚泉 :
通过温度约束多核处理器上的频率振荡实现性能最大化。 526-535 张攀峰 , 黄萍(Ping Huang) , 何旭斌 , 王华(Hua Wang) , 颜玲玉 , 柯周 :
RMD:一种基于相似性和合并的高性能重复数据消除方法。 536-541
第7B部分: GPU应用程序
岑晨 , 李垦利 , 艾嘉欧阳 , 卓堂 , 李克勤 :
GFlink:基于异构CPU-GPU集群的大数据内存计算体系结构。 542-551 黄明霞 , 吴阳 :
部分平坦化:GPGPU上不规则嵌套并行性的编译技术。 552-561 张峰(音) , 彭迪 , 郝周 , 廖祥科 , 薛晶凌 :
RegTT:利用规则加速GPU上的树遍历。 562-571 田晓楠 , Dounia Khaldi公司 , Deepak Eachempati公司 , 徐仁干 , 芭芭拉·查普曼 :
优化GPU寄存器使用:OpenACC和编译器优化的扩展。 572-581 易阳 , 闵峰 , 斯利马特·查克拉达尔 :
HppCnn:用于GPGPU的高性能、可移植的深度学习库。 582-587
第8A部分: 应用
纪尧姆·奥皮 , JeongHyung公园 , 帕德玛·拉加万 :
局部感知拉普拉斯网格平滑。 588-597 萨米赫·肖迪 , 阿比纳夫·维希努 , 加甘·阿格拉瓦尔 :
容错支持向量机。 598-607 朱丽叶·帕杜 , 安德烈·切尔尼科夫 :
用于航空航天应用的复杂区域的并行二维非结构化各向异性Delaunay网格生成。 608-617
第8B部分: 可扩展软件
Sudip K.印章 , 史蒂文·P·赫斯曼 , 安德烈亚斯·温根 , 罗伯特·S·威尔科克斯 , Mark R.Cianciosa公司 , Ezekial A.Unterberg公司 :
PARVMEC:变矩平衡代码的高效、可扩展实现。 618-627 安东斯·特里卡利斯 , 安德烈·默兹基 , 陈浩源 , 李泰松 , 达林·M·约克 , Shantenu Jha公司 :
RepEx:可扩展副本交换分子动力学模拟的灵活框架。 628-637 欢峰 , 大卫·M·埃斯 , 史蒂芬·米尔斯 , 吴永伟 , 黄志毅 :
PCAF:使用基于主成分分析的过滤的可扩展、高精度k-NN搜索。 638-647