PPoPP 2021:韩国虚拟活动
李政宰 , 埃雷斯·彼得兰克 :
PPoPP’21:第26届ACM SIGPLAN并行编程原理与实践研讨会,虚拟活动,大韩民国,2021年2月27日至3月3日。 ACM公司 2021 ,国际标准图书编号 978-1-4503-8294-6 佩德罗·拉马拉赫特 , 安德烈亚·科雷亚 , 帕斯卡·费尔伯 :
持久事务内存的高效算法。 1-15 曾静娜 , 谢迪·伊萨 , 保罗·罗曼诺 , 路易斯·罗德里格斯 , 塞夫·哈里迪 :
研究事务存储系统中未来的语义。 16-30 袁浩伟 , Naama Ben-David公司 , 盖伊·布莱洛赫 , 帕纳吉奥塔·法图鲁 , 埃里克·鲁珀特 , 孙一翰 :
具有并发数据结构应用程序的恒定时间快照。 31-46 王彦军(Yanjun Wang) , 刘金伟 , 张大林 , 邱晓康 :
关于递归树遍历的推理。 47-61 蔡紫仙 , 刘正阳 , 赛义德·马利基 , 穆苏瓦蒂夫人 , 托德·米特科维奇 , 雅各布尼尔森 , 奥利·萨里基维 :
综合最优集合算法。 62-75 孟晓竹 , 乔纳森·M·安德森 , 约翰·梅勒·克鲁米 , 马克·克伦特尔 , 巴顿·P·米勒 , 斯丹·米拉科维奇 :
并行二进制代码分析。 76-89 Mahmut Taylan坎德米尔 , Jihyun Ryoo先生 , 唐旭龙 , 穆斯塔法·卡拉科伊 :
编译器支持近数据计算。 90-104 迈克尔·鲍尔 , Wonchan Lee公司 , 埃利奥特屠宰场 , 贾志浩 , 马里奥·迪伦佐 , 曼诺利斯·帕帕达克斯 , 盖伦·M·希普曼 , 帕特里克·S·麦考密克 , 迈克尔·加兰德 , 亚历克斯·艾肯 :
通过动态控制复制扩展隐式并行。 105-118 黄克昭 , 冀东寨 , 甄正 , Yongmin一 , 沈喜鹏 :
了解并弥合当前GNN性能优化中的差距。 119-132 王凯 , 唐·福塞尔 , 卡尔文·林 :
一种用于GPU的快速高效SSSP算法。 133-146 李志芳 , 韩铭聪 , 吴尚伟 , 邱良翁 :
ShadowVM:使用裸机CPU和GPU加速数据平面以进行数据分析。 147-160 Sepideh Maleki公司 , 乌迪特·阿加瓦尔 , 马丁·伯彻尔 , 凯沙夫·平加里 :
BiPart:一个并行的确定超图分割器。 161-174 阿杰·辛格 , 特雷弗布朗 , 阿里·何塞·马什蒂扎德 :
NBR:基于中和的回收。 175-190 丹尼尔·所罗门 , 亚当-莫里森 :
有效回收并发搜索数据结构中的内存,同时限制浪费的内存。 191-204 安德烈亚·科雷亚 , 佩德罗·拉马拉赫特 , 帕斯卡·费尔伯 :
OrcGC:自动无锁内存回收。 205-218 马丁·温特 , 马蒂亚斯·帕尔格 , 丹尼尔·姆拉卡 , 马库斯·斯坦伯格 :
GPU上的动态内存管理器速度慢吗?: 调查和基准。 219-233 杨柳 , 维萨姆·西德·拉赫达尔 , Osni Marques公司 , 朱欣然 , Chang Meng公司 , 詹姆斯·维尔登·德梅尔 , 小叶S.李 :
GPTune:用于自动调整exascale应用程序的多任务学习。 234-246 张晓阳 , 肖俊敏 , 谭光明 :
CNN中卷积自动调整的I/O下限。 247-261 哈希姆·谢里夫 , 赵一凡 , 玛丽亚·科齐法库 , 阿卡什·科塔里 , 本·施赖伯 , 伊丽莎白·王 , 亚斯敏·萨里塔 , 内森·赵 , 基尔·乔希 , 维克拉姆·S·阿德 , 萨萨·米塞洛维奇 , 莎莉塔V.Adve :
ApproxTuner:用于自适应近似的编译器和运行时系统。 262-277 冯伯元 , 王育科 , 陈国洋(音) , 张伟峰 , 袁燮 , 丁宇飞 :
EGEMM-TC:以更高的精度加速张量核的科学计算。 278-291 康斯坦蒂诺·戈麦斯 , 菲利波·曼托瓦尼 , 埃里希·福赫特 , 马克·卡萨斯 :
在长向量架构上高效运行SpMV。 292-303 赵托文 , 玛丽·W·霍尔 , 汉斯·约翰森 , 哈佛大学的威廉斯 :
通过使用数据布局优化节点上的数据移动来改进通信。 304-317 刘佳文 , 杰仁 , 罗伯托·乔奥萨 , 董丽(Dong Li) , 李佳佳 :
斯巴达:异构内存上的高性能、元素级稀疏张量收缩。 318-333 大卫·阿尔瓦雷斯 , 凯文·萨拉 , 马科斯·马洛尼亚斯 , 阿莱克斯·罗卡 , 维琴·贝尔特兰 :
基于任务的运行时系统的高级同步技术。 334-347 卡勒布·沃斯 , 维维克·萨卡尔 :
承诺的所有权策略和死锁检测器。 348-361 李志敏 , 哈希塔·梅农 , 凯瑟琳·莫罗 , 同行蒂莫·布雷默 , 雅顿利夫纳特 , 瓦莱里奥·帕斯库奇 :
通过错误传播了解程序的弹性。 362-373 Shumpei Shiina公司 , 岩崎信太郎 , Kenjiro Taura公司 , 巴凡·巴拉吉 :
轻量级抢占式用户级线程。 374-388 贾瑞芳 , 杨瑜 , 赵成铎 , 周杰(音译) :
涡轮变压器:用于变压器模型的高效GPU服务系统。 389-402 马金·科皮克 , 亚历山德鲁·卡洛托乌 , 托比亚斯·格罗瑟 , 尼古拉斯·威基 , 菲利克斯·沃尔夫 , 托尔斯滕·霍夫勒 :
从受污染的程序中提取干净的性能模型。 403-417 罗伯托·卡斯塔涅达·洛扎诺 , 默里·科尔 , 比约恩·弗兰克 :
通过模式分析实现并行代码的现代化。 418-430 石庆凡 , 易容 , 陈萌 , 曹宗岩 , 王思玉(Siyu Wang) , 甄正 , 川武 , 郭平龙 , 杨军(Jun Yang) , 李雪霞 , 蓝松雕 , 刘晓勇 , 魏琳 :
DAPPLE:用于训练大型模型的流水线数据并行方法。 431-445 Shreyas Gokhale公司 , 萨希尔·霍克德 , 内拉杰·米塔尔 :
动态系统的群互斥。 446-447 雅各布尼尔森 , 队长哈山 , 罗伯托·帕尔米耶里 :
捆绑引用:高并发线性化范围查询的抽象。 448-450 萨代赫·达尔瓦迪 , 布里杰什·多戈尔 :
验证C11样式的弱内存库。 451-453 乔戈斯·卡佩斯 , 斯特吉奥斯·安纳斯塔西亚迪斯 :
用于快速工作分配的无锁放松并发队列。 454-456 杰斯珀·拉尔森·特罗夫 , 曼努埃尔·佩特 :
一个更实用的无锁、有序、链表的实现。 457-459 陈一峰 , Bei Wang(北王) , 王晓林 :
使用位置键扩展MapReduce框架。 460-462 格列戈兹·克瓦希涅夫斯基 , 塔尔·本努 , 亚历山大·尼古拉·齐奥加斯 , 蒂莫·施奈德 , 马西耶·贝斯塔 , 托尔斯滕·霍夫勒 :
线性代数核的并行I/O优化:近最优LU分解。 463-464 马尔基塔·埃利斯 , 艾丁·布鲁索 , 凯瑟琳·耶利克 :
基因组学中广义N体问题的异步与批量同步。 465-466 童书 , 郭燕飞 , 贾斯汀·沃兹尼亚克 , 丁晓宁 , 伊恩·福斯特 , 塔辛M.库拉 :
通过组合组件模型进行现场工作流自动调整。 467-468 大雁 , 王伟(音译) , 朱晓文 :
使用GAS简化低级GPU编程。 469-471 YuAng Chen(陈玉昂) , Yeh-Ching Chung先生 :
Corder:用于优化图形分析的缓存软件重新排序。 472-473 余继平 , 魏琴 , 朱晓伟 , 孙振波 , 黄建强 , 李晓涵 , 陈文光 :
DFOGraph:一个I/O和通信效率高的系统,用于分布式全核心图形处理。 474-476 张恒(Heng Zhang) , 李玲达 , 东林庄 , 刘瑞(Rui Liu) , 双松 , 丁文涛 , 吴彦军(Yanjun Wu) , 宋帅文 :
一种有效的异构体系结构不确定图处理框架。 477-479 韩若兵 , 最小Si , 詹姆斯·德梅尔 , 杨友 :
用于低精度学习的动态缩放。 480-482 吴若凡 , 张峰(音) , 郑珍 , 杜晓勇 , 沈喜鹏 :
探索winograd CNN推理中的深度重用。 483-484 西安金 , 李冠鹏 , 宋帅文 , 丁文涛 :
一种新的基于误差有界有损压缩的高效记忆深度学习训练框架。 485-487 苏丹杜拉尼 , 穆罕默德·萨阿德·丘特艾 , 阿卜杜勒·达克 , 文美Hwu , 劳伦斯·劳什沃格 :
FFT闪电战:张量核反击。 488-489