2021年第23集群:美国俄勒冈州波特兰
-
IEEE集群计算国际会议,2021年9月7日至10日,美国俄勒冈州波特兰,Cluster 2021。 电气与电子工程师协会 2021 ,国际标准图书编号 978-1-7281-9666-4 李斌瑞 , 圣干成 , 詹姆斯·林 :
tcFFT:用于NVIDIA张量核的快速半精度FFT库。 1-11 W.Pepper Marts公司 , 马修·G·F·多桑杰 , 斯科特·利维 , 惠特·肖恩宾 , 瑞恩·格兰特 , 帕特里克·G·布里奇斯 :
MiniMod:用于HPC的模块化微型应用程序基准测试框架。 12-22 丹尼尔·罗森多 , 亚历山德鲁·科斯坦 , 加布里埃尔·安东纽 , 马蒂厄·西蒙宁 , Jean-Christophe伦巴多 , 亚历克西斯·乔利 , 帕特里克·瓦杜里兹 :
边到云连续体上复杂应用程序的可复制性能优化。 23-34 谢冰冰(Bing Xie) , 羌曹 , 马尤雷什·昆吉尔 , 临澧湾 , 杰弗里·沙斯 , 阿尼尔班·曼达尔 , Mats Rynge公司 :
短讯:基于DAG的工作流的资源高效扩展和在线预测。 35-46 姜紫涵 , Wanling Gao公司 , 费唐 , 王磊(Lei Wang) , 熊兴旺 , 罗春杰 , 川新兰 , 李红晓 , 詹建峰 :
HPC AI500 V2.0:HPC AI系统基准测试的方法、工具和指标。 47-58 陈文燕(Wenyan Chen) , 成都路 , 叶克江 , 杨旺(Yang Wang) , 徐成忠 :
RPTCN:基于深度学习的云中高动态工作负载的资源预测。 59胜69负 内森·格林斯塔恩 , 奥利维尔·博蒙特 , 伊曼纽尔·詹诺 , 菲利普·普鲁克斯 :
预习:基于强化学习的异构动态调度策略。 70-81 刘洪源 , 博格丹·尼古拉 , 圣迪(Sheng Di) , 弗兰克·卡佩罗 , Adwait慢跑 :
使用选择性权重转移加速大规模DNN架构搜索。 82-93 荆曹 , 朱宗伟 , 周学海 :
SAP-SGD:加速异构集群上具有高通信效率的分布式并行训练。 94-102 张丽芝 , 赖志泉 , 李胜伟(Shengwei Li) , 于堂 , 刘峰(音) , 李东生 :
2PGraph:在GPU集群上加速大图形上的GNN训练。 103-113 詹姆·塞努达·加西亚 , 哈里哈兰·德瓦拉扬 , 卢克·洛根 , 基思·贝特曼 , 内拉杰·拉杰什 , 洁业 , 安东尼·库卡斯 , 孙贤和 :
HFlow:动态弹性多层I/O转发器。 114-124 彭旭 , 赵南男(Nannan Zhao) , 吉光湾 , 刘伟(音译) , 陈顺宁 , 周远辉 , 哈迪尔·阿尔巴哈 , 刘汉阳 , 刘唐 , 谢长生 :
通过将本地存储与云存储集成,构建快速高效的LSM-tree存储。 125-134 奥维迪乌·克里斯蒂安·马尔库 , 亚历山德鲁·科斯坦 , 博格丹·尼古拉 , 加布里埃尔·安东纽 :
用于高性能流媒体的虚拟日志结构存储。 135-145 Pradeep Subedi公司 , 菲利普·戴维斯 , Manish Parashar公司 :
RISE:减少基于暂存的极端规模现场工作流中的I/O争用。 146-156 郭汉琛 , 林哲涵(Zhehan Lin) , 顾云飞 , 吴晨涛 , 李江 , 李杰(音译) , 薛广涛 , 郭敏义 :
Lazy-WL:一种用于有效扩展SSD阵列的穿戴式负载平衡数据重新分配方法。 157-168 弗雷德里克·希梅尔芬尼 , 马克·安德雷·维夫 , 雷扎·萨尔霍德 , 阿尔贝托·米兰达 , 拉蒙·努 , 安德烈·布林克曼 :
使用临时文件系统优化分布式深度学习I/O。 169-180 郝武 , Jin江明 , 冀东寨 , 一帆功 , 刘伟(音译) :
加速自主导航系统的GPU消息通信。 181-191 孙清晓 , 刘毅(音) , 杨海龙 , 江忠辉 , 刘晓燕 , 明盾 , 中智栾 , 钱德培 :
csTuner:用于GPU上复杂模板计算的可扩展自动调整框架。 192-203 帕特里克·迪尔 , 格雷戈·戴 , 多米尼克·马塞洛 , 凯文·哈克 , 萨吉夫·希贝尔 , 哈特穆特·凯泽 , 朱汉·弗兰克 , 杰弗里·克莱顿 , 德克·普吕格 :
Octo-Tiger在ORNL峰会上使用HPX+CUDA的新型水力模块和性能。 204-214 马纳西·蒂瓦里 , 萨蒂什·瓦迪亚尔 :
分布式存储系统的流水线预处理s步共轭梯度方法。 215-225 Mohsen Koohi Esfahani公司 , 彼得·基尔帕特里克 , 汉斯·范迪伦敦克 :
节俭标记传播:斜度图的快速连通分量。 226-237 乔纳森·利夫兰德 , 尼科尔·莱马斯特·斯莱滕 , 菲利普·佩巴(Philippe P.Péba) , 菲尔·米勒 , 弗朗西斯科·里齐 , 马修·贝登古 :
针对时间变化不平衡的工作负载优化分布式负载平衡。 238-249 赫鲁希特·帕里赫 , Vinit Deodhar葡萄酒 , 阿达·加夫里洛夫斯卡 , 桑托什·潘德 :
通过配对大规模窃取分布式工作。 250-260 多米尼克·施奈特 , 劳里茨·塔姆森 , 朱厚坤 , 乔纳森·威尔 , 亚历山大·阿克 , 托尔斯滕·威特科普 , Odej Kao先生 :
Bellamy:跨上下文重用分布式数据流作业的性能模型。 261-270 陈平(Ping Chen) , 何水兵 , 张雪晨 , Shuaiben Chen(陈帅本) , 裴义洪 , 尹延龙 , 孙贤和 , 陈刚 :
CSWAP:一种用于加速GPU中张量交换的自调整压缩框架。 271-282 田建南 , 圣迪(Sheng Di) , 余晓东 , 科迪·里维拉 , 赵凯 , 西安金 , 冯云和 , Xin Liang(新亮) , 丁文涛 , 弗兰克·卡佩罗 :
为GPU上的科学数据优化有误差有损压缩。 283-293 刘金阳 , 圣迪(Sheng Di) , 赵凯(Kai Zhao) , 西安金 , 丁文涛 , Xin Liang(新亮) , 陈子忠 , 弗兰克·卡佩罗 :
探索基于自动编码器的科学数据有误差压缩。 294-306 余晓东 , 盛迪 , 阿里·穆拉特·高克 , 丁文涛 , 弗兰克·卡佩罗 :
cuZ-Checker:基于GPU的有损压缩超快评估系统。 307-319 张嘉玲 , 陈嘉熙 , 卓晓燕 , Aekyeung月亮 , 承佑子 :
DPZ:通过科学数据的信息检索提高有损压缩比。 320-331 Subhadeep Bhattacharya公司 , 魏宽于 , 法希姆·塔米德·乔杜里 , 凯瑟琳·莫罗 :
O(1)通过两级梯度平均进行分布式SGD通信。 332-343 尼古拉斯·马洛特 , 里希·维玛(Rishi R.Verma) , 罗希特·辛格 , 菲利普·A·威尔西 :
基于分区大数据的持久同态分布式计算。 344-354 王大林 , 张峰 , 韦涛丸 , 李厚润 , 杜晓勇 :
FineQuery:CPU-GPU集成架构上的精细查询处理。 355-365 平泽昭一 , 山崎骏(Hayato Yamaki) , Michihiro Koibuchi先生 :
并行计算机商品交换机的数据包转发缓存。 366-376 梅根·格罗多维茨 , 路易斯·佩尼亚 , 柯蒂斯·邓纳姆 , 董忠 , 帕维尔·沙米斯 , 史蒂夫·普尔 :
双链:用于函数注入和执行的高性能框架。 377-387 刘伟(音译) , 刘海昆 , 廖晓飞 , 海金 , 于章 :
HNGraph:基于混合内存的NUMA系统中的并行图形处理。 388-397 Hoang-Dung Do村 , 瓦莱里·海奥特·萨森 , 拉斐尔·费雷拉·达席尔瓦 , 克里斯托弗·斯蒂尔 , 亨利·卡萨诺娃 , 特里斯坦·格拉塔德 :
为Linux页面缓存建模,以准确模拟数据密集型应用程序。 398-408 薄芳 , 王道策 , 西安金 , 昆西·科齐奥 , 赵章 , Qiang Guan(强关) , 苏伦·拜纳 , 斯里拉姆·克里希纳莫奥斯蒂 , 丁文涛 :
描述存储故障对HPC应用程序的影响:方法和见解。 409-420 库尔特·费雷拉 , 斯科特·利维 , 维克托·库恩斯 , 内森·德巴德尔本 , 肖恩·布兰查德 :
了解DRAM可纠正错误日志在规模上的影响。 421-432 坤锁 , Junggab儿子 , 程大钊 , 魏晨 , 萨布尔·拜迪亚 :
通过高效和自适应的容器运行时重用解决无服务器应用程序的冷启动。 433-443 马修·沃尔夫 , 杰里米·洛根 , 克什蒂吉·梅塔 , 丹尼尔·雅各布森 , 米凯拉·卡什曼 , 安吉丽卡·M·沃克 , 格雷格·艾森豪尔 , 帕特里克·M·威德纳 , 阿什利·克利夫 :
可重用性优先:实现公平工作流。 444-455 腾马 , 康晨 , 马绍南 , 卓松 , 吴永伟 :
更多思考RDMA内存语义。 456-467 塔帕西娅·帕奇 , 亚当·伯奇 , 伊恩·卡林 , 董海安(Dong H.Ahn) , 布莱恩·范·埃森 , 巴里·朗特里 , 布朗尼斯·德·苏宾斯基 , 内森·贝肖 :
监控大型超级计算机:用Lassen超级计算机进行的案例研究。 468-480 阿那布·达斯 , Tanmay Tirpankar公司 , 加内什·戈帕拉克里什南 , 斯里拉姆·克里希纳莫奥斯蒂 :
基于符号自动微分的无环浮点程序鲁棒性分析。 481-491 埃尔维斯·罗哈斯 , 迭戈·佩雷斯 , 乔恩·卡尔霍恩 , 莱昂纳多·鲍蒂斯塔·戈麦斯 , 特里·琼斯 , 埃斯特班·梅内塞斯 :
通过检查点更改了解深度学习模型和框架的软错误敏感性。 492-503 埃德加·莱昂 , 马克·乔斯 , 内森·汉福德 , 阿德里安·科特 , 托尼·德尔福 , 弗朗索瓦·迪亚卡塔 , 文森特·杜克洛 , 伊恩·卡林 , 马克·佩拉奇 :
MPI库的即时健壮翻译。 504-515 开明欧阳 , 最小Si , Atsushi Hori公司 , 陈子忠 , 巴凡·巴拉吉 :
Daps:MPI通信的动态异步进程窃取模型。 516-527 凯文·萨拉 , 桑德拉·马西娅 , 维琴·贝尔特兰 :
将单向通信与基于任务的编程模型相结合。 528-541 万荣高 , 方建斌 , Chun Huang先生 , 徐传福 , 郑旺(音) :
在ARMv8多核架构上优化屏障同步。 542-552 Yuetsu Kodama公司 , Masaaki近藤 , 佐藤三久 :
A64FX上SPEC CPU和SPEC OMP的评估。 553-561 罗伯特·舍恩 , 托马斯·伊尔采 , 马里奥·比勒特 , 马库斯·维尔滕 , 马库斯·施密德 , 丹尼尔·哈肯伯格 :
AMD Zen 2架构的能效方面。 562-571 朱利塔·科尔巴兰 , Oriol Vidal公司 , 路易斯·阿隆索 , 乔迪·阿内亚斯 :
Intel体系结构中使用EAR的能源优化策略的显式非核心频率缩放。 572-581 罗伯特·舍恩 , 马库斯·施密德 , 马里奥·比勒特 , 丹尼尔·哈肯伯格 :
FIRESTARTER 2:处理器压力测试的动态代码生成。 582-590 斯特凡·罗比拉 , 大卫·格兰特 , 克里斯·德普拉特 , 瓦利·索雷尔 , 特里·罗杰斯 , 大卫·马丁内斯 , 什洛莫诺沃特尼 :
冷却数据中心:机械控制业主项目需求(OPR)模板的设计。 591-595 阿莱西奥·内蒂 , Woong Shin公司 , 迈克尔·奥特 , 托尔斯滕·王尔德 , 娜塔莉·贝茨 :
HPC运营数据分析的概念框架。 596-603 托马斯·雅各布施 , 尼古拉斯·拉奇奇 , 奥雷连·卡夫兰 , 弗洛里娜·乔尔巴(Florina M.Ciorba) :
用于HPC应用程序识别的执行指纹字典。 604-608 灰白的朋友 , 普雷蒂·马拉卡尔 :
集成的作业监视器、分析器和预测器。 609-617 肯尼思·拉马尔 , 亚历山大·戈波连科 , 克里斯蒂娜·彼得森 , 本杰明·阿伦 , 吉姆·勃兰特 , 达米安·德切夫 :
使用Multimodal-Aware预测器支持HPC作业。 618-622 路易丝·哈丁 , 法比安·沃恩利 , 苏特(Frédéric Suter) :
Sequence-RTG:系统日志消息中的高效和生产就绪模式挖掘。 623-631 李成成 , 艾哈迈德·马罗夫·卡里米 , Woong Shin公司 , 海蓉琪 , 王飞毅 :
预测HPC功耗时,时间特征的重要性不成比例。 632-636 Shantenu Jha公司 , 艾伦·D·马洛尼 :
多任务集成计算的动态自适应监测与分析。 637-641 洁茵 , Atsushi Hori公司 , Balazs Gerofi公司 , 石川裕隆 :
HPC多组件工作流中数据交换的可扩展性研究。 642-648 里卡多·马塞多 , 科雷亚(Cláudia Correia) , 马可·丹塔斯 , 克洛伊迪亚·布里托 , 徐伟佳 , 谷村优介(Yusuke Tanimura) , 杰森·哈加 , 圣保罗 :
深度学习框架中的存储优化解耦案例。 649-656 马可·丹塔斯 , 迪奥戈·莱特昂 , 克劳迪娅·科雷亚 , 里卡多·马塞多 , 徐伟佳 , 圣保罗 :
MONARCH:深度学习框架的分层存储管理。 657-663 卢克·洛根 , 杰伊·洛夫斯特德 , 斯科特·利维 , 帕特里克·M·威德纳 , 孙贤和 , 安东尼·库卡斯 :
pMEMCPY:一个简单、轻量级和可移植的I/O库,用于在持久内存中存储数据。 664-670 萨拉·纽沃思(Sarah Neuwirth) , 阿纳布·库马尔·保罗 :
并行I/O评估技术和新兴HPC工作负载:透视图。 671-679 刘玉珍 , 奥纳·马林 :
特殊函数神经网络(SFNN)模型。 680-685 朝日友治 , 索拉·鸠山由纪夫 , Takashi Shimokawabe公司 , 小野直树 , 长谷川由塔 , 井田康弘 :
AMR-Net:用于多分辨率稳态流量预测的卷积神经网络。 686年至691年 泽维尔·阿吉拉尔 , 斯特凡诺·马尔基迪斯 :
用于等离子体模拟的基于深度学习的颗粒细胞方法。 692-697 李忠 , 丹尼斯·霍普 , 纳威罗周 , 奥列克桑德·谢尔巴科夫 :
HPC模拟和深度学习的混合工作流:材料行为确定的案例研究。 698-704 马丁·斯维丁 , 阿图尔·波多巴斯 , 史蒂文·魏德建 , 斯特凡诺·马尔基迪斯 :
希格斯玻色子分类:用StreamBrain进行受大脑启发的BCPNN学习。 705-710 阿卜杜拉·沙胡内斯·巴里女士 , 芭芭拉·查普曼 , 安东尼·柯蒂斯 , 罗伯特·哈里森 , 伊娃·西格曼 , 尼古拉·西蒙科夫 , 马修·琼斯 :
A64FX性能:Ookami体验。 711-718 萨拉特·斯利帕蒂 , 马克·泰勒 :
使用气候工作量对Fugaku A64FX架构进行早期评估。 719-727 三和子Tsuji , 佐藤三久 :
用于光纤Miniapp套件的A64FX多核处理器的性能评估和分析。 728-735 延斯·多姆克 :
A64FX-您的编译器必须由您决定! 736-740 法比奥·班切利 , 基里安·佩罗 , 吉勒姆·拉米雷斯-加加洛 , 琼·维尼亚尔斯 , 大卫·文森特 , 玛尔塔·加西亚-加苏拉 , 菲利波·曼托瓦尼 :
新兴技术集群:基于A64FX的生产HPC系统评估。 741-750 杰罗姆·古尔姆 , 马克森·凡德罗姆 , Miwako Tsuji公司 , 谢尔盖·G·佩蒂顿 , 佐藤三久 :
Fugaku A64FX处理器上的稀疏矩阵向量乘法序列。 751-758 卡尔·F·A·弗里贝尔 , 斯蒂芬妮·索尔达维尼 , 杰拉尔德·亨佩尔 , 克里斯蒂安·皮拉托 , 杰罗尼莫·卡斯特里隆 :
从领域特定语言到流体动力学的内存优化加速器。 759-766 尼克布朗 :
在Xilinx和Intel FPGA上为大气建模加速平流。 767-774 尼克布朗 , 马克·克莱松诺恩 , 奥利弗·汤姆森·布朗 :
通过采用数据流技术优化FPGA信用违约掉期引擎。 775-778 布拉德·格林 , 迪伦·托德 , 乔恩·卡尔霍恩 , 梅丽莎·史密斯 :
TIGRA:一个紧密集成的通用RISC-V加速器接口。 779-782 藤田北久 , 小林龙海 , 山口吉崎 , 大冢博库 :
用于FPGA上HPC应用的HBM2存储器系统。 783-786 宫岛高崎 , 肯塔罗·萨诺 :
Stratix 10 FPGA上单精度浮点FFT的内存空间分区提高了内存带宽。 787-790 乌梅祖直也 , 山口吉崎 , 大冢博库 :
具有负载平衡的基于FPGA的存储控制。 791-794 李玉亭 , 云旭 , 周学海 :
CVFCC:基于CV的云数据中心容器整合框架。 795-796 萨希尔·夏尔马 , 蓝志玲 , 吴兴福 , 瓦莱里·泰勒 :
适用于HPC应用程序的动态功率封顶库。 797-798 罗少恒 , 王磊(Lei Wang) , 刘玉峰 , 赵长海 , 张旭东 :
SDIS:采用ML方法的PB级地震数据索引系统。 799-800 艾克·马丁·阿尔瓦雷斯 , 何塞·伊格纳西奥·阿利亚加 , 玛丽亚·伊莎贝尔·卡斯蒂略 , 拉斐尔·梅奥 , 塞尔吉奥·伊塞尔特 :
MPI迭代法中的延展性实现。 801-802 陈邹 , 安德鲁·钱恩 , 罗伯特·加德纳 , 伊利亚·武科蒂奇 :
计算存储以提高二级HEP数据站点的分析能力。 803-804 Chan-Gyu Lee先生 , 玄武镇 :
支持NUMA的I/O系统调用指导。 805-806 米歇拉·托弗 , 埃瓦·迪尔曼 , 拉斐尔·费雷拉·达席尔瓦 , Trilce Estrada公司 , 玛丽·W·霍尔 , 米伦·利夫尼 :
高通量应用程序稳健科学路线图:开发人员的观点。 807-808 Menuka Warushavithana公司 , 萨普塔什瓦·米特拉 , 阿拉伯马兹达克 , F.杰·布雷特 , 桑米·李·帕利卡拉 , Shrideep Pallickara公司 :
使用Facebook Prophet进行时间序列预测的转移学习方案。 809-810 王玉阳 , 费雷 , 德尊侗族 :
探索多轨道Fat-tree中的节点连接模式。 811-812 王长虹 , 德尊侗族 , 王子聪 , 张晓云 , 赵振宇 :
RELAR:芯片网络自适应路由的强化学习框架。 813-814 萨普塔什瓦·米特拉 , 丹尼尔·拉姆 , Shrideep Pallickara公司 , 桑米·李·帕利卡拉 :
卫星数据可视化的生成方法。 815-816年 卢卡斯·雷茨 :
嵌套Fork-Join的负载平衡策略。 817-818 王晓亮 , 李建川 , 裴全金 , 郭宽冠 , 林元进 , Ming Zhao(赵铭) :
通过FaaS集群支持LSM树的弹性压缩。 819-820 加博尔·达尼尔·巴洛夫 , 伊斯特凡Z.Reguly :
用SYCL实现结构网格计算的自动并行化。 821-822 凯文·科尔比 , 肖恩·赖斯 :
Halcyon:统一HPC中心运营。 823-824 克什格 , 张一鸣(音) , 福永泉 , 赖志泉 , 小葛登 , 李东生 :
CASQ:使用基于草图的梯度量化加速分布式深度学习。 825-826 萨拉·纽沃思(Sarah Neuwirth) :
针对HPC环境中评估GASPI的综合基准套件。 827-828 特罗康·约翰逊 , 赫尔曼·林 :
将容错意识纳入系统级建模与仿真。 829-830