摘要
国家可再生能源实验室。 2023.鹰计算系统。 国家可再生能源实验室。 2023年2月24日检索自 https://www.nrel.gov/hpc/eagle-system.html 谷歌学者 2021年,李静波、张兴军、李翰、季泽瑜、董晓社和胡成龙。 OKCM:使用在线学习改进高性能计算系统中的并行任务调度。 《超级计算杂志》77(2021),5960–5983。 谷歌学者 数字图书馆 斯科特·伦德伯格(Scott M Lundberg)和苏茵·李(Su-In Lee)。 2017年。解释模型预测的统一方法。 神经信息处理系统进展30(2017)。 谷歌学者 刘德米拉·普罗霍伦科娃(Liudmila Prokhorenkova)、格列布·古塞夫(Gleb Gusev)、阿列克桑德·沃罗贝夫(Aleksandr Vorobev)、安娜·维罗妮卡·多洛古什(Anna Veronika Dorogush)和安德烈·古林。 2018.CatBoost:无偏见的助推,具有分类功能。 神经信息处理系统进展31(2018年)。 谷歌学者 穆罕默德·塔纳什(Mohammed Tanash)、丹尼尔·安德烈森(Daniel Andresen)和威廉·徐(William Hsu)。 2021.AMPRO-HPCC:预测Slurm HPC集群资源的机器学习工具。 第十五届国际先进工程计算与科学应用会议。 20–27之间。 谷歌学者 穆罕默德·塔纳什(Mohammed Tanash)、杨惠晨(Huichen Yang)、丹尼尔·安德森(Daniel Andresen)和威廉·徐(William Hsu)。 2021.集成工作资源预测,以提高基于slurm的hpc系统的系统性能。 在高级研究计算方面的实践和经验。 1–8. 谷歌学者 Salah Zrigui、Raphael Y de Camargo、Arnaud Legrand和Denis Trystram。 2022.使用在线作业运行时分类改进批调度程序的性能。 J.并行和分布式计算。 164 (2022), 83–95. 谷歌学者 数字图书馆
建议
基于集成学习的高性能计算任务运行时间预测 HP3C 2020:2020年第四届高性能编译、计算和通信国际会议记录 在高性能计算作业调度系统中,准确预测作业运行时间可以有效利用集群计算过程中产生的空闲资源碎片,并对其进行回填,以提高调度性能。 因为。。。 混合调度平台:提高HPC调度性能的运行时预测可靠性感知调度平台 摘要 HPC作业调度算法的性能在很大程度上取决于作业运行时值的准确性。 先前的研究已经证实,用户提供的运行时和系统生成的运行时预测都不准确。 我们提议一个新的。。。 探索作业运行路径以预测多台生产超级计算机上的运行时间 摘要 超级计算机中提交了大量作业,作业管理系统通常用于调度这些作业和分配计算资源。 FCFS(First Come First Serve,先到先得)是一种流行的调度策略,作业“。。。 亮点 PREP将作业的运行路径作为支持运行时预测的新功能进行探索。