泥巴

Slurm是一个开源的、容错的、高度可伸缩的集群管理和作业调度系统,适用于大小Linux集群。Slurm的操作不需要内核修改,而且相对独立。作为集群工作负载管理器,Slurm有三个关键功能。首先,它将对资源(计算节点)的独占和/或非独占访问权分配给用户一段时间,以便他们能够执行工作。其次,它提供了一个框架,用于启动、执行和监视一组已分配节点上的工作(通常是并行作业)。最后,它通过管理一个挂起的工作队列来仲裁资源争用。