×

高性能计算环境中的系统级资源监控。 (英语) Zbl 1076.68513号

J.网格计算。1,第3期,273-289(2003年)。
摘要:低开销的资源监控是成功管理分布式高性能计算环境的关键,尤其是当应用程序具有明确的服务质量要求时。dproc系统级监视机制提供了有效监视系统级事件和向远程主机通知与其操作相关的事件的工具。作为Linux内核的扩展实现,dproc提供了几个关键功能。首先,利用熟悉的/proc虚拟文件系统,dproc使用从本地和远程主机收集的资源信息扩展了该接口。第二,为了可预测地捕获和分发监视信息,dproc使用了一种称为KECho的内核级组通信工具,该工具实现了事件和事件通道。第三,也是本文的重点,是dproc的资源监控运行时自定义功能,包括在远程操作系统内核中生成和部署监控功能。使用dproc,我们表明:(a)可以根据客户端的资源可用性(动态流管理)定制数据流,(b)通过动态变化的分布式监视(监视信息的动态过滤),可以在监视开销和应用程序质量之间保持适当的平衡,以及(c)通过在内核级别执行监控,所捕获的信息能够在考虑应用程序使用的多种资源的情况下进行决策。

MSC公司:

64岁以下 分布式系统
68平方米 计算机系统环境下的性能评估、排队和调度