计算机科学>网络和互联网架构
标题: Homunculus:为数据中心网络自动生成高效的数据平面ML管道
摘要: 过去十年来,网络中对机器学习(ML)应用程序的支持有了显著改进。 公共数据集和可编程交换结构(包括对其进行编程的低级语言)的可用性为程序员部署网络内ML提供了一个完整的堆栈。然而,所涉及的工具的多样性, 再加上ML模型设计和超参数调整的复杂优化任务,同时遵守网络约束(如吞吐量和延迟),网络运营商有责任成为ML、网络设计和可编程硬件方面的专家。 ML和硬件的网络内工具和专业知识的这种多面性是ML成为当今网络主流的障碍。 我们介绍了Homunculus,这是一个高级框架,它使网络运营商能够以声明的方式而不是命令式的方式指定其ML需求。 Homunculus将训练数据和伴随的网络约束作为输入,并自动生成合适的模型并将其安装到底层交换硬件上。 它在编译器阶段执行模型设计空间探索、培训和平台代码生成,让网络运营商专注于获取高质量的网络数据。 我们对真实ML应用程序的评估表明,Homunculus生成的模型与手工调整的备选方案相比,F1得分提高了12%,而平均只需要30行单脚本代码。 我们进一步演示了生成的模型在新兴的每包ML平台上的性能,以展示其及时和实际的意义。