计算机科学>软件工程
标题: Nissist:基于故障排除指南的事件缓解应对策略
摘要: 有效的事件管理对于企业级云服务的顺利运行至关重要。 为了加快事故缓解,服务团队将故障排除知识编入待命工程师(OCE)可以访问的故障排除指南(TSG)中。 虽然自动化管道能够解决最常见和最容易发生的事件,但仍存在需要OCE干预的复杂事件。 然而,TSG通常是非结构化和不完整的,这需要OCE进行手动解释,导致随叫随到的疲劳和生产力下降,尤其是在新火OCE中。 在这项工作中,我们建议Nissist利用TSG和事故缓解历史提供前瞻性建议,减少人为干预。 日产借助大型语言模型(LLM),从非结构化TSG和历史事件缓解讨论中提取见解,形成全面的知识库。 其多代理系统设计提高了准确识别用户查询、检索相关信息和连续交付系统计划的能力。 通过我们的用户案例和实验,我们证明日产在事故缓解、减轻OCE操作负担和提高服务可靠性方面显著缩短了缓解时间(TTM)。 我们的演示位于 此https URL .