
holmesgpt
HolmesGPT
SRE Agent - CNCF Sandbox Project
AI 简介
HolmesGPT 是一个开源的AI代理,用于调查生产环境中的事故并找到根本原因。它支持多种技术栈,包括Kubernetes、虚拟机、云服务提供商、数据库和SaaS平台。项目的核心功能包括持续24/7运行的Operator模式,能够在问题影响到客户之前主动发现并通知运维团队;支持大规模数据处理与内存安全执行,确保在查询大型观测数据集时不会出现内存溢出;并且深度整合了Prometheus、Grafana等监控工具以及多种告警系统如AlertManager、PagerDuty等。此外,HolmesGPT兼容多种LLM(大语言模型)供应商,并且不要求必须使用Kubernetes,适用于任何基础设施。该工具非常适合需要提高系统可靠性和减少MTTR(平均修复时间)的企业级应用场景。
Python
Apache License 2.02.6k
Stars
373
Forks
26
Watchers
85
Issues
Star 增长
今日+2
近 7 天+50
近 30 天+218
综合评分93.72
默认分支master