背景:k8s集群部署后,急需可靠稳定低延时的集群监控报警系统,报警k8s集群正常有序运行,经过不断调研和测试,最终选择Prometheus+AlertManager+Grafana+prometheusAlert的部署方案,故障信息报警至钉钉群和邮件,如需要额外监控可部署pushgateway主动推送数据到Prometheus进行数据采集部署方案:Prometheus+AlertManager+Grafana+prometheusAlert+Dingding(可自行部署pushgateway)前提:k8s集群已经部署完毕,详细见使用kubeadm搭建生产环境的单master节点k8s集群部署一