监控的目标?
发现问题:当系统发生故障报警,我们会收到故障报警的信息。定位问题:故障邮件一般都会写某某主机故障、具体故障的内容,我们需要对报警内容进行分析。比如一台服务器连不上,我们就需要考虑是网络问题、还是负载太高导致长时间无法连接,又或者某开发触发了防火墙禁止的相关策略等,我们就需要去分析故障具体原因。解决问题:当然我们了解到故障的原因后,就需要通过故障解决的优先级去解决该故障。总结问题:当我们解决完重大故障后,需要对故障原因以及防范进行总结归纳,避免以后重复出现。
具体而言?
对系统不间断的实时监控:实际上是对系统不间断的实时监控(这就是监控);实时反馈系统当前状态:我们监控某个硬件、或者某个系统,都是需要能实时看到当前系统的状态,是正常、异常、或者故障。保证服务可靠性安全性:我们监控的目的就是要保证系统、服务、业务正常运行保证业务持续稳定运行:如果我们的监控做得很完善,即使出现故障,能时间接收到故障报警,在时间处理解决,从而保证业务持续性的稳定运行。