概述:
防控中心不断定义监测要求。综合考虑实际网络环境、机房环境、业务逻辑、资源数量等多方面因素,选择符合业务场景的监控系统Zabbix对服务器、数据库、平台系统业务进行监控,及时了解应用服务的运行状态,保证应用服务的正常运行。
目前,在信息时代,企业的业务越来越依赖于信息,而信息又依赖于各种IT资源。当IT资源出现故障时,可能会影响企业的业务。我们无法避免故障,但可以缩短故障造成的影响时间,这就需要一个稳定高效的监控系统。
第一,监督的作用
正所谓“没有监控就没有运维”,监控系统的地位不言而喻。无论你是系统的开发者还是用户,首先要明确:监控系统的目标是什么?能起到什么作用?
1.监控数据的实时采集:包括硬件、操作系统、中间件、应用程序等维度的数据。
2.监控状态实时反馈:通过对采集数据的多维度统计和可视化展示,实时反映被监控对象的状态是正常还是异常。
3.预见故障和报警:能够提前预测故障风险,及时发出报警信息。
4.辅助故障定位:故障发生时提供各种指标数据,辅助故障分析和定位。
5.辅助性能调优:为性能调优提供数据支持,比如慢SQL和接口响应时间。
6.辅助容量规划:为服务器、中间件、应用集群的容量规划提供数据支持。
7.辅助自动化运维:根据配置的SLA,为自动扩容或服务降级等智能运维提供数据支持。
二、一些常见的监测对象和指标
三。主流监控系统介绍
Zabbix:Zabbix是一个企业级开源解决方案,提供基于WEB接口的分布式系统监控和网络监控功能。Zabbix可以监控各种网络参数,保证服务器系统的安全运行;并为系统运维人员快速定位/解决各种存在的问题提供了强大的通知机制。
Prometheus:Prometheus是一个开源的系统监控和报警框架,既适用于服务器等硬件指标的监控,也适用于高动态面向服务架构的监控。普罗米修斯的多维数据采集和数据筛选查询语言对于现在流行的微服务来说也是非常强大的。普罗米修斯是为服务的可靠性而设计的。当服务失败时,它可以让您快速定位和诊断问题。
夜莺:夜莺是滴滴基础平台结合滴滴云RD和开源的企业级监控解决方案。旨在满足云原生时代企业的监控需求。南丁格尔在产品完备性、系统高可用、用户体验等方面满足企业级的要求,可以满足从几台机器到几十万台机器的不同规模用户的需求。云原生和裸机兼顾,支持应用监控和系统监控,插件机制灵活,插件丰富完善,具有高度的灵活性和可扩展性。
主流监控系统对比图
监控的目的是防患于未然。防控中心不断定义监测要求。综合考虑实际网络环境、机房环境、业务逻辑、资源数量等多方面因素,选择符合业务场景的监控系统Zabbix对服务器、数据库、平台系统业务进行监控,及时了解应用服务的运行状态,保证应用服务的正常运行。监控系统的建设是一个长期的任务,任何监控系统都不可能适用于所有场景。我们还需要考虑未来IT技术的发展趋势,在业务发展过程中同步开发监控系统,不断完善运维监控解决方案。
本文内容为原创,转载请注明出处!