监控介绍
监控目的
改进传统的定期巡检方式,对在线运行系统进行7x24小时实时不间断自动监控,
可随时了解到系统的整体运行情况及具体的性能指标。解放运维人员双手。
通过监控系统可做到:
- 根据历史监控数据,对未来做出预测
- 可对感兴趣的系统指标进行自定义监测并设置预警、报警阀值
- 发生异常时,及时预警,报警。
- 根据报警信息可及时定位问题
- 可视化图表展示,便于直观获取信息
监控内容
大体包括如下内容
基础设施
交换机,路由器等
物理机
硬盘空间、cup利用率、内存利用率、 IO、 网络带宽、tcp连接情况、cpu温度,及物理及之间的网络延迟等。
基础服务
数据库,中间件(rabbitmq,redis,nginx, 等)
应用服务
如果开发语言是java 需要监控 jmx ,tomcat 等
监控系统选择
初期可选择比较成熟的 zabbix 监控系统
1、 架构较简单,web配置方式。上手较容易且功能强大,稳定。
2、 监控组建模版化,导入模版后可直接使用。
3、 自带绘图功能,获取到数值型的数据,可自动生成图,且支持用户组,方便多人管理使用。
promethues
osquery
m/monit