监控目的

改进传统的定期巡检方式,对在线运行系统进行7x24小时实时不间断自动监控,

可随时了解到系统的整体运行情况及具体的性能指标。解放运维人员双手。

通过监控系统可做到:

  • 根据历史监控数据,对未来做出预测
  • 可对感兴趣的系统指标进行自定义监测并设置预警、报警阀值
  • 发生异常时,及时预警,报警。
  • 根据报警信息可及时定位问题
  • 可视化图表展示,便于直观获取信息

监控内容

大体包括如下内容

基础设施

交换机,路由器等

物理机

硬盘空间、cup利用率、内存利用率、 IO、 网络带宽、tcp连接情况、cpu温度,及物理及之间的网络延迟等。

基础服务

数据库,中间件(rabbitmq,redis,nginx, 等)

应用服务

如果开发语言是java 需要监控 jmx ,tomcat 等

监控系统选择

初期可选择比较成熟的 zabbix 监控系统

1、 架构较简单,web配置方式。上手较容易且功能强大,稳定。

2、 监控组建模版化,导入模版后可直接使用。

3、 自带绘图功能,获取到数值型的数据,可自动生成图,且支持用户组,方便多人管理使用。

zabbix-extensions

promethues

osquery

m/monit