我们知道监控非常对系统维护非常重要,现在最流行的监控系统有Zabbix、Nagios以及杂粮开源的Open-falcon。但是这么多系统基本上都是仅仅支持Linux系统的,对Windows支持也仅仅限于agent支持,监控的参数也有限。那么今天虫虫就给大家介绍一个Windows下的监控解决方案所有工具栈(Grafana,InfluxDB和Telegraf)全部支持在Windows实例上运行,而且安装部署也非常简单,基本上不用多费劲就能搞出一个高端大气上档次的监控系统。
本文将给大家介绍经典的监控架构及各组件的构成;最新版本的事件序列数据库InfluxDB(v1.7.7)及其数据采集组件Telegraf(1.11.1),Grafana监控系统安装配置。实例构建一个Windows服务监控Panel,包括cpu、内存和网络流量以及Windows服务的cpu性能组件。配置Grafana监控告警以及服务灾难告警演练。
监控架构
一套监控系统,一般情况下都由三部分组成,指标收集器、数据存储和可视化工具(UI界面):
指标收集器,用来获取系统或者Agent的监控项目数据,一般有监控Agent和一些数据搜集脚本构成。常见的数据指标收集器有ZabbixAgent,Telegraf,CollectD,StatsD,Datadog,Pushgetway以及可能其他收集指标的工具。
数据存储,用来存储监控数据的数据库、时间序列数据库等,比如Mysql、RRDtool、ElasticSearch以及本文中用到的InfluxDB等。
可视化工具:Zabbix的php前端,Nagios、Grafana,Chronograf等。
本文中监控架构如下图所示:
Telegraf将定期查询Windows性能计数器API获取Windows监控数据并将结果发送到InfluxDB数据库。Grafana通过InfluxDB数据接口查询数据并通过Dashboard展现出来,根据告警阈值发出告警。
系统部署
根据监控架构我们知道,主要要部署三个组件Telegraf、InfluxDB和Grafana。下面我们就分步骤说明他们部署和配置的过程。三种软件都可以通过其