告警知识库:连通性报警
2023-04-01 11:25:41
报警描述
业务[XXX],虚拟机[X.X.X.X],用途[XXX]连通性状态报警,状态为断开
说明
当出现连通性报警时,说明时从监控系统到各个业务主机不通,需要跟踪业务主机是否临时重启,或是由于该业务的IP已经下架不再使用,或是调整网络导致不通。
对于已下架的业务可以考虑对该IP进行永久忽略或是将该IP从联网设备中删除。
监控对象
在监控系统中录入到联网设备中的所有IP地址。
监控方式
通过ICMP协议监控
从监控系统ping各个联网设备的IP地址。命令为:
复制ping -w 2 -c 1 XXX.XXX.XXX.XXX
其中,XXX.XXX.XXX.XXX为IP地址。该命令执行一次对目标主机的ping操作,超时时间为2秒。
监控系统在该命令超时后,间隔一秒再ping一次,如果不通,间隔一秒再ping。如此循环5次。如果5次都不通,则会发出连通性报警。
连通性报警两分钟检测一次,恢复时间按照设备的监控时间间隔执行。
通过代理检测连通性
当无法通过ICMP协议检测连通性时,可通过监控代理检测其连通性。在目标设备安装监控代理后,监控代理每隔20秒会向监控系统发回心跳包。当心跳时间与系统当前时间相差较大时(2min~5min),会产生连通性报警。
注意:系统同时会通过连通性和监控代理检测连通性。只有两个途径都不通时,才会产生报警。
规则
默认为报警级别。
可通过报警策略进行配置。