前言
网络慢、ping延时大或丢包等现象是网络运维中常见故障之一,如何精确定位故障原因,存在一定的难度和可行性,类似这类故障无法通过网管系统或Agent方式采集数据分析定位。
本案例是某高校门户网站间歇性故障分析过程,涉及到数据包重传分析,现整理并分享,希望对运维人员有所帮助和启发。
摘要
通过前面的多点采集分析,确定故障原因并非WAF所致。
本节进一步结合服务器端采集的报文,对比分析。
分析精确定位到故障对象,并详细剖析和解答了为何出现故障,以及故障又是如何恢复,为解决问题提供了明确指导和参考。
调整数据采集点
为了进一步精确定位问题位置,本次分析采用了多点采集数据的方式。如下图所示,分别在服务器,服务器汇聚交换机和WAF与核心交换机等3个位置采集数据。
便于记录,这里分别命名3个采集点为采集点1、采集点2和采集点3。
故障分析