用户观看视频业务出现花屏故障
1、组网情况
如图所示,Switch的一端和组播服务器相连,并且将GE1/0/0加入Eth-Trunk 0,另一端下挂用户终端,并且将GE1/0/2加入Eth-Trunk 1。在Switch上部署了组播业务,下挂用户终端可以进行视频点播。
2、现象描述
用户终端观看视频出现花屏现象。
3、原因分析
终端出现花屏的原因一般有丢包、重复包和报文乱序三种。对于花屏问题,一般是由于丢包或者重复报文导致的,而丢包的可能性又大于重复报文,因此首先判断设备上是否存在丢包现象,可以通过在上下游端口配置流量统计进行判断;也可以通过获取报文判断是否有丢包现象,同时也可以判断是否有重复报文的问题;
本问题通过获取报文发现为报文乱序导致。而报文乱序的原因为组播源在向Switch发送组播数据报文时,对端设备的Eth-trunk链路不是逐流转发,因此出现同一条组播流会从不同Eth-trunk端口进入Switch,此时就会出现乱序。这样在Switch上转发时,无法保证转发出去的报文的顺序,最终导致出现花屏的问题。
4、处理步骤
在Switch上配置流量统计,没有发现报文在Switch上被丢弃的问题。
在Switch下游获取报文发现报文存在乱序现象,导致接收终端无法正常处理报文。
观察对于同一条流,是否每个成员端口都有报文到Switch。
在Switch上游的Eth-turnk所有成员端口内配置端口镜像获取报文,如果每个端口都有流量进来,则说明Switch上转发时无法保证报文的顺序。
无法获取报文的情况下,则可以尝试Down掉Eth-trunk中的成员端口,只保留一个up的端口。如果之后问题可以解决,则确定是Switch从多个端口收到同一个组播流导致的。
5、解决方法
Down掉Switch上游Eth-trunk端口的成员端口,在流量没有超过带宽的前提下只保留一个Up的端口,可以暂时规避该问题;
从Switch上游找问题的根本原因,保证同一条流只通过一个端口发到Switch上,彻底解决该问题。
6、总结
对于报文乱序的问题,由于在交换机上走的是硬件转发流程,一般不会出现在Switch上转发导致乱序的问题,需要从上游检查是否同一条流是从多个端口到达交换机。
评论