写点什么

用户观看视频业务出现花屏故障

发布于: 2020 年 12 月 13 日

1、组网情况

如图所示,Switch的一端和组播服务器相连,并且将GE1/0/0加入Eth-Trunk 0,另一端下挂用户终端,并且将GE1/0/2加入Eth-Trunk 1。在Switch上部署了组播业务,下挂用户终端可以进行视频点播。





2、现象描述

用户终端观看视频出现花屏现象。

3、原因分析

终端出现花屏的原因一般有丢包、重复包和报文乱序三种。对于花屏问题,一般是由于丢包或者重复报文导致的,而丢包的可能性又大于重复报文,因此首先判断设备上是否存在丢包现象,可以通过在上下游端口配置流量统计进行判断;也可以通过获取报文判断是否有丢包现象,同时也可以判断是否有重复报文的问题;

本问题通过获取报文发现为报文乱序导致。而报文乱序的原因为组播源在向Switch发送组播数据报文时,对端设备的Eth-trunk链路不是逐流转发,因此出现同一条组播流会从不同Eth-trunk端口进入Switch,此时就会出现乱序。这样在Switch上转发时,无法保证转发出去的报文的顺序,最终导致出现花屏的问题。

4、处理步骤

  1. 在Switch上配置流量统计,没有发现报文在Switch上被丢弃的问题。

  2. 在Switch下游获取报文发现报文存在乱序现象,导致接收终端无法正常处理报文。

  3. 观察对于同一条流,是否每个成员端口都有报文到Switch。

  4. 在Switch上游的Eth-turnk所有成员端口内配置端口镜像获取报文,如果每个端口都有流量进来,则说明Switch上转发时无法保证报文的顺序。

  5. 无法获取报文的情况下,则可以尝试Down掉Eth-trunk中的成员端口,只保留一个up的端口。如果之后问题可以解决,则确定是Switch从多个端口收到同一个组播流导致的。

5、解决方法

  1. Down掉Switch上游Eth-trunk端口的成员端口,在流量没有超过带宽的前提下只保留一个Up的端口,可以暂时规避该问题;

  2. 从Switch上游找问题的根本原因,保证同一条流只通过一个端口发到Switch上,彻底解决该问题。

6、总结

对于报文乱序的问题,由于在交换机上走的是硬件转发流程,一般不会出现在Switch上转发导致乱序的问题,需要从上游检查是否同一条流是从多个端口到达交换机。



用户头像

公众号:网络技术平台。分享网络技术和经验 2020.10.19 加入

公众号:网络技术平台。让学习变得更有趣,网络变得更简单。

评论

发布
暂无评论
用户观看视频业务出现花屏故障