写点什么

网络故障的排错思路指南

发布于: 2021 年 02 月 28 日

网络故障是工作中最易常见的问题,尤其是各位网工们经常需要与网络打交道,那么如何才能进行网络排查,快速解决问题呢?有些基本的技术是必不可少的,今天小编就为大家整理了一些网络排错的知识,我们一起来看下!


温馨提示:本片文章较长,需要 10—20 分钟阅读,建议先码后看!


网络排错必备


为什么还要必备条件?因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上,而是一套系统的方法,如果没有这些条件,难以在项目中灵活运用,所以还是先看看这些基础的条件吧。


1.了解网络通信的基础设备和其对应的 OSI 层次


像交换机、三层交换机、路由器、防火墙这些最基本的网络设备应该要有些了解,尤其是它们对应的 OSI 层次以及作用,比如普通的二层交换机对应 OSI 七层模型中的数据链路层,它可以隔绝冲突域,同时可能通过虚拟局域网技术(VLAN)来隔绝广播域,二层交换机通过二层地址即 MAC 地址来实现数据帧的转发;再比如路由器,它对应网络层,可以提供路由寻址的功能等等。


2.了解中小型企业网络的基本架构


一般中小型企业网络的基本架构都是这样的:接入层--汇聚层--核心层--网络出口。



如果网络环境比较庞大,汇聚层和核心层都会有,像这里的话,一般小型网络,就直接没有汇聚层,不过思想是一样的。


下面讲的排错其实都是针对用户 PC 来说明的,事实上,数据中心中的网络排错也是类似的。不管网络环境多么复杂,其实简化下来跟这个都是差不多的。


3.知道常用的网络排错命令


如果用户使用的是 Windows 操作系统,那么下面的这些命令就很重要了:




这些命令都是网络排错和检查过程中会用到的基础命令。


4. 清楚知道网络排错的一个重要原则


网络排错,不就是要判断网络哪里出了问题,因此,你就必须要知道数据的走向。


所以这个重要的原则是:关注数据的走向。


下面讲的网络排错思路其实就是通过追踪数据的走向来一步步缩小网络故障点的,因此,时刻记住这一点非常非常重要!这也是为什么上面需要让你了解中小型企业网络的基本架构了。


网络排错基本思路


基本思路如下:


步骤一:检查物理链路是否有问题


步骤二:查看本机 IP 地址、路由、DNS 的设置是否有问题


步骤三:测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试 IP)


步骤四:测试 ping 公网 ip 的通畅情况(平时要记几个外部公网 ip)


步骤五:测试 DNS 的通畅情况,可以直接 ping 网站地址


网络排错详细步骤


为了更好的讲述网络排错的过程和思路,假设我们有下面的一个网络环境:




下面,我们就以上面这个网络环境为例子,详细介绍我们的网络排错思路,每一步要怎么做,每一步为什么要这样做以及这样做之后我们可以得到什么信息,都会做一个说明。


1. 检查物理链路是否有问题


这一步是我个人认为在做网络排错时必须要做的第一步!经常会听朋友说,领导的电脑上不了网,需要过去排错,搞了老半天,还发现不了问题,最后在几经绝望之时,竟然发现网线都没接上电脑。这就真的是悲剧了,浪费了很多时间不说,这样的网络排错思路本来就是有错误的,所以清晰的思路很重要,避免走弯路。


因为也许不是每个人都可以去机房查看交换机的接线情况,所以这一步,我们排查的重点范围就应该放在如下面图所示的地方:




在这一步,下面几点是需要注意排查的:


  • 确认电脑本身的网卡有没有问题


  • 确认接的网线有没有问题(检查水晶头、网线的连接、网线的质量)


  • 本机所连接的交换机(如果可以去机房查看的话)


如果上面这几点排查都没有问题了,那么就是该网络环境中的其他设备问题了。这一范围的排查相对比较简单,因为只涉及到物理链路的连接问题。


2. 查看本机 IP 地址、路由、DNS 的设置是否有问题


上面第一步,物理链路的排查没有问题了,也就是说,电脑接上网线之后,电脑有反应了,可以识别,但是网络还是不通,来到这一步,就应该先把注意的范围放在电脑的设置上面了。


这一步,我们关注的重点是:


(1) IP 地址设置


如果采用的是 DHCP 自动获取的方法,那么这时候只需要看自己本机的设置上有没有开启自动获取 IP 的设置以及有没有开启相关的服务;如果用的是静态 IP,那么就必须要注意 IP 地址的填写有没有错(一般网络管理人员给的)、IP 地址的子网掩码有没有问题(这很重要,对于静态 IP,很多人在这里设置错误)。


另外值得提的是,给电脑分配 ip 地址时,最好是绑定 mac 地址,避免用户私改 ip 地址,造成 ip 冲突。


一般可以用下面的命令查看:




(2) 路由设置


对于服务器、PC,一般是指默认网关的设置了;对于路由器本身或三层交换机,那就是静态路由或动态路由的设置问题了。


(3) DNS 设置


主要是要确保所设置的 DNS 服务器地址到底有没有提供域名解析服务或者是否出现了故障,你得设置一个正确的 DNS 服务器地址或可以自动获取。


在 windows 上面你可以通过下面的命令查看:




3. 测试网关或路由器的通畅情况


先测网关然后再测路由器,一级一级地测试。


在上面的网络环境中,在网络通的情况下,我们在电脑上使用命令 tracert -d 命令,会得到下面的结果:




通过这个测试结果,我们可以清楚地知道电脑在访问互联网时,数据的走向情况:




根据这个数据走向,我们就可以得到一个重要的思路,就是根据数据走向来检测网络的通畅情况!因此,我们可以分两步:



(1) 先测试电脑到网关 192.168.2.254 的通畅情况



我们可以在自己的电脑上自己 ping 网关的地址,看是否有响应




一般这样的判断方法是比较快的,但有时候,无论怎样都 ping 不通,那么则可能有以下的几种情况:


  • 网关设备做了禁止 ping 的设置


  • 网关接口或网关设备出现故障


对于 a,一般很少会在这些设备在做 ping 的限制操作,实在是没有太大的必要这样做,当然,网络安全等要求十分严格的除外。ping 通 192.168.2.254 网关后,再 ping 一下 172.16.13.1 以确认电脑到整个网关设备都没有问题。


对于 ping 不通的时候,我个人还建议在电脑上执行如下操作:arp -a :网关地址和网关的 mac 地址。




即查看电脑本身有没有获取到网关的 MAC 的地址,显然,如果没有网关的 MAC 地址,那也是不可能 ping 通网关的,在排除了前面电脑设置的问题后,你可以猜测是网关设备出了问题,这时就可以联系网络工程师对网关设备进行测试了。


(2) 测试到其它路由器的通畅情况


前面一步没有问题了,也就是电脑到网关通信正常了,再测试网关到出口路由器的通畅情况:




这里,我们使用 tracert -d 命令就可以了:




当然,如果发现不通,那么则可能是下面的情况:


· 网关设备与路由器之间的物理链路问题


· 网关设备与路由器之间的设置问题,比如路由协议、接口配置之类的


出现上面的情况,那就是网络工程师的问题了,当然,如果你是网络工程师,应该要马上查看一下设备的状态,看是不是设备哪里出现问题了。


上面的步骤完成了,假设你的出口路由器设置是没有问题的,比如 NAT 与默认路由等的设置没有问题,那么我们大致可以知道,内网的一个基本通信是正常的(至少你的电脑和出口路由器的通信没问题),我们就要看看电脑到底能不能访问互联网了。


测试 ping 公网 ip 的通畅情况


来到这一步的时候,就说明前面三步是没有问题的,也就是说,本地局域网络的通信是正常的,这时要做的就是判断本地局域网络与外网(公网)之间的通信有没有问题了:




这里采取的是直接 ping 公网地址的方法,是为了排除 DNS 的影响(万一你的 DNS 设置又有问题),至于要 ping 什么样的公网地址,个人建议是,可以 ping 一些没有禁止 ping 的公共 DNS 服务器地址,比如 114.114.114.114 和 8.8.8.8 的:




这样之后,基本上就可以确定网络是没有问题的了。能 ping 通外网,说明网络是没有问题的,当然,这里并没有提到出口放置防火墙的情况,实际上,思路是一致的,但是,你需要考虑的是,你的访问数据有没有被防火墙给过滤掉,是数据出去的时候过滤了,还是数据回来的时候过滤了?由于还要涉及到防火墙的设置,这里就不再提及了,只是仍要注意这一点就是了。


测试 DNS 的通畅情况


如题,可以直接 ping 网站地址,看有没有回显 IP 地址,至于通不通是另外一回事,只要可以回显 IP 地址,那么 DNS 就没有问题了,不过这里仍然要说一下 nslookup 这个命令,这是一个非常好用的命令,我平常自己在网络排错时,基本上都会用到:




当然也可以像下面这样使用:




使用 nslookup 命令,作用有二:


  • 帮你测试你设置的 DNS 服务器有没有问题


  • 在不考虑 DNS 服务器是否智能的前提下,你可以根据回显 IP 地址速度的快慢来大致判断 DNS 服务器的优劣情况


所以可以充分利用 nslookup 命令了。


所以对于网络排错的思路和一些基本命令的掌握还是很重要的,虽然单个命令的使用的功能不是特别大,但组合起来使用却是可以解决很多问题。


关注公众号:网络技术平台,回复 “ 资料 ” 获取视频、培训教程、实验手册、电子书。


评论

发布
暂无评论
网络故障的排错思路指南