Linux 网络 - 基础概念
@TOC
零、前言
本章将开始对 Linux 网络编程进行系统的学习,而这篇主要学习网络的基本知识
一、计算机网络背景
概念:
网络本质是一个层状结构,同时也是操作系统的一部分
示图:
网络发展
独立模式:
计算机之间相互独立
示图:
网络互联
用户之间需要交互,在计算机层面即计算机之间数据需要进行交互:多台计算机连接在一起, 完成数据共享
示图:
局域网 LAN:
计算机数量更多了, 通过交换机和路由器连接在一起
示图:
广域网 WAN
将远隔千里的计算机都连在一起
示图:
注:所谓 "局域网" 和 "广域网" 只是一个相对的概念, 广域网也可以看做一个比较大的局域网
二、认识协议
概念:
协议本质上是一种约定
计算机之间的传输媒介是光信号和电信号,通过 "频率" 和 "强弱" 来表示 0 和 1 这样的信息,要想传递各种不同的信息,就需要约定好双方的数据格式
示图:
网络协议:
计算机生产厂商有很多,计算机操作系统也有很多,计算机网络硬件设备还是有很多,如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来,约定一个共同的标准大家都来遵守,这就是 网络协议
1、网络协议
协议分层:
因为网络本质就是一个层状结构,所以对于网络协议也需要进行分层制定协议,便于进行同层之间的数据交流
示例:打电话
注:实际的网络通信会更加复杂, 需要分更多的层次,而分层最大的好处在于 "封装",每层之间进行解耦,也就是可以很方便的进行替换任何一层协议,提高可维护性
2、OSI 七层模型
概念:
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范,把网络从逻辑上分为了 7 层,每一层都有相关、相对应的物理设备,比如路由器,交换机
OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输
它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整;通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯,但是它既复杂又不实用,实际中应用的是 TCP/IP 四层模型
示图:
3、TCP/IP 五层(或四层)模型
概念:
TCP/IP 是一组协议的代名词,它还包括许多协议,组成了 TCP/IP 协议簇
TCP/IP 通讯协议采用了 5 层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求
各层作用:
物理层: 负责光/电信号的传递方式,即硬件设备间的数据传输
比如现在以太网通用的网线(双绞线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的 wifi 无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层
数据链路层: 负责设备之间的数据帧的传送和识别
例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线 LAN 等标准。交换机(Switch)工作在数据链路层
网络层: 负责地址管理和路由选择,即决策数据传输的方向
例如在 IP 协议中, 通过 IP 地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层
传输层: 负责两台主机之间的数据传输,保障数据传输的可靠性
如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机
应用层: 负责应用程序间沟通,为用户进程提供服务
如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层
示图:
注意:
物理层我们考虑的比较少,因此很多时候也可以称为 TCP/IP 四层模型
一般而言,对于一台主机,它的操作系统内核实现了从传输层到物理层的内容;对于一台路由器,它实现了从网络层到物理层;对于一台交换机,它实现了从数据链路层到物理层;对于集线器,它只实现了物理层;但是并不绝对,很多交换机也实现了网络层的转发,很多路由器也实现了部分传输层的内容(比如端口转发)
三、网络传输基本流程
1、网络传输类型
同一个网段内的两台主机进行文件传输
同一个局域网内的主机是能够直接进行通信的
示图:
跨网段的主机的文件传输
数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器
示图:
注意:
以太网 Ethernet 、令牌环网、ATM 网、FDDI 网可以算作一类,按照传输技术来分类,属于 OSI 参考类型的数据链路层
以太网:就是指总线型网络,它的名字是从光学上得来的(科学家幻想出一中叫以太的物质),网络中大家共用一条信息通道,大家要传输数据就要等,只有网络空闲时才可以发送信息(同时传输会造成消息碰撞,也就成为了垃圾数据)
令牌环网:简单点理解就是,大家要想发信息就必须取得一个叫令牌的东西,令牌总线把总线形或树形网络中的各个工作站按一定顺序(如按接口地址大小)排列形成一个逻辑环,只有令牌持有者才能控制总线,才有发送信息的权力
对于跨网段的数据传输,由于链路层的不同网段存在不同的协议,为了保证数据传输的通畅,此时就需要路由器将数据包针对不同协议进行协议的替换,即数据报头的更换
路由器的第一个作用是分发数据,将数据从一个网段传输到另一个网段;第二个作用是对数据进行路由选择,即传输给哪一个网段
2、数据包封装和分用
基本概念:
不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame)
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation)
首部信息中包含了一些类似于首部有多长,载荷(payload)有多长(解决如何将数据包进行分离-解包),上层协议是什么等信息(解决将数据传输到哪里-分用)
数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部,根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理
经过封装和分用的过程,对于网络交互的接收和发送两方,每一层所看到的数据都是一样的
注:这里指的是 IP 层之上,因为 IP 层下的数据传输可能是在不同的网段传输,协议不同对应的报头数据也就不同
数据和报头的组合叫做数据包,而数据又被叫做有效载荷
其实在实际封装的过程中,不仅需要对数据进行添加报头,还需要解决报头和有效数据的分界问题,因为当数据包传送到对方的网卡上时,对方还需要进行解包
下图为数据封装的过程:
下图为数据分用的过程:
协议共性
提供一个将报头与有效载荷分离的方法
协议当中必须包含一个字段,表明应该将有效载荷交付给上层的哪个协议
3、局域网通信
局域网通信概念及过程:
在局域网中,所有的主机可以直接通讯
在数据链路层,有一个 mac 地址/ 网卡硬件地址/ 或者序列号,是唯一的
根据主机的 mac 地址确定是那一个主机发送的数据包,因为数据包的报头里存放了发出方以及接收方的 mac 地址,而如果其他的主机如果再接受到了该数据包,如果 mac 地址不匹配就会弃包,如果发到了对应的主机,成功接收后也能知道是谁发的数据
如果再局域网中有多台主机进行通信,是会发生数据碰撞的,多个主机同时往局域网中塞入数据,而数据之间发生了数据碰撞就会变成垃圾数据,对应的主机检测碰撞后进行等待再发送,避免再次碰撞
局域网广播通信:
在局域网中广播的实现条件是,将目标主机设计为约定好的 mac 地址在局域网中不存在的,所有主机都约定好这个地址是广播地址,广播地址一般是:0xffff,而所有的主机都可以收到由广播发送的数据包,并对他进行向上层交付
局域网交换机的作用:
会将某一个片区发生碰撞的数据包进行过滤,不再转发,只转发合法的数据帧,减低数据碰撞混乱的情况的概率
四、网络中的地址管理
1、认识 IP 地址
IP 协议有两个版本, IPv4 和 IPv6
IP 地址是在 IP 协议中, 用来标识网络中不同主机的地址
对于 IPv4 来说,IP 地址是一个 4 字节,32 位的整数
我们通常也使用 "点分十进制" 的字符串表示 IP 地址,例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255
2、认识 MAC 地址
MAC 地址用来识别数据链路层中相连的节点(局域网)
长度为 48 位, 即 6 个字节,一般用 16 进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
在网卡出厂时就确定了,不能修改,mac 地址通常是唯一的
注:虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突;也有些网卡支持用户配置 mac 地址
版权声明: 本文为 InfoQ 作者【可口也可樂】的原创文章。
原文链接:【http://xie.infoq.cn/article/2778788cdd9e6652707b267a6】。文章转载请联系作者。
评论