后端开发【一大波干货知识】网络通信模型和网络 IO 管理
简单的 C/S 通信模型(accept 阻塞的话,就只能一个客户端接进来)
socket()函数
connect() 函数,用来向服务器建立连接
bind()函数,绑定地址
listen() 函数,将 sock 从一个主动套接字转为一个监听套接字
accept()函数,等待来自客户端的连接请求,到达监听描述符,然后在 adr 中填写客户端的套接字地址,并返回一个已连接描述符
一个类似以上模型的小故事:
socket 五元组标识 :<客户端地址,客户端端口,服务器地址,服务器端口,使用的协议 tcp/udp>,五元组中的任何一个元素发生变化都表示一个新的客户端 socket 连接。
C++后台开发系统学习地址:C/C++Linux服务器开发高级架构师/C++后台开发架构师
以下 C++后台开发学习资料,面试题,教学视频,C++后台开发学习路线图,免费分享有需要的可以自行添加:学习资料群720209036 自取
网络 IO
网络 IO 会涉及到两个系统对象,一个是用户空间调用 IO 的进程或线程,另一个是内核空间的内核系统,比如发生 IO 操作 read 时,它会经历两个阶段:
等待数据准备就绪(数据准备)
将数据从内核拷贝到进程或者线程中。(数据读写)
因为在以上两个阶段上各有不同的情况,所以出现了多种网络 IO 模型
阻塞,非阻塞,同步,异步
五种 IO 网络模型
阻塞 IO(blocking IO)linux 默认情况下都是阻塞 IO
当用户进程调用了 read 系统函数,内核就开始第一阶段数据的准备。对于网路 IO 来说,很多时候数据在一开始还没有到达(比如,还没有收到一个完整的数据包),这个时候 内核 就要等待足够的数据到来。而在用户进程这边,整个进程会被阻塞(数据一直没准备好,就会一直空占 CPU)。当 内核一直等到数据准备好了,它就会将数据从 内核 中拷贝到用户内存,然后 内核 返回结果,用户进程才解除 阻塞 的状态,重新运行起来。
非阻塞 (non-blocking IO)
从上图可以看出,应用进程调用了 read 函数之后,立刻就有结果返回,这个结果给用户判断结果是个 error 时,它就知道数据没有准备好,于是它再次发送 read 函数。直到内核中的数据准备好,并且又再次收到用户进程的 system call,那么它马上就将数据拷贝到用户内存,然后返回。所以非阻塞模式 IO 中,用户进程其实就是不断的主动询问内核数据准备好了没有。recv() 返回值大于 0 时,表示接受数据完毕,返回值既是接收到的字节数 recv() 返回 0,表示连接已正常断开;recv() 返回-1,且 errno 等于 EAGAIN,表示 recv 操作还没执行完成;如果 errno 不等于 EAGAIN,表示 recv 操作遇到系统错误 errno 设置非阻塞: fcntl( fd, F_SETFL, O_NONBLOCK ); 不推荐使用,因为循环调用 read(),会占用大量资源
IO 多路复用
当用户进程调用了 select,那么整个进程会被 block,而同时,kernel 会“监视”所 有 select 负责的 socket,当任何一个 socket 中的数据准备好了,select 就会返回。这个时候用户进程再调用 read 操作,将数据从 kernel 拷贝到用户进程。这个图和 blocking IO 的图其实并没有太大的不同,事实上还更差一些。因为这里需要使用两个系统调用(select 和 read),而 blocking IO 只调用了一个系统调用(read)。但是使用 select 以后最大的优势是用户可以在一个线程内同时处理多个 socket 的 IO 请求。用户可以注册多个 socket,然后不断地调用 select 读取被激活的 socket,即可达到在同一个线程内同时处理多个 IO 请求的目的。而在同步阻塞模型中,必须通过多线程的方式才能达到这个目的。(所以,如果处理的连接数不是很高的话,使用 select/epoll 的 web server 不一定比使用 multi-threading + blocking IO 的 web server 性能更好,可能延迟还更大。select/epoll 的优势并不是对于单个连接能处理得更快,而是在于能处理更多的连接。)
信号驱动 (signal-driven)
内核在第一阶段是异步,在第二个阶段是同步;于非阻塞 IO 的区别在于它提供了消息通知机制,不需要用户进程不断的轮询检查,减少了系统 API 的调用次数,提高效率
异步(asynchronous)
用户进程发起 read 操作之后,立刻就可以开始去做其它的事。而另一方面,从 kernel 的角度,当它受到一个 asynchronous read 之后,首先它会立刻返回,所以不会对用户进程产生任何 block。然后,kernel 会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel 会给用户进程发送一个 signal,告诉它 read 操作完成了。
总结:经上面的介绍,会发现 non-blocking IO 和 asynchronous IO 的区别还是很明显的。在 non-blocking IO 中,虽然进程大部分时间都不会被 block,但是它仍然要求进程主动的 check,并且当数据准备完成以后,也需要进程主动的再次调用 recvfrom 来将数据拷贝到用户内存。而 asynchronous IO 则完全不同。它就像是用户进程将整个 IO 操作都交给了内核去完成,然后内核做完后发信号通知。在此期间,用户进程不需要去检查 IO 操作的状态,也不需要主动的去拷贝数据。
评论