写点什么

Linux Socket 编程

用户头像
赖猫
关注
发布于: 2021 年 01 月 08 日

1、网络中进程之间如何通信?


本地的进程间通信(IPC)有很多种方式,但可以总结为下面 4 类:


  • 消息传递(管道、FIFO、消息队列)

  • 同步(互斥量、条件变量、读写锁、文件和写记录锁、信号量)

  • 共享内存(匿名的和具名的)

  • 远程过程调用(Solaris 门和 Sun RPC)


但这些都不是本文的主题!我们要讨论的是网络中进程之间如何通信?首要解决的问题是如何唯一标识一个进程,否则通信无从谈起!在本地可以通过进程 PID 来唯一标识一个进程,但是在网络中这是行不通的。其实 TCP/IP 协议族已经帮我们解决了这个问题,网络层的“ip 地址”可以唯一标识网络中的主机,而 传输层的“协议+端口”可以唯一标识主机中的应用程序(进程)。这样利用三元组(ip 地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。

使用 TCP/IP 协议的应用程序通常采用应用编程接口:UNIX BSD 的套接字(socket)和 UNIX System V 的 TLI(已经被淘汰),来实现网络进程之间的通信。就目前而言,几乎所有的应用程序都是采用 socket。


2、什么是 Socket?


上面我们已经知道网络中的进程是通过 socket 来通信的,那什么是 socket 呢?socket 起源于 Unix,而 Unix/Linux 基本哲学之一就是“一切皆文件”,都可以用“打开 open –> 读写 write/read –> 关闭 close”模式来操作。我的理解就是 Socket 就是该模式的一个实现,socket 即是一种特殊的文件,一些 socket 函数就是对其进行的操作(读/写 IO、打开、关闭),这些函数我们在后面进行介绍。

socket 一词的起源

在组网领域的首次使用是在 1970 年 2 月 12 日发布的文献IETF RFC33中发现的,撰写者为 Stephen Carr、Steve Crocker 和 Vint Cerf。根据美国计算机历史博物馆的记载,Croker 写道:“命名空间的元素都可称为套接字接口。一个套接字接口构成一个连接的一端,而一个连接可完全由一对套接字接口规定。”计算机历史博物馆补充道:“这比 BSD 的套接字接口定义早了大约 12 年。”


3、socket 的基本操作


既然 socket 是“open—write/read—close”模式的一种实现,那么 socket 就提供了这些操作对应的函数接口。下面以 TCP 为例,介绍几个基本的 socket 接口函数。

3.1、socket()函数


int socket(int domain, int type, int protocol);
复制代码


socket 函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而 socket()用于创建一个 socket 描述符(socket descriptor),它唯一标识一个 socket。这个 socket 描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。

正如可以给 fopen 的传入不同参数值,以打开不同的文件。创建 socket 的时候,也可以指定不同的参数创建不同的 socket 描述符,socket 函数的三个参数分别为:


  • domain:即协议域,又称为协议族(family)。常用的协议族有,AF_INET、AF_INET6、AF_LOCAL(或称 AF_UNIX,Unix 域 socket)、AF_ROUTE 等等。协议族决定了 socket 的地址类型,在通信中必须采用对应的地址,如 AF_INET 决定了要用 ipv4 地址(32 位的)与端口号(16 位的)的组合、AF_UNIX 决定了要用一个绝对路径名作为地址。

  • type:指定 socket 类型。常用的 socket 类型有,SOCK_STREAM、SOCK_DGRAM、 SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET 等等(socket 的类型有哪些?)。

  • protocol:故名思意,就是指定协议。常用的协议有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、 IPPROTO_TIPC 等,它们分别对应 TCP 传输协议、UDP 传输协议、STCP 传输协议、TIPC 传输协议(这个协议我将会单独开篇讨论!)。


注意:并不是上面的 type 和 protocol 可以随意组合的,如 SOCK_STREAM 不可以跟 IPPROTO_UDP 组合。当 protocol 为 0 时,会自动选择 type 类型对应的默认协议。


当我们调用 socket 创建一个 socket 时,返回的 socket 描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址。如果想要给它赋值一个地址,就必须调用 bind()函数,否则就当调用 connect()、listen()时系统会自动随机分配一个端口。


3.2、bind()函数


正如上面所说 bind()函数把一个地址族中的特定地址赋给 socket。例如对应 AF_INET、AF_INET6 就是把一个 ipv4 或 ipv6 地址和端口号组合赋给 socket。


int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
复制代码


函数的三个参数分别为:


  • sockfd:即 socket 描述字,它是通过 socket()函数创建了,唯一标识一个 socket。bind()函数就是将给这个描述字绑定一个名字。

  • addr:一个 const struct sockaddr *指针,指向要绑定给 sockfd 的协议地址。这个地址结构根据地址创建 socket 时的地址协议族的不同而不同,如 ipv4 对应的是:


struct sockaddr_in {    sa_family_t    sin_family; /* address family: AF_INET */    in_port_t      sin_port;   /* port in network byte order */    struct in_addr sin_addr;   /* internet address */};
/* Internet address. */struct in_addr { uint32_t s_addr; /* address in network byte order */};
复制代码


ipv6 对应的是:


struct sockaddr_in6 {     sa_family_t     sin6_family;   /* AF_INET6 */     in_port_t       sin6_port;     /* port number */     uint32_t        sin6_flowinfo; /* IPv6 flow information */     struct in6_addr sin6_addr;     /* IPv6 address */     uint32_t        sin6_scope_id; /* Scope ID (new in 2.4) */ };
struct in6_addr { unsigned char s6_addr[16]; /* IPv6 address */ };
复制代码


Unix 域对应的是:


#define UNIX_PATH_MAX    108
struct sockaddr_un { sa_family_t sun_family; /* AF_UNIX */ char sun_path[UNIX_PATH_MAX]; /* pathname */ };
复制代码


  • addrlen:对应的是地址的长度。


网络字节序与主机字节序


主机字节序就是我们平常说的大端和小端模式:不同的 CPU 有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引用标准的 Big-Endian 和 Little-Endian 的定义如下:


a) Little-Endian 就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。


b) Big-Endian 就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。


网络字节序:4 个字节的 32 bit 值以下面的次序传输:首先是 0~7bit,其次 8~15bit,然后 16~23bit,最后是 24~31bit。这种传输次序称作大端字节序。由于 TCP/IP 首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序,一个字节的数据没有顺序的问题了。


所以:在将一个地址绑定到 socket 的时候,请先将主机字节序转换成为网络字节序,而不要假定主机字节序跟网络字节序一样使用的是 Big-Endian。由于这个问题曾引发过血案!公司项目代码中由于存在这个问题,导致了很多莫名其妙的问题,所以请谨记对主机字节序不要做任何假定,务必将其转化为网络字节序再赋给 socket。


3.3、listen()、connect()函数


如果作为一个服务器,在调用 socket()、bind()之后就会调用 listen()来监听这个 socket,如果客户端这时调用 connect()发出连接请求,服务器端就会接收到这个请求。


int listen(int sockfd, int backlog);int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
复制代码


isten 函数的第一个参数即为要监听的 socket 描述字,第二个参数为相应 socket 可以排队的最大连接个数。socket()函数创建的 socket 默认是一个主动类型的,listen 函数将 socket 变为被动类型的,等待客户的连接请求。


connect 函数的第一个参数即为客户端的 socket 描述字,第二参数为服务器的 socket 地址,第三个参数为 socket 地址的长度。客户端通过调用 connect 函数来建立与 TCP 服务器的连接。


3.4、accept()函数


TCP 服务器端依次调用 socket()、bind()、listen()之后,就会监听指定的 socket 地址了。TCP 客户端依次调用 socket()、 connect()之后就想 TCP 服务器发送了一个连接请求。TCP 服务器监听到这个请求之后,就会调用 accept () 函数取接收请求,这样连接就建立好了。之后就可以开始网络 I/O 操作了,即类同于普通文件的读写 I/O 操作。


int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
复制代码


accept 函数的第一个参数为服务器的 socket 描述字,第二个参数为指向 struct sockaddr *的指针,用于返回客户端的协议地址,第三个参数为协议地址的长度。如果 accpet 成功,那么其返回值是由内核自动生成的一个全新的描述字,代表与返回客户的 TCP 连接。


注意:accept 的第一个参数为服务器的 socket 描述字,是服务器开始调用 socket()函数生成的,称为监听 socket 描述字;而 accept 函数返回的是 已连接的 socket 描述字。一个服务器通常通常仅仅只创建一个监听 socket 描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接 socket 描述字,当服务器完成了对某个客户的服务,相应的已连接 socket 描述字就被关闭。


3.5、read()、write()等函数


  • read()/write()

  • recv()/send()

  • readv()/writev()

  • recvmsg()/sendmsg()

  • recvfrom()/sendto()


我推荐使用 recvmsg()/sendmsg()函数,这两个函数是最通用的 I/O 函数,实际上可以把上面的其它函数都替换成这两个函数。它们的声明如下:


       #include <unistd.h>
ssize_t read(int fd, void *buf, size_t count); ssize_t write(int fd, const void *buf, size_t count);
#include <sys/types.h> #include <sys/socket.h>
ssize_t send(int sockfd, const void *buf, size_t len, int flags); ssize_t recv(int sockfd, void *buf, size_t len, int flags);
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen); ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);
ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags); ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
复制代码


read 函数是负责从 fd 中读取内容.当读成功时,read 返回实际所读的字节数,如果返回的值是 0 表示已经读到文件的结束了,小于 0 表示出现了错误。如果错误为 EINTR 说明读是由中断引起的,如果是 ECONNREST 表示网络连接出了问题。


write 函数将 buf 中的 nbytes 字节内容写入文件描述符 fd.成功时返回写的字节数。失败时返回-1,并设置 errno 变量。 在网络程序中,当我们向套接字文件描述符写时有俩种可能。1)write 的返回值大于 0,表示写了部分或者是全部的数据。2)返回的值小于 0,此时出现了错误。我们要根据错误类型来处理。如果错误为 EINTR 表示在写的时候出现了中断错误。如果为 EPIPE 表示网络连接出现了问题(对方已经关闭了连接)。


其它的我就不一一介绍这几对 I/O 函数了,具体参见 man 文档或者 baidu、Google,下面的例子中将使用到 send/recv。


3.6、close()函数


在服务器与客户端建立连接之后,会进行一些读写操作,完成了读写操作就要关闭相应的 socket 描述字,好比操作完打开的文件要调用 fclose 关闭打开的文件。


#include <unistd.h>int close(int fd);
复制代码


close 一个 TCP socket 的缺省行为时把该 socket 标记为以关闭,然后立即返回到调用进程。该描述字不能再由调用进程使用,也就是说不能再作为 read 或 write 的第一个参数。


注意:close 操作只是使相应 socket 描述字的引用计数-1,只有当引用计数为 0 的时候,才会触发 TCP 客户端向服务器发送终止连接请求。


4、socket 中 TCP 的三次握手建立连接详解


我们知道 tcp 建立连接要进行“三次握手”,即交换三个分组。大致流程如下:


  • 客户端向服务器发送一个 SYN J

  • 服务器向客户端响应一个 SYN K,并对 SYN J 进行确认 ACK J+1

  • 客户端再想服务器发一个确认 ACK K+1



图 socket 中发送的 TCP 三次握手


从图中可以看出,当客户端调用 connect 时,触发了连接请求,向服务器发送了 SYN J 包,这时 connect 进入阻塞状态;服务器监听到连接请求,即收到 SYN J 包,调用 accept 函数接收请求向客户端发送 SYN K ,ACK J+1,这时 accept 进入阻塞状态;客户端收到服务器的 SYN K ,ACK J+1 之后,这时 connect 返回,并对 SYN K 进行确认;服务器收到 ACK K+1 时,accept 返回,至此三次握手完毕,连接建立。


总结:客户端的 connect 在三次握手的第二个次返回,而服务器端的 accept 在三次握手的第三次返回。


5、socket 中 TCP 的四次握手释放连接详解



图 socket 中发送的 TCP 四次握手

图示过程如下:


  • 某个应用进程首先调用 close 主动关闭连接,这时 TCP 发送一个 FIN M;

  • 另一端接收到 FIN M 之后,执行被动关闭,对这个 FIN 进行确认。它的接收也作为文件结束符传递给应用进程,因为 FIN 的接收意味着应用进程在相应的连接上再也接收不到额外数据;

  • 一段时间之后,接收到文件结束符的应用进程调用 close 关闭它的 socket。这导致它的 TCP 也发送一个 FIN N;

  • 接收到这个 FIN 的源发送端 TCP 对它进行确认。


这样每个方向上都有一个 FIN 和 ACK。


6、一个例子(实践一下)



说了这么多了,动手实践一下。下面编写一个简单的服务器、客户端(使用 TCP)——服务器端一直监听本机的 6666 号端口,如果收到连接请求,将接收请求并接收客户端发来的消息;客户端与服务器端建立连接并发送一条消息。


服务器端代码:

服务器端


#include<stdio.h>#include<stdlib.h>#include<string.h>#include<errno.h>#include<sys/types.h>#include<sys/socket.h>#include<netinet/in.h>
#define MAXLINE 4096
int main(int argc, char** argv){ int listenfd, connfd; struct sockaddr_in servaddr; char buff[4096]; int n;
if( (listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1 ){ printf("create socket error: %s(errno: %d)\n",strerror(errno),errno); exit(0); }
memset(&servaddr, 0, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_addr.s_addr = htonl(INADDR_ANY); servaddr.sin_port = htons(6666);
if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){ printf("bind socket error: %s(errno: %d)\n",strerror(errno),errno); exit(0); }
if( listen(listenfd, 10) == -1){ printf("listen socket error: %s(errno: %d)\n",strerror(errno),errno); exit(0); }
printf("======waiting for client's request======\n"); while(1){ if( (connfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -1){ printf("accept socket error: %s(errno: %d)",strerror(errno),errno); continue; } n = recv(connfd, buff, MAXLINE, 0); buff[n] = '\0'; printf("recv msg from client: %s\n", buff); close(connfd); }
close(listenfd);}
复制代码


客户端代码:


客户端


#include<stdio.h>#include<stdlib.h>#include<string.h>#include<errno.h>#include<sys/types.h>#include<sys/socket.h>#include<netinet/in.h>
#define MAXLINE 4096
int main(int argc, char** argv){ int sockfd, n; char recvline[4096], sendline[4096]; struct sockaddr_in servaddr;
if( argc != 2){ printf("usage: ./client <ipaddress>\n"); exit(0); }
if( (sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0){ printf("create socket error: %s(errno: %d)\n", strerror(errno),errno); exit(0); }
memset(&servaddr, 0, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_port = htons(6666); if( inet_pton(AF_INET, argv[1], &servaddr.sin_addr) <= 0){ printf("inet_pton error for %s\n",argv[1]); exit(0); }
if( connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0){ printf("connect error: %s(errno: %d)\n",strerror(errno),errno); exit(0); }
printf("send msg to server: \n"); fgets(sendline, 4096, stdin); if( send(sockfd, sendline, strlen(sendline), 0) < 0) { printf("send msg error: %s(errno: %d)\n", strerror(errno), errno); exit(0); }
close(sockfd); exit(0);}
复制代码


当然上面的代码很简单,也有很多缺点,这就只是简单的演示 socket 的基本函数使用。其实不管有多复杂的网络程序,都使用的这些基本函数。上面的服务器使用的是迭代模式的,即只有处理完一个客户端请求才会去处理下一个客户端的请求,这样的服务器处理能力是很弱的,现实中的服务器都需要有并发处理能力!为了需要并发处理,服务器需要 fork()一个新的进程或者线程去处理请求等。


推荐自己的Linux技术交流群 整理了一些个人觉得比较好的学习书籍、大厂面试题、有趣的项目和热门技术教学视频资料共享在里面,有需要的可以自行添加哦!~


Github:0voice/developkit_set


/11·

用户头像

赖猫

关注

还未添加个人签名 2020.11.28 加入

纸上得来终觉浅,绝知此事要躬行

评论

发布
暂无评论
Linux Socket 编程