写点什么

Linux 多线程详解 —— 线程创建、终止、等待、分离

用户头像
赖猫
关注
发布于: 2021 年 03 月 03 日

线程创建


接口:int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine) (void *), void *arg);

参数解释


  • thread:线程标识符,是一个出参

  • attr:线程属性

  • star_routine:函数指针,保存线程入口函数的地址

  • arg:给线程入口函数传参


返回值:成功返回 0,失败返回 error number


详解:


  • 第一个参数是 pthread_t 类型的指针, 线程创建成功的话,会将分配的线程 ID 填入该指针指向的地址。 线程的后续操作将使用该值作为线程的唯一标识。

  • 第二个参数是 pthread_attr_t 类型, 通过该参数可以定制线程的属性, 比如可以指定新建线程栈的大小、 调度策略等。 如果创建线程无特殊的要求, 该值也可以是 NULL, 表示采用默认属性

  • 第三个参数是线程需要执行的函数。 创建线程, 是为了让线程执行一定的任务。 线程创建成功之后, 该线程就会执行 start_routine 函数, 该函数之于线程, 就如同 main 函数之于主线程。

  • 第四个参数是新建线程执行的 start_routine 函数的入参。


pthread_create 错误码及描述:



传入参数 arg 的选择


不要使用临时变量传参,使用堆上开辟的变量可以。


例:


#include <stdio.h>#include <stdlib.h>#include <pthread.h>#include <unistd.h>

void *ThreadWork(void *arg){ int *p = (int*)arg; printf("i am work thread:%p, data:%d\n",pthread_self(),*p); pthread_exit(NULL);}
int main(){ int i = 1; pthread_t tid; int ret = pthread_create(&tid,NULL,ThreadWork,(void*)&i);//不要传临时变量,这里是示范 if(ret != 0) { perror("pthread_create"); return -1; } while(1) { printf("i am main work thread\n"); sleep(1); } return 0;}
复制代码


线程 ID 以及进程地址空间


线程获取自身的 ID:


#include <pthread.h>pthread_t pthread_self(void);
复制代码


判断两个线程 ID 是否对应着同一个线程:


#include <pthread.h>int pthread_equal(pthread_t t1, pthread_t t2);
复制代码


返回为 0 时,则表示两个线程为同一个线程,非 0 时,表示不是同一个线程。


用户调用 pthread_create 函数时, 首先要为线程分配线程栈, 而线程栈的位置就落在共享区。 调用 mmap 函数为线程分配栈空间。 pthread_create 函数分配的 pthread_t 类型的线程 ID, 不过是分配出来的空间里的一个地址, 更确切地说是一个结构体的指针。


即:

线程注意点


线程 ID 就有可能会被复用:

1.线程退出。

2.线程组的其他线程对该线程执行了 pthread_join, 或者线程退出前将分离状态设置为已分离。

3.再次调用 pthread_create 创建线程。


线程创建出来的默认值


线程创建的第二个参数是 pthread_attr_t 类型的指针, pthread_attr_init 函数会将线程的属性重置成默认值。


线程属性及默认值:


如果确实需要很多的线程, 可以调用接口来调整线程栈的大小:


#include <pthread.h>int pthread_attr_setstacksize(pthread_attr_t *attr,size_t stacksize);int pthread_attr_getstacksize(pthread_attr_t *attr,size_t *stacksize);
复制代码


线程终止


线程终止,但进程不会终止的方法:


  • 入口函数的 return 返回,线程就退出了

  • 线程调用 pthread_exit(NULL),谁调用谁退出


#include <pthread.h>void pthread_exit(void *retval);
复制代码


参数:retval 是返回信息,”临终遗言“,可以给可以不给


该变量不能使用临时变量。


可使用:全局变量、堆上开辟的空间、字符串常量。


pthread_exit 和线程启动函数(start_routine) 执行 return 是有区别的。 在 start_routine 中调用的任何层级的函数执行 pthread_exit() 都会引发线程退出, 而 return, 只能是在 start_routine 函数内执行才能导致线程退出。


  • 其它线程调用了 pthread_cancel 函数取消了该线程


int pthread_cancel(pthread_t thread);


thread:线程标识符


调用该函数的执行流可以取消其它线程,但是需要知道其它线程的线程标识符,也可以执行流自己取消自己,传入自己的线程标识符。


如果线程组中的任何一个线程调用了 exit 函数, 或者主线程在 main 函数中执行了 return 语句, 那么整个线程组内的所有线程都会终止。


线程等待


线程等待接口


#include <pthread.h>int pthread_join(pthread_t thread, void **retval);
复制代码


调用该函数,该执行流在等待线程退出的时候,该执行流是阻塞在 pthread_joind 当中的。


线程等待和进程等待的不同


  1. 第一点不同之处是进程之间的等待只能是父进程等待子进程, 而线程则不然。线程组内的成员是对等的关系, 只要是在一个线程组内, 就可以对另外一个线程执行连接(join) 操作。

  2. 第二点不同之处是进程可以等待任一子进程的退出 , 但是线程的连接操作没有类似的接口, 即不能连接线程组内的任一线程, 必须明确指明要连接的线程的线程 ID


pthread_join()错误码:


为什么要等待退出的线程?


如果不连接已经退出的线程, 会导致资源无法释放。 所谓资源指的又是什么呢?


  1. 已经退出的线程, 其空间没有被释放, 仍然在进程的地址空间之内。

  2. 新创建的线程, 没有复用刚才退出的线程的地址空间。


如果不执行连接操作, 线程的资源就不能被释放, 也不能被复用, 这就造成了资源的泄漏。


纵然调用了 pthread_join, 也并没有立即调用 munmap 来释放掉退出线程的栈, 它们是被后建的线程复用了。 释放线程资源的时候, 若进程可能再次创建线程, 而频繁地 munmap 和 mmap 会影响性能, 所以将该栈缓存起来, 放到一个链表之中, 如果有新的创建线程的请求, 会首先在栈缓存链表中寻找空间合适的栈, 有的话, 直接将该栈分配给新创建的线程。


例:


#include <stdio.h>#include <stdlib.h>#include <pthread.h>#include <unistd.h>#include <sys/syscall.h>
void *ThreadWork(void *arg){ int *p = (int*)arg; printf("pid : %d\n",syscall(SYS_gettid)); printf("i am work thread:%p, data:%d\n",pthread_self(),*p); sleep(3); pthread_exit(NULL);}
int main(){ int i = 1; pthread_t tid; int ret = pthread_create(&tid,NULL,ThreadWork,(void*)&i);//不要传临时变量,这里是示范 if(ret != 0) { perror("pthread_create"); return -1; } pthread_join(tid,NULL);//线程等待 while(1) { printf("i am main work thread\n"); sleep(1); } return 0;}
复制代码


线程分离


接口:#include <pthread.h>

int pthread_detach(pthread_t thread);


默认情况下, 新创建的线程处于可连接(Joinable) 的状态, 可连接状态的线程退出后, 需要对其执行连接操作, 否则线程资源无法释放, 从而造成资源泄漏。


如果其他线程并不关心线程的返回值, 那么连接操作就会变成一种负担: 你不需要它, 但是你不去执行连接操作又会造成资源泄漏。 这时候你需要的东西只是:线程退出时, 系统自动将线程相关的资源释放掉, 无须等待连接。


可以是线程组内其他线程对目标线程进行分离, 也可以是线程自己执行 pthread_detach 函数。


线程的状态之中, 可连接状态和已分离状态是冲突的, 一个线程不能既是可连接的, 又是已分离的。 因此, 如果线程处于已分离的状态, 其他线程尝试连接线程时, 会返回 EINVAL 错误。


pthread_detach 错误码:


注意:这里的已分离不是指线程失去控制,不归线程组管,而是指线程退出后,系统会自动释放线程资源。若是线程组内的任意线程执行了 exit 函数,即使是已分离的线程,也仍会收到影响,一并退出。


小编推荐自己的Linux、C/C++技术交流群:【960994558】整理了一些个人觉得比较好的学习书籍、大厂面试题、和热门技术教学视频资料共享在里面(包括 C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK 等等.),有需要的可以自行添加哦!~



以上有不足的地方欢迎指出讨论,觉得不错的朋友希望能得到您的转发支持,同时可以持续关注我,每天分享 Linux C/C++后台开发干货内容!


用户头像

赖猫

关注

还未添加个人签名 2020.11.28 加入

纸上得来终觉浅,绝知此事要躬行

评论

发布
暂无评论
Linux 多线程详解 —— 线程创建、终止、等待、分离