【Linux线程】线程控制原语详细介绍

2024-08-08 17:14:10 浏览数 (2)

一、线程的概念

1. 什么是线程

线程就是 Light weight process ,LWP,轻量级进程,在Linux环境下它仍然是进程,一个进程内部可以有多个线程,默认情况下一个进程内部有一个线程。不同的是,进程有自己的进程控制块PCB,并且拥有自己独立的地址空间;而线程虽然也有线程控制块(这样来看,如果一个进程内有多个线程,那么进程内将有多个PCB),但是它没有独立的地址空间,而是共享空间,我们可以理解为在进程的虚拟空间中除了栈都是共享的(在实际编程中,线程一般就是一个函数,函数肯定要有自己的栈来运行)。也就是说,进程和线程最大的区别在于是否共享地址空间。在Linux环境下,线程是最小的执行单位,进程是最小的资源分配单位。

我们在进程间通信的时候,因为每个进程都有自己的进程地址空间,所以才要通过信号、管道等去传递数据。而线程共享存储空间(除栈外),所以通信就方便多了,在进程中定义一个全局变量就可以让所有线程去共享,来实现通信。通过线程可以把任务分解,同一个进程中不同线程同时执行不同的任务,大大提供了执行效率。但是,如果当前计算机只有一个CPU核心,多线程也就没意义了,因为线程执行的时候都要持有CPU。

2. Linux内核线程实现原理

在类Uinx系统中,早期是没有线程概念的,直到80年代才引入,借助进程机制实现出了线程的概念,因此在类Uinx系统中,线程和进程密切相关。

  • 首先线程是轻量级进程LWP,线程也有PCB,创建线程所使用的底层函数和进程一样,都是clone。
  • 从内核的角度来看,进程和线程是一样的,都有自己不同的PCB。
  • 进程中可以包含很多线程,并且进程至少包含一个线程。
  • 线程可以看作是寄存器和栈的集合。
  • 在Linux下,线程是最小的执行单位,进程是最小的资源分配单位。
  • 可以通过 ps -Lf pid 来查看指定线程的lwp号。

3. 线程的共享资源和非共享资源

3.1 共享资源

  • 文件描述符
  • 每种信号的处理方式
  • 当前工作目录
  • 用户ID和组ID
  • 内存地址空间,text段、data段、bss段、heap段、共享库。(也就是我们前面画过的进程地址空间示意图中,除了栈stack段以外的部分)

3.2 线程非共享资源

  • 线程ID
  • 处理器现场和栈指针(内核栈)
  • 独立的栈空间(用户空间栈)
  • errno变量,每个线程都有自己的errno,所以不能再像进程那样使用perror来打印,应该使用sterror函数打印。 char *strerror(int errnum); /*获取错误码对应的错误信息*/
  • 信号屏蔽字,多线程编程中,应尽量避免使用信号。
  • 调度优先级

4. 线程的优缺点

优点是可以提高程序的并发性,有效提高CPU利用率;并且开销小,多个线程共享进程的空间,数据之间的通信和共享更方便。

缺点是调试和编写工作繁琐,并且线程相关的库函数不稳定,对信号机制的支持不友好。这里要注意,线程都是库函数,在编译的时候都要加上一个参数 -pthread。

二、线程控制原语

因为线程都是库函数,所以编译的时候都要加一个-pthread选项,表示包含线程库,总之,编译线程相关的程序都要在gcc后面加参数 -pthread。Compile and link with -pthread. (有的时候是加-lpthread)

1. pthread_self函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

pthread_t pthread_self(void);     
  • 函数描述 The pthread_self() function returns the ID of the calling thread. 获得线程的pid,类似于进程中的getpid()。
  • 函数参数 void
  • 函数返回值 This function always succeeds, returning the calling thread’s ID.

2. pthread_create函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
  • 函数描述 The pthread_create() function starts a new thread in the calling process. 创建一个线程。
  • 函数参数
    • thread:它是一个传出参数,代表线程ID,一级指针做输出。
    • attr:代表线程属性
    • start_routine:回调函数
    • arg:线程执行回调函数时的参数
  • 函数返回值 On success, pthread_create() returns 0; on error, it returns an error number, and the contents of *thread are undefined.

示例:创建一个线程

代码语言:javascript复制
/************************************************************
  >File Name  : pth_test.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月25日 星期三 17时17分15秒
************************************************************/
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

void* th_print(void* arg)
{
    printf("th_print thread: %s, pid: %d, tid: %lun", (char*)arg, getpid(), pthread_self());
    return NULL;
}

int main(int argc, char* argv[])
{
    pthread_t tid;
    pthread_create(&tid, NULL, th_print, (void*)argv[1]);
    printf("main thread, pid: %d, tid: %lun", getpid(), pthread_self());
    sleep(1); /*不睡眠的话,进程退出了,线程还没结束就没了*/
    return 0;
}

可以看到进程ID是一样的,线程ID不同。

3. pthread_exit函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

void pthread_exit(void *retval);
  • 函数描述 The pthread_exit() function terminates the calling thread and returns a value via retval that (if the thread is joinable) is available to another thread in the same process that calls pthread_join(3). 退出一个线程,注意是退出线程。
  • 函数参数
    • retval:退出值
  • 函数返回值 This function does not return to the caller.

示例:线程的三种退出方式

代码语言:javascript复制
/************************************************************
  >File Name  : pth_test2.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月25日 星期三 17时17分15秒
************************************************************/
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

void* th_print(void* arg)
{
    printf("th_print thread: %s, pid: %d, tid: %lun", (char*)arg, getpid(), pthread_self());
    /*return NULL; */
    pthread_exit(NULL);
    /*exit(1); */
    /*三种退出方式是不一样的,前两个都是正常退出,只退出线程。
    线程中return表示退出线程,主线程中return代表退出进程。
    pthread_exit表示退出线程。
    而exit()是退出整个进程,所以在线程中应该使用前两种*/
}

int main(int argc, char* argv[])
{
    pthread_t tid;
    pthread_create(&tid, NULL, th_print, (void*)argv[1]);
    printf("main thread, pid: %d, tid: %lun", getpid(), pthread_self());
    sleep(5);
    printf("sleep end...n");
    pthread_exit(NULL);
    return 0;
}

4. pthread_join函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

int pthread_join(pthread_t thread, void **retval);
  • 函数描述 The pthread_join() function waits for the thread specified by thread to terminate. 线程回收函数,会阻塞等待线程结束。
  • 函数参数
    • thread:线程ID,pthread_create传出的第一个参数。
    • retval:二级指针做输出,传出线程退出的信息。
  • 函数返回值 On success, pthread_join() returns 0; on error, it returns an error number.

示例:线程回收

代码语言:javascript复制
/************************************************************
  >File Name  : join_test.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月25日 星期三 17时17分15秒
************************************************************/
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

void* th_print(void* arg)
{
    printf("th_print thread: %s, pid: %d, tid: %lun", (char*)arg, getpid(), pthread_self());
    sleep(3);
    printf("th_print thread endn");
    return (void*)101;
    /*pthread_exit((void*)101); 等效*/
}

int main(int argc, char* argv[])
{
    pthread_t tid;
    pthread_create(&tid, NULL, th_print, (void*)argv[1]);
    printf("main thread, pid: %d, tid: %lun", getpid(), pthread_self());
    void* ret;
    pthread_join(tid, &ret); /*线程回收函数是阻塞等待的
            只有等到线程结束了,才会执行下面的打印语句*/
    printf("th_print thread return: %dn", (int)ret);
    return 0;
}

编译执行,可以看到线程退出信息被返回。

5. pthread_detach函数与线程分离

5.1 pthread_detach函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

int pthread_detach(pthread_t thread);
  • 函数描述 The pthread_detach() function marks the thread identified by thread as detached. 实现线程分离。
  • 函数参数
    • thread:线程ID
  • 函数返回值 On success, pthread_detach() returns 0; on error, it returns an error number.

5.2 什么是线程分离

线程分离状态是指:指定该状态,那么线程将主动与主控线程断开关系。等到线程结束后,其退出状态不由其它线程获取,而是直接自己自动释放,多用于网络、多线程服务器等场合。设置线程分离既可以使用pthread_detach()函数,也可以使用pthread_create()函数参数attr来设置线程分离属性。

如果进程有线程分离机制,那么就不会再产生僵尸进程。僵尸进程的产生主要是由于进程终止后,大部分资源被释放,但是仍然有残留西元存在于系统中,导致内核认为该进程仍然存在。

一般情况下,线程终止后,其终止状态一直保留到其他线程调用pthread_join()获取它的状态为止。但是线程也可以被置为detach状态,这样的线程一旦终止就立刻回收它占用的所有资源,而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join(),因为这样调用会返回EINVAL错误。也就是说,如果一个线程已经调用了pthread_join()就不能再调用pthread_join()函数了。

代码语言:javascript复制
/************************************************************
  >File Name  : detach_test.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月25日 星期三 17时17分15秒
************************************************************/
#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>

void* th_print(void* arg)
{
    printf("th_print thread: %s, pid: %d, tid: %lun", (char*)arg, getpid(), pthread_self());
    sleep(3);
    printf("th_print thread endn");
    return (void*)101;
    /*pthread_exit((void*)101); 等效*/
}

int main(int argc, char* argv[])
{
    pthread_t tid;
    pthread_create(&tid, NULL, th_print, (void*)argv[1]);
    printf("main thread, pid: %d, tid: %lun", getpid(), pthread_self());
    pthread_detach(tid);
    sleep(6);
    int ret = 0;
    if((ret = pthread_join(tid, NULL)) > 0)
    {
        printf("pthread_join errno: %d, %sn", ret, strerror(ret));
    }
    return 0;
}

编译运行,可以看到pthread_join报错。

5.3 线程的分离状态

线程的分离状态决定一个线程以什么样的方式来终止自己。

  • 非分离状态:线程的默认属性是非分离状态,在这种情况下,原有的线程等待创建的线程结束。只有当pthread_join()函数返回时,创建的线程才算终止,才能释放自己占用的系统资源。
  • 分离状态:分离线程没有被其他线程所等待,自己运行结束了,线程也就终止了,马上释放系统资源。

设置分离状态的函数

  • 进程属性控制
代码语言:javascript复制
#include <pthread.h>

int pthread_attr_init(pthread_attr_t *attr); /*初始化属性*/
int pthread_attr_destroy(pthread_attr_t *attr); /*销毁属性*/
  • 设置属性分离态
代码语言:javascript复制
#include <pthread.h>

int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);
int pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate);

/*
PTHREAD_CREATE_DETACHED 设置分离
PTHREAD_CREATE_JOINABLE 需要pthread_join回收
*/

示例:设置分离状态属性

代码语言:javascript复制
#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <pthread.h>

void* th_print(void* arg)
{
    printf("th_print...n");
    return NULL;
}

int main()
{
    pthread_attr_t attr;
    pthread_attr_init(&attr);
    pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
    pthread_t tid;
    pthread_create(&tid, &attr, th_print, NULL);
    int ret;
    if((ret = pthread_join(tid, NULL)) > 0)
    {
        printf("pthread_join errno: %d, %sn", ret, strerror(ret));
    }
    pthread_attr_destroy(&attr);
    return 0;
}

需要注意的是,如果设置一个线程为分离状态,而这个线程运行又非常快,它很可能在pthread_create函数返回之前就终止了,它终止后就可能将线程号和系统资源移交给其它线程使用,这样调用pthread_create的线程就得到了错误的线程号。要避免这种情况的话可以采取一定的同步措施。最简单的方法之一就是在被创建的线程里调用pthread_cond_timedwait函数,让线程多等待一会,留出足够的时间让函数pthread_create返回。但是不能使用wait函数,因为它是让整个进程睡眠,无法达到线程同步的目的。

6. pthread_cancel函数与线程取消点

6.1 pthread_cancel函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

int pthread_cancel(pthread_t thread);
  • 函数描述 The pthread_cancel() function sends a cancellation request to the thread thread. 取消线程,被取消的线程退出值定义在Linux的pthread库中,常数PTHREAD_CANCELED的值是-1,在头文件pthread.h中它的定义为 #define PTHREAD_CANCELED ((void*)-1),也就是说,使用pthread_join回收被取消的线程时,得到的返回值是-1。
  • 函数参数
    • thread:线程ID,pthread_create传出的第一个参数。
  • 函数返回值 On success, pthread_cancel() returns 0; on error, it returns a non-zero error number.
代码语言:javascript复制
/************************************************************
  >File Name  : join_test.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月25日 星期三 17时17分15秒
************************************************************/
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

void* th_print(void* arg)
{
    while(1)
    {
        printf("th_print thread: %s, pid: %d, tid: %lun", (char*)arg, getpid(), pthread_self());
        sleep(1);
    }
    pthread_exit((void*)101); 
}

int main(int argc, char* argv[])
{
    pthread_t tid;
    pthread_create(&tid, NULL, th_print, (void*)argv[1]);
    printf("main thread, pid: %d, tid: %lun", getpid(), pthread_self());
    sleep(3);
    pthread_cancel(tid); /*杀死线程*/
    void* ret;
    pthread_join(tid, &ret); 
    printf("th_print thread return: %dn", (int)ret);
    return 0;
}

杀死线程的返回值是-1

6.2 什么是取消点

需要注意的是,线程取消并不是实时的,而是具有一定的延时,需要等待线程达到某个取消点(检查点)。就比如说我们停车,必须到达停车位才能停车,杀死线程的时候也并不是立马就杀死,而是等到达取消点了才能杀死。比如说在上面的程序中,如果我们th_print()函数改造为一个空虚循环,这个先杀就无法使用pthread_cancel()杀死了,因为没有取消点。

代码语言:javascript复制
void* th_print(void* arg)
{
    while(1)
    {
       ;
    }
    pthread_exit((void*)101); 
}

取消点就是线程检查是否被取消,并按照请求进行动作的一个位置。通常是一些系统调用creat、open、pause、close、read、write等,通过 man 7 pthreads 可以查看具备这些取消点的系统调用列表。可以认为,一个系统调用(陷入内核)就是一个取消点。如果没有取消点的话,可以通过调用 pthread_testcansel() 函数自行设置一个取消点。被取消的线程退出值定义在Linux的pthread库中,常数PTHREAD_CANCELED的值是-1,在头文件pthread.h中它的定义为 #define PTHREAD_CANCELED ((void*)-1),也就是说,使用pthread_join回收被取消的线程时,得到的返回值是-1。

7. pthread_equal函数

  • 头文件及函数原型
代码语言:javascript复制
#include <pthread.h>

int pthread_equal(pthread_t t1, pthread_t t2);
  • 函数描述 The pthread_equal() function compares two thread identifiers. 比较两个线程ID是否相等。官方推荐使用函数判断两个线程ID是否相等,而不是直接通过tip1=tid2来判断,因为未来Linux线程ID的类型pthread_t可能被修改为结构体实现。另外要注意的是,在一个进程内,线程ID可以唯一确定一个线程,但是在整个操作系统内就不可以了。而进程的PID在操作系统内是唯一的。
  • 函数参数
    • t1:线程1ID
    • t2:线程2ID
  • 函数返回值 If the two thread IDs are equal, pthread_equal() returns a non-zero value; otherwise, it returns 0.

三、线程使用注意事项

1. NPTL

  • NPTL就是 Native POSIX Thread Library;
  • 查看当前pthread库版本命令 getconf GNU_LIBPTHREAD_VERSION
  • 使用线程库时需要gcc指定 -pthread 或 -lpthread

2. 线程使用注意事项

  • 要想主线程退出其他线程不退出,主线程应调用pthread_exit。
  • 避免僵尸进程
    • 回收线程:pthread_join
    • 分离线程
      • pthread_detach
      • pthread_create指定分离属性
  • malloc和mmap申请的内存可以在其他线程中释放。
  • 应避免在多线程模型中调用fork,除非马上exec,子进程中只有调用fork的线程存在,其它线程在子进程中都pthread_exit。
  • 多线程中避免使用信号。
  • 线程创建的个数一般是:CPU核数*2 2

附:多线程创建

代码语言:javascript复制
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>

void th_func(void* num) /*不稳定*/
{
    int ret = (int)num;
    printf("thread %d, tid: %dn", num, pthread_self());
    return (void*)(ret 10);
}

int main(int argc, char* argv[])
{
    pthread_t tid[5];
    int i;
    for(i = 0; i < 5; i  )
    {
        pthread_create(&tid[i], NULL, th_func, (void*)i); /*传地址不可以*/
    }
    for(i = 0; i < 5; i  )
    {
        void* ret;
        pthread_join(tid[i], &ret);
        printf("thread %d, ret: %dn", i, (int)ret);
    }
    return 0;
}

0 人点赞