Linux多线程开发

线程

01 线程概述

与进程(process) 类似，线程(thread) 是允许应用程序并发执行多个任务的一种机制。一个进程可以包含多个线程。同一个程序中的所有线程均会独立执行相同程序，且共享同一份全局内存区域，其中包括初始化数据段、未初始化数据段，以及堆内存段。(传统意义上的UNIX进程只是多线程程序的一个特例，该进程只包含一个线程)
进程是CPU分配资源的最小单位，线程是操作系统调度执行的最小单位。
线程是轻量级的进程(LWP：Light Weight Process)，在Linux 环境下线程的本质仍是进程。
查看指定进程的LWP号: ps -Lf pid

02 线程和进程区别

进程间的信息难以共享。由于除去只读代码段外，父子进程并未共享内存，因此必须采用一些进程间通信方式，在进程间进行信息交换。
调用fork()来创建进程的代价相对较高，即便利用写时复制技术，仍热需要复制诸如内存页表和文件描述符表之类的多种进程属性，这意味着fork()调用在时间上的开销依然不菲。
线程之间能够方便、快速地共享信息。只需将数据复制到共享(全局或堆)变量中即可。
创建线程比创建进程通常要快10倍甚至更多。线程间是共享虚拟地址空间的，无需采用写时复制来复制内存，也无需复制页表。

03 线程和进程虚拟地址空间

这是一个进程的虚拟地址空间，大多数资源都是各个线程所共享，但它的栈区和.text代码段分别被主线程、子线程1、子线程2......分成若干个部分，除了这些还有其他的非共享资源，详见下方。

04 线程之间共享和非共享资源

共享资源
进程ID和父进程ID
进程组ID和会话ID
用户ID和用户组ID
文件描述符表
信号处置
文件系统的相关信息：文件权限掩码(umask)、当前工作目录
虚拟地址空间(除了栈、.text)
非共享资源
线程ID
信号掩码
线程特有数据
error变量
实时调度策略和优先级
栈，本地变量和函数的调用链接信息

05 NPTL

当Linux最初开发时，在内核中并不能真正支持线程。但是它的确可以通过clone()系统调用将进程作为可调度的实体。这个调用创建了调用进程(calling process)的一个拷贝，这个拷贝与调用进程共享相同的地址空间。LinuxThreads项目使用这个调用来完全在用户空间模拟对线程的支持。不幸的是，这种方法有一些缺点，尤其是在信号处理、调度和进程间同步等方面都存在问题。另外，这个线程模型也不符合POSIX的要求。
NPTL，或称为Native POSIX Thread Library，是Linux线程的一个新实现，它克服了LinuxThreads的缺点，同时也符合POSIX的需求。与LinuxThreads相比，它在性能和稳定性方面都提供了重大的改进。
查看当前pthread库版本: getconf GNU_LIBPTHREAD_VERSION

06 线程操作

注意，以下所有函数编译时都要加上参数 -pthread。因为使用的是第三方库，这个参数相当于 -l pthread，指定pthread库

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
/*
功能：创建一个子线程。main函数是主线程，其他都是子线程。指令 man pthread_create 查看详情。
头文件：#include <pthread.h> 
参数：
    thread：传出参数，线程创建成功后，子线程的线程ID被写到该变量
    attr：设置线程的属性，一般使用默认值，传入NULL
    start_routine：函数指针，是子线程需要处理的逻辑代码
    arg：给第三个参数使用，给它传参
返回值：
    成功：0  
    失败：返回错误号。这里的错误号不能用perror打印错误信息。
        获取错误号的信息: char * strerror(int errnum);  
        strerror的头文件是#include <string.h>，指令 man strerror 查看详情。
*/

//子线程创建示例(头文件省略)：
void* callback(void *arg)
{
    printd("%d", *(int *)arg);    //将传进来的参数(这里参数原本是int型的)转换成int *，然后再解引用输出。
}

int main()
{
    pthread_t tid;
    int num = 0;
    int ret = pthread_create(&tid, NULL, callback, (void *)&num);  //创建子线程，将num转换成void *传递进去
    if (ret != 0)
    {
        char * errstr = strerror(int errnum);  
        printf("error : %s", errstr);
    }
    pthread_exit(NULL);    //主线程退出，不会影响其他正常运行的线程，退出后这一行后面的代码就不执行了，否则子线程可能还没执行，主线程就return了(相当于exit(0))，这样子线程就没机会执行了。
    return 0;
}


void pthread_exit(void *retval);
/*
功能：终止一个线程，在哪个线程中调用，就表示终止哪个线程。指令 man pthread_exit 查看详情。
头文件：#include <pthread.h> 
参数：
    retval：需要传递一个指针，作为一个返回值，可以在pthread_join()中获取到，如果不需要则传入NULL即可。
*/


pthread_t pthread_self(void);
/*
功能：获取线程ID，在哪个线程中调用，就表示获取哪个线程的ID。指令 man pthread_self 查看详情。
头文件：#include <pthread.h> 
返回值：
    调用此函数的线程的ID
*/


int pthread_equal(pthread_t t1, pthread_t t2);
/*
功能：比较两个线程的ID是否相等。不同的操作系统pthread_t类型的实现不一样，有的是无符号整型，有的是结构体，所以需要调用函数去比较。指令 man pthread_equal 查看详情。
头文件：#include <pthread.h> 
参数：
    t1：需要比较的第一个线程ID
    t2：需要比较的第二个线程ID
返回值：
    两个线程ID相同：返回一个非0值
    两个线程ID不同：返回0
*/

int pthread_join(pthread_t thread, void **retval);
/*
功能：和一个已经终止的线程进行连接，目的是回收子线程的资源。这个函数是阻塞函数，调用一次只能回收一个子线程，一般在主线程中使用。指令 man pthread_join 查看详情。
头文件：#include <pthread.h> 
参数：
    thread：需要回收的子线程的ID
    retval：接收子线程退出时的返回值。二级指针，子线程退出时不要传递栈区的数据，因为子线程退出了，栈区数据就没有了，所以返回值会是随机的。
返回值：
    0：成功
    非0：失败，返回的错误号
*/


int pthread_detach(pthread_t thread);
/*
功能：分离一个线程。被分离的线程在终止的时候，会自动释放资源返回给系统。指令 man pthread_detach 查看详情。
头文件：#include <pthread.h> 
    1.不能多次分离，会产生不可预期的行为。
    2.不能去连接一个已经分离的线程，会报错。
参数：需要分离的线程的ID
返回值：
    成功：0
    失败：返回错误号
*/


int pthread_cancel(pthread_t thread);
/*
功能：取消某个线程，可以终止某个线程的运行。指令 man pthread_cancel 查看详情。
头文件：#include <pthread.h> 
    目标线程是否以及何时响应取消请求取决于该线程控制的两个属性：其可取消状态(state)和类型(type)。这两个属性可以通过函数pthread_setcancelstate、pthread_setcanceltype设置，默认的值是允许取消、且当线程执行到一个取消点，线程才会终止
    取消点(cancellation point)：系统规定好的一些系统调用，我们可以粗略的理解为从用户区到内核区的切换(不保证一定是)，这个位置称之为取消点。所有取消点在 man pthreads 中查看。
参数：
    要取消的进程的ID
返回值：
    成功返回 0
    失败返回错误号
*/


int pthread_setcancelstate(int state, int *oldstate);
/*
功能：设置线程的可取消状态。指令 man pthread_setcancelstate 查看详情。
头文件：#include <pthread.h> 
参数：
    state：要设置的状态，必须包含下面两个值中的一个
        PTHREAD_CANCEL_ENABLE：线程可取消，默认值
        PTHREAD_CANCEL_DISABLE：线程不可取消，如果线程接收到了一个取消请求，那么取消请求将会阻塞直到线程的可取消状态被设置为可被取消
    oldstate：之前设置的状态，传出参数
返回值：
    成功返回 0
    失败返回非0的错误号
*/
int pthread_setcanceltype(int type, int *oldtype);
/*
功能：设置线程的可取消状态。指令 man pthread_setcanceltype 查看详情。
头文件：#include <pthread.h> 
参数：
    type：要设置的可取消类型
        PTHREAD_CANCEL_DEFERRED：当线程执行到一个取消点时，线程才会终止。默认值
        PTHREAD_CANCEL_ASYNCHRONOUS：线程可以在任一时刻被取消。通常接收到取消请求后立即取消线程，但是系统并不保证一定如此。
返回值：
    成功返回 0
    失败返回非0的错误号
*/

07 线程属性

int pthread_attr_init(pthread_attr_t *attr);
/*
初始化线程属性变量
*/


int pthread_attr_destroy(pthread_attr_t *attr);
/*
释放线程属性的资源
*/


int pthread_attr_getdetachstate(const pthread_attr_t *attr, int *detachstate);
/*
获取线程分离的状态属性
*/


int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);
/*
设置线程分离的状态属性
*/

其他函数指令 man pthread_attr + 两次Tab键查看。

线程同步

01 线程同步

线程的主要优势在于，能够通过全局变量来共享信息。不过，这种便捷的共享是有代价的：必须确保多个线程不会同时修改同一变量，或者某一线程不会读取正在由其他线程修改的变量。
临界区是指访问某一共享资源的代码片段，并且这段代码的执行应为原子操作，也就是同时访问同一共享资源的其他线程不应终端该片段的执行。
线程同步：即当有一个线程在对内存进行操作时，其他线程都不可以对这个内存地址进行操作，直到该线程完成操作，其他线程才能对该内存地址进行操作，而其他线程则处于等待状态。

02 互斥量

为避免线程更新共享变量时出现问题，可以使用互斥量(mutex 是mutual exclusion的缩写)来确保同时仅有一个线程可以访问某项共享资源。可以使用互斥量来保证对任意共享资源的原子访问。
互斥量有两种状态：已锁定(locked) 和未锁定(unlocked)。任何时候，至多只有一个线程可以锁定该互斥量。试图对已经锁定的某一互斥量再次加锁，将可能阻塞线程或者报错失败，具体取决于加锁时使用的方法。
一旦线程锁定互斥量，随即成为该互斥量的所有者，只有所有者才能给互斥量解锁。一般情况下，对每一共享资源(可能由多个相关变量组成)会使用不同的互斥量，每一线程在访问同一资源时将采用如下协议:
●针对共享资源锁定互斥量
●访问共享资源
●对互斥量解锁
如果多个线程试图执行这一块代码(一个临界区)，事实上只有一个线程能够持有该互斥量(其他线程将遭到阻塞)，即同时只有一个线程能够进入这段代码区域，如下图所示：

03 互斥量相关操作函数

互斥量的类型pthread_mutex_t

int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
/*
功能：初始化互斥锁。指令 man pthread_mutex_init 查看详情
头文件：#include <pthread.h>
参数：
    mutex：要初始化的互斥锁
    attr：需要设置的互斥锁的属性，不设置传入NULL即可
restrict关键字：关键字restrict只用于限定指针，该关键字用于告知编译器，所有修改该指针所指向内容的操作全部都是基于(base on)该指针的，即不存在其它进行修改操作的途径
    例：pthread_mutex_t *restrict mutex1 = xxx；
        对于指针mutex1指向的数据的修改只能是由mutex1这个指针来完成，假设pthread_mutex_t mutex2 = mutex1，mutex2是不能对指针指向的数据进行修改的
返回值：
    成功返回 0
    失败返回错误号
*/

int pthread_mutex_destroy(pthread_mutex_t *mutex);      //销毁互斥锁，释放资源

int pthread_mutex_lock(pthread_mutex_t *mutex);        //上锁

int pthread_mutex_trylock(pthread_mutex_t *mutex);    //尝试上锁

int pthread_mutex_unlock(pthread_mutex_t *mutex);     //解锁

04 死锁

有时，一个线程需要同时访问两个或更多不同的共享资源，而每个资源又都由不同的互斥量管理。当超过一个线程加锁同一组互斥量时，就有可能发生死锁。
两个或两个以上的进程在执行过程中，因争夺共享资源而造成的一种互相等待的现象，若无外力作用，它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁。
死锁的几种场景：

忘记释放锁
重复加锁
多线程多锁，抢占锁资源

05 读写锁

当有一个线程已经持有互斥锁时，互斥锁将所有试图进入临界区的线程都阻塞住。但是考虑一种情形，当前持有互斥锁的线程只是要读访问共享资源，而同时有其它几个线程也想读取这个共享资源，但是由于互斥锁的排它性，所有其它线程都无法获取锁，也就无法读访问共享资源了，但是实际上多个线程同时读访问共享资源并不会导致问题。
在对数据的读写操作中，更多的是读操作，写操作较少，例如对数据库数据的读写应用。为了满足当前能够允许多个读出，但只允许一个写入的需求，线程提供了读写锁来实现。
读写锁的特点：
如果有其它线程读数据，则允许其它线程执行读操作，但不允许写操作。
如果有其它线程写数据，则其它线程都不允许读、写操作。
写是独占的，写的优先级高。

06 读写锁相关操作函数

读写锁的类型pthread_rwlock_t

int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr);
int pthread_rwlock_destroy(pthread_rwlock_t *rwlock);
int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock);
int pthread_rwlock_unlock(pthread_rwlock_t *rwlock);

07 生产者消费者模型

08 条件变量

条件变量的类型pthread_cond_t
用法：线程正在访问某个线程间的共享数据，先利用mutex锁住，这时达到了这个数据达到某个值从而需要线程阻塞的时候，调用pthread_cond_wait一直阻塞(或pthread_cond_timedwait阻塞一定时间)，注意：调用pthread_cond_wait或pthread_cond_timedwait之前必须保证mutex已经上锁，pthread_cond_wait函数(或pthread_cond_timedwait函数)会先把当前的mutex解锁，之后其他线程就可以访问这块共享数据，当这个共享数据达到某个值需要唤醒等待这个共享数据的线程时，当前访问共享数据的线程就可以去调用pthread_cond_signal或pthread_cond_broadcast可以唤醒因pthread_cond_wait函数(或pthread_cond_timedwait)函数阻塞的线程。注意，虽然pthread_cond_wait或pthread_cond_timedwait会给mutex解锁，但是这只是底层的代码，编程的时候被唤醒的线程因为一开始锁住了mutex，所以还是需要再解锁一次。

//cond：要调用的条件变量
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);    //初始化一个条件变量。第一个参数是传出参数。第二个参数是需要设置的属性，传入NULL则代表使用默认属性
int pthread_cond_destroy(pthread_cond_t *cond);        //销毁一个条件变量，回收其资源
int pthread_cond_wait(pthread_cond_t * restrict cond, pthread_mutex_t *restrict mutex);    //一直阻塞，直到被pthread_cond_signal或pthread_cond_broadcast唤醒
int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict abstime);  //阻塞一定时间，这个时间由abstime决定，abstime = 当前自然时间 + 想要等待的时间
int pthread_cond_signal(pthread_cond_t *cond);    //唤醒数个线程，至少一个
int pthread_cond_broadcast(pthread_cond_t *cond);    //唤醒所有线程

09 信号量

信号量的类型sem_t
不能保证线程同步，需要与mutex结合使用。

int sem_init(sem_t *sem, int pshared, unsigned int value);  
/*
初始化一个未命名的信号量，
pshare：指定信号量的类型。如果其值为0，就表示这个信号量是当前进程的局部信号量(注意是进程，不是线程)，否则该信号量就可以在多个进程之间共享。
value：指定信号量的初始值。
*/
int sem_destroy(sem_t *sem);
int sem_wait(sem_t *sem) ;    //信号量大于0时 - 1，等于0时阻塞，直到这个信号量具有非0值。
int sem_trywait(sem_t *sem);    //当信号量的值非0时，信号 - 1。当信号量的值为0时，返回-1并设置errno为EAGAIN。
int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);
int sem_post(sem_t *sem);    //信号量 + 1
int sem_getvalue(sem_t *sem, int *sval);    //获取当前信号量的值

posted @ 2022-09-18 11:47 小肉包i 阅读(32) 评论(0) 收藏举报

刷新页面返回顶部