20145233 《信息安全系统设计基础》第十三周学习总结

20145233 《信息安全系统设计基础》第十三周学习总结

教材学习总结

并发编程

  • 程序级并发——进程
  • 函数级并发——线程
  • 三种基本的构造并发程序的方法:

1、进程:每个逻辑控制流是一个进程,由内核进行调度,进程有独立的虚拟地址空间

2、I/O多路复用:逻辑流被模型化为状态机,所有流共享同一个地址空间

3、线程:运行在单一进程上下文中的逻辑流,由内核进行调度,共享同一个虚拟地址空间

基于进程的并发编程

  • 构造并发程序最简单的方法——用进程。常用函数如下:fork,exec,waitpid
  • 构造并发服务器:在父进程中接受客户端连接请求,然后创建一个新的子进程来为每个新客户端提供服务。
  • 需要注意的事情:

1.父进程需要关闭它的已连接描述符的拷贝(子进程也需要关闭)

2.必须要包括一个SIGCHLD处理程序来回收僵死子进程的资源

3.父子进程之间共享文件表,但是不共享用户地址空间

  • 独立地址空间的优点是防止虚拟存储器被错误覆盖,缺点是开销高,共享状态信息才需要IPC机制

基于I/O多路复用的并发事件驱动服务器

  • I/O多路复用可以用作事件并发驱动程序的基础。
  • 状态机:一组状态、输入事件、输出事件和转移。
  • 自循环:同一输入和输出状态之间的转移。

I/O多路复用技术的优劣

  • 相比基于进程的设计给了程序员更多的对进程行为的控制,运行在单一进程上下文中,每个逻辑流都能访问全部的地址空间,在流之间共享数据很容易。
  • 编码复杂,随着并发粒度的减小,复杂性还会上升。粒度:每个逻辑流每个时间片执行的指令数量。

创建线程

  • 创建线程:pthread_create函数,返回时参数tid包含新创建线程的ID
  • 查看线程ID:pthread_self函数,返回调用者的线程ID(TID)

终止线程

  • 一个线程是通过以下方式之一来终止的。
  • 当顶层的线程例程返回时,线程会隐式地终止。
  • 通过调用pthread_exit函数,线程会显式地终止void pthread_exit(void *thread_return);

回收已终止线程的资源

  • pthread_join函数等待其他线程终止
  • 这个函数会阻塞,知道线程tid终止,将线程例程返回的(void*)指针赋值为thread_return指向的位置,然后回收已终止线程占用的所有存储器资源

分离线程

  • 在任何一个时间点上,线程是可结合的,或是分离的。

  • 可结合的线程

    • 能够被其他线程收回其资源和杀死
    • 被收回钱,它的存储器资源没有被释放
    • 每个可结合线程要么被其他线程显式的收回,要么通过调用pthread_detach函数被分离
  • 分离的线程

    • 不能被其他线程回收或杀死
    • 存储器资源在它终止时由系统自动释放
    • pthread_detach函数可以分离可结合线程tid。
    • 线程能够通过以pthread_self()为参数的pthread_detach调用来分离他们自己。
    • 每个对等线程都应该在他开始处理请求之前分离他自身,以使得系统能在它终止后回收它的存储器资源。

用信号量同步线程

  • 共享变量的同时引入了同步错误,即没有办法预测操作系统是否为线程选择一个正确的顺序。
    进度图

  • 将n个并发线程的执行模型化为一条n维笛卡尔空间中的轨迹线,将指令模型化为从一种状态到另一种状态的转换。
    信号量

  • P(s):如果s是非零的,那么P将s减一,并且立即返回。如果s为零,那么就挂起这个线程,直到s变为非零。

  • V(s):将s加一,如果有任何线程阻塞在P操作等待s变为非零,那么V操作会重启线程中的一个,然后该线程将s减一,完成他的P操作。

  • 信号量不变性:一个正确初始化了的信号量有一个负值。

  • 信号量操作函数:

int sem_init(sem_t *sem,0,unsigned int value);//将信号量初始化为value
int sem_wait(sem_t *s);//P(s)
int sem_post(sem_t *s);//V(s)

使用信号量来实现互斥

  • 基本思想是将每个共享变量(或者一组相关的共享变量)与一个信号量s(初始为1)联系起来,然后用P和V操作将相应的临界区包围起来。
  • 几个概念
•二元信号量:用这种方式来保护共享变量的信号量叫做二元信号量,取值总是0或者1.
•互斥锁:以提供互斥为目的的二元信号量
•加锁:对一个互斥锁执行P操作
•解锁;对一个互斥锁执行V操作
•计数信号量:被用作一组可用资源的计数器的信号量
•禁止区:由于信号量的不变性,没有实际可能的轨迹能够包含禁止区中的状态。

利用信号量来调度共享资源

  • 信号量有两个作用:实现互斥;调度共享资源
  • 信号量分为:互斥信号量和资源信号量。
互斥信号量用于申请或释放资源的使用权,常初始化为1;
资源信号量用于申请或归还资源,可以初始化为大于1的正整数,表示系统中某类资源的可用个数。
  • 常见问题有生产者-消费者问题,和读者-写者问题

其他并发问题

  • 一个线程是安全的,当且仅当被多个并发线程反复的调用时,它会一直产生正确的结果。
  • 四个不相交的线程不安全函数类以及应对措施:
* 不保护共享变量的函数——用P和V这样的同步操作保护共享变量
* 保持跨越多个调用的状态的函数——重写,不用任何static数据。
* 返回指向静态变量的指针的函数——①重写;②使用加锁-拷贝技术。
* 调用线程不安全函数的函数——参考之前三种

代码调试学习总结

countwithmutex.c

  • 第一次编译时按照之前的方法编译,报错。根据错误提示,发现pthread库不是linux系统默认的库,联系看过的相关线程的部分,就很好理解。

  • 代码中涉及到的函数:
pthread_creat:创建线程,若成功则返回0,若失败则返回出错编号。第一个参数为指向线程标识符的指针,创建成功时指向的内存单元被设置为新创建线程的线程ID;第二个参数设置线程属性;第三个参数是线程运行函数的起始地址;最后一个参数是运行函数的参数

pthread_join:用来等待一个线程的结束。当函数返回时,被等待线程的资源被收回。

pthread_mutex_lock:线程调用该函数让互斥锁上锁。成功锁定时返回0,其他任何返回值都表示出现了错误。

pthread_mutex_unlock:与pthread_mutex_lock成对存在。释放互斥锁。
  • 程序首先定义了一个宏PTHREAD_MUTEX_INITIALIZER来静态初始化互斥锁。先创建tidA线程后运行doit函数,利用互斥锁锁定资源,进行计数,执行完毕后解锁。后创建tidB,与tidA交替执行。由于定义的NLOOP值为5000,所以程序最后的输出值为10000.程序的最后还需要分别回收tidAtidB的资源。

count.c

  • 这个代码用于与countwithmutex.c进行对比,差别在于本代码doit函数的for循环中没有引入互斥锁,只进行了单纯的计数,创建两个线程共享同一变量都实现加一操作。
  • 我看了代码最高赋值应该到5000就结束了,但是我的一直运行到5987,还不太清楚是为什么?

condvar.c

  • 这个代码演示的是生产者生产和消费者消费交替进行的过程。是线程间同步的一种情况。
  • 主函数中用srand(time(NULL))设置当前的时间值为种子,在后面的producerconsumer函数中调用rand()函数产生随机数。

cp_t.c

  • mmap函数

void* mmap(void* start,size_t length,int prot,int flags,int fd,off_t offset);

  • 将一个文件或者其他对象映射进内存。文件被映射到多个页上,如果文件的大小不是所有页的大小之和,最后一个页不被使用的空间将会清零。mmap在用户空间映射调用系统中作用很大。
  • 成功执行时,mmap()返回被映射区的指针,munmap()返回0.失败时,mmap()返回MAP_FAILED,munmap返回-1.
  • lseek函数
off_t lseek(int fd,off_t offset,int whence);

  • fd表示要操作的文件描述符,offset是相对于whence(基准)的偏移量,whence可以是SEEK_SET(文件指针开始),SEEK_CUR(文件指针当前位置),SEEK_END(文件指针尾)
  • lseek主要作用是移动文件读写指针,返回文件读写指针距文件开头的字节大小,若出错则返回-1.

createthread.c

  • 程序主要演示了创建线程函数pthread_create()函数的使用,用来打印进程和线程的ID

sieve.c

  • 第一次编译的时候出现了问题,就是没有sqrt的函数,我下意识地以为编译会自动调用常用的哭,但是math库不再里面,所以在编译的时候要加上-lm。

  • 但是后面又出现了段错误,还不清楚为什么。

semphore.c

  • sem_init函数
sem_init(sem_t *sem, int pshared, umsigned int value);

  • 函数初始化一个定位在sem的匿名信号量;pshared参数为0指明信号量是由进程内线程共享,若为非0值则信号量在进程之间共享;value参数指定信号量的初始值。
  • sem_init()成功时返回0;错误时返回-1,并把errno设置为合适的值。
  • sem_destroy()函数用于销毁由sem指向的匿名信号量。只有通过sem_init()初始化的信号量才应该使用该函数销毁。函数成功时返回0,错误时返回-1,并把errno设置为合适的值。
  • 这个函数和之前的condvar.c一样都是展示生产者和消费者交替工作的过程。区别是本程序实现生产或消费的过程是利用sem_wait()和sem_post(),它们的作用分别是从信号量的值减去一个“1”和从信号量的值加上一个“1”

share.c

  • 代码运行结果如下:

hello_multi.c

  • 程序中的print_msg()函数中:在printf后的fflush(stdout);说明要立刻将要输出的内容输出,每输出一次停1秒,并循环5次。
  • 代码运行如下:

hello_multi1.c

  • 代码只输出hello99

hello_single.c

  • 根据代码,先单独执行print_msg("hello");——输出5个hello,后输出5个带换行的world

twordcount.c

  • 因为我的虚拟机共享功能换了,所以老师给的txt没有放在虚拟机中,我就自己写了两个txt文件,但是就没有按照老师的来做,代码显示的词的数量就一直是0了。

twordcount1.c

twordcount2.c

twordcount3.c

twordcount4.c

代码托管链接

-代码托管链接

总结思考

  • 本周的学习任务还是蛮多的,首先书本上有两章的内容要看,并且还要看看去年学长学姐做得家庭作业,最后还要将老师给的代码都运行调试一遍。
  • 开始的时候,我先运行的代码,其中一些代码只能根据运行结果来判断代码的作用都是什么,再结合书上的内容,其中十二章刘念老师也讲了很多,在这门课程学了之后有了更深的感觉,其中很多知识在看了两遍之后结合代码的运行再有了深刻理解。

学习进度条

代码行数(新增/累积) 博客量(新增/累积) 学习时间(新增/累积) 重要成长
目标 5000行 24篇 350小时
第一周 0/0行 1/2 20小时
第二周 53/53行 1/3 25/45小时
第三周 130/183行 1/4 30/75小时
第四周 0/183行 0/4 5/80小时
第五周 158/341行 1/5 30/110小时
第六周 84/425行 2/7 30/140小时
第七周 209/634行 1/7 30/170小时
第八周 0/634行 2/9 25/195小时
第九周 83/717行 2/11 30/225小时
第十周 421/1138行 2/13 25/250小时
第十一周 1827/2965行 2/15 30/280小时
第十二周 0/2965行 3/18 20/300小时
第十三周 873/3838行 1/19 25/325小时

参考资料

-教学进程

  • 课本上两章的内容
  • 老师本周所给的代码、PPT等资料。
posted @ 2016-12-11 19:04  20145233韩昊辰  阅读(267)  评论(1编辑  收藏  举报