浅析C语言的非局部跳转:setjmp和longjmp

作者:李恩华  写于2012.4.22日凌晨西甲国家德比之前

C语言中有一个goto语句,其可以结合标号实现函数内部的任意跳转(通常情况下,很多人都建议不要使用goto语句,因为采用goto语句后,代码维护工作量加大)。另外,C语言标准中还提供一种非局部跳转“no-local goto",其通过标准库<setjmp.h>中的两个标准函数setjmplongjmp来实现。

C标准库<setjmp.h>

下面是KR的《C程序设计语言(第2 . 新版)》第232页给出的关于标准库<setjmp.h>的说明。

8 非局部跳转<setjmp.h>

头文件<setjmp.h>中的说明提供了一种避免通常的函数调用和返回顺序的途径,特别的,它允许立即从一个多层嵌套的函数调用中返回。

8.1 setjmp

#include <setjmp.h>
int setjmp(jmp_buf env);

setjmp()宏把当前状态信息保存到env中,供以后longjmp()恢复状态信息时使用。如果是直接调用setjmp(),那么返回值为0;如果是由于调用longjmp()而调用setjmp(),那么返回值非0。setjmp()只能在某些特定情况下调用,如在if语句、 switch语句及循环语句的条件测试部分以及一些简单的关系表达式中。

8.2 longjmp

#include <setjmp.h>
void longjmp(jmp_buf env, int val);

longjmp()用于恢复由最近一次调用setjmp()时保存到env的状态信息。当它执行完时,程序就象setjmp()刚刚执行完并返回非0值val那样继续执行。包含setjmp()宏调用的函数一定不能已经终止。所有可访问的对象的值都与调用longjmp()时相同,唯一的例外是,那些调用setjmp()宏的函数中的非volatile自动变量如果在调用setjmp()后有了改变,那么就变成未定义的。

jmp_bufsetjmp.h中定义的一个结构类型,其用于保存系统状态信息。宏函数setjmp会将其所在的程序点的系统状态信息保存到某个jmp_buf的结构变量env中,而调用函数longjmp会将宏函数setjmp保存在变量env中的系统状态信息进行恢复,于是系统就会跳转到setjmp()宏调用所在的程序点继续进行。这样setjmp/longjmp就实现了非局部跳转的功能。

一个简单的例子:

下面我们来看一个简单的例子。

 1 #include <stdio.h>
 2 #include <setjmp.h>
 3 
 4 jmp_buf jump_buffer;
 5 
 6 void func(void)
 7 {
 8          printf("Before calling longjmp\n");
 9          longjmp(jump_buffer, 1);
10          printf("After calling longjmp\n");
11 }
12 void func1(void)
13 {
14          printf("Before calling func\n");
15          func();
16          printf("After calling func\n");
17 }
18 int main()
19 {
20          if (setjmp(jump_buffer) == 0){
21                    printf("first calling set_jmp\n");
22                    func1();
23          }else {
24                    printf("second calling set_jmp\n");
25          }
26          return 0;
27 }

代码的运行结果如下

lienhua34@lienhua34-laptop:~/program/test$ ./test
first calling set_jmp
Before calling func
Before calling longjmp
second calling set_jmp 

通过上面这个简单例子的运行结果可以看出。main函数运行的setjmp()宏调用,将当前程序点的系统状态信息保存到全局变量jump_buffer中,然后返回结果0。于是,代码打印出字符串"first calling set_jmp",然后调用函数func1()。在函数func1中,先打印字符串"Before calling func",然后去调用函数func()。现在程序控制流转到func函数中,函数func先打印字符串“Before calling longjmp",然后调用函数longjmp这时候关键点到了!!!longjmp函数将main函数中setjmp()宏调用设置在全局变量jump_buffer中的系统状态信息恢复到系统的相应寄存器中,导致程序的控制流跳转到了main函数中setjmp()宏调用所在的程序点,此时相当于第二次进行setjmp()宏调用,并且此时的setjmp()宏调用的返回不再是0,而是传递给函数调用longjmp()的第二个参数1。于是程序控制流转到main函数中if语句的else部分执行,打印字符串“second calling set_jmp“。最后,执行main函数中的语句“reture 0;”返回,程序运行结束退出。

 

从上面的运行过程,我们可以看出在longjmp()函数调用处的程序点嵌套在三层函数调用中:main, func1func,但是longjmp()函数调用导致程序控制流跳过函数调用funcfunc1,直接回到main函数中setjmp()宏调用所在的程序点,然后执行main函数中后续的语句,从而忽略了函数func1func中后续的语句部分。这就是非局部跳转。

非局部跳转的实现机制

C语言的运行控制模型,是一个基于栈结构的指令执行序列,表现出来就是call/return: call调用一个函数,然后return从一个函数返回。在这种运行控制模型中,每个函数调用都会对应着一个栈帧,其中保存了这个函数的参数、返回值地址、局部变量以及控制信息等内容。当调用一个函数时,系统会创建一个对应的栈帧压入栈中,而从一个函数返回时,则系统会将该函数对应的栈帧从栈顶退出。正常的函数跳转就是这样从栈顶一个一个栈帧逐级地返回。

 

另外,系统内部有一些寄存器记录着当前系统的状态信息,其中包括当前栈顶位置、位于栈顶的栈帧位置以及其他一些系统信息(例如代码段,数据段等等)。这些寄存器指示了当前程序运行点的系统状态,可以称为程序点。在宏函数setjmp中就是将这些系统寄存器的内容保存到jmp_buf类型变量env中,然后在函数longjmp中将函数setjmp保存在变量env中的系统状态信息恢复,此时系统寄存器中指示的栈顶的栈帧就是调用宏函数setjmp时的栈顶的栈帧。于是,相当控制流跳过了中间的若干个函数调用对应的栈帧,到达setjmp所在那个函数的栈帧。这就是非局部跳转的实现机制,其不同于上面所说的call/return跳转机制。

 

正是因为这种实现机制,在上面的标准库说明中提到:“包含setjmp()宏调用的函数一定不能终止”。如果该函数终止的话,该函数对应的栈帧也已经从系统栈中退出,于是setjmp()宏调用保存在env中的内容在longjmp函数恢复时,就不再是setjmp()宏调用所在程序点。此时,调用函数longjmp()就会出现不可预测的错误。 

非局部跳转的运用

非局部跳转通常被用于实现将程序控制流转移到错误处理模块中;或者是通过这种非正常的函数返回机制,返回到之前调用的函数中。

 

最近,在我的毕业设计,我也采用了这种非局部跳转方式来实现错误处理机制。我的毕业设计是用C语言实现一个简单的scheme解析器,在该求值器对某个表达式的求值过程中可能遇到某个错误,导致这个表达式无效。此时,需要跳转到求值器的主循环开头,重新读取表达式,然后求值。于是,我的主循环框架就设计为:

while (1){
     if (setjmp(jump_buffer) == 0){
         /*读取表达式
            求值表达式
            打印表达式的值
        */
     }else {
         /* 进行错误处理,初始化求值环境 */
    }
}

其中,jump_buffer是一个jmp_buf类型的全局变量。循环开始时,if语句的条件判断中,setjmp保存程序点信息到全局变量jump_buffer中,此时setjmp()宏调用返回值为0,然后开始读取、求值表达式。当表达式求值遇到错误时,通过执行函数调用

longjmp(jump_buffer, 1);

就可以跳转到主循环的setjmp()宏调用所在程序点,而此时setjmp()宏调用的返回值为1,于是进入else部分进行错误处理,初始化求值环境。

 

上面只是我这两天为了实现我的毕业设计,而进行学习得到的一些知识。如有错误的地方,请各位看官指正,谢谢!

posted on 2012-04-22 12:35 lienhua34 阅读(...) 评论(...) 编辑 收藏

导航

公告