桂林山水甲天下

Jacquette的技术生活

C缺陷与陷阱读书笔记

C缺陷与陷阱读书笔记

近几日在读《C缺陷与陷阱》,把做的摘要贴上来,免的总是忘记

                                                                                   C缺陷与陷阱读书笔记

 程序设计错误实际上反映的是程序与程序员对该程序的“心智模式”两者的相异之处。(“心智模式”是“人们深值心中,对于周遭世界如何运作的看法和行为”)

                                                                                             第一章 语法“陷阱”
 程序中的单个字符鼓励看来并没有什么意义,只有结合上下文才有意义。
 编译器中负责将程序分解为一个一个符号的部分,一般称为“语法分析器”。
 
 1.1   =不同于==
 while (c='' || c==' ' || c==' ')
   c=getc(f);
 这个循环将一直进行到文件的结束,是否死循环取决于getc的实现。
        如果确实需要在条件判断部分使用赋值,应该显式地进行比较:
 if ((x=y)!=0)
   foo();
 
 1.2  & 和 | 不同于 && 和 ||

 1.3 语法分析中的“贪心法“
 当C编译器读入一个字符后又跟了一个字符,那么编译器就必须做出判断:是将其作为两个分别的符号对待,还是合起来作为一个符号对待。C语言对这个问题的解决方案可以归纳为一个很简单的规则:每一个符号应该包含尽可能多的字符。
 a---b 与 a -- - b 的含义相同,而与  a - -- b 的含义不同。

 1.4 整型常量
 如果一个整型常量的第一个字符是数字0,那么该常量将被视作八进制数。

 1.5 字符与字符串
 C语言中的单引号和双引号含义迥异,在某些情况下如果把两者弄混,编译器并不会检测报错,从而在运行是产生难以预料的结果。
 用单引号引起的一个字符实际上代表一个整数,整数值对应于该字符在编译器采用的字符集中的序列值。
 用双引号引起的字符串,代表的却是一个指向无名数字起始字符的指针,该数组被双引号之间的字符以及一个额外的二进制为零的字符''初始化。
 然而,某些C编译器对函数参数并不进行类型检查,特别是对printf函数的参数。因此,如果用
   printf(' ');
来代替正确的
   printf(" ");
则会在程序运行的时候产生难以预料的错误,而不会给出编译器诊断信息。
 整型数(一般为16位或32为)的存储空间可以容纳多个字符(一般为8位),因此有个C编译器允许在一个字符常量(以及字符串常量)中包括多个字符。也就是说,用'yes'代替"yes"不会被该编译器检测到。后者的含义是“一次包括'y''e''s'以及空字符''的4个连续内存单元的首地址“。前者的含义并没有准确的进行定义,但大多数编译器理解为,“一个整数值,由'y''e''s'所代表的整数值按照特定编译器实现中定义的方式组合得到“。
 (注:在Borland C++ v5.5 和 LCC v3.6中采取的做法是,忽略多余的字符,最后的整数值即第一个字符的整数值;而在Visual C++ 6.0 和 GCC v2.95中采取的做法是,依次用后一个字符覆盖前一个字符,最后得到的整数值即最后一个字符的整数值。)


                                                                                                  第二章 语法“陷阱”
 2.1 理解函数声明
 (*(void(*)())0) ();
 任何复杂表达式其实只有一条简单的规则:按照使用的方式来声明。
 任何C变量的声明都由两部分组成:类型以及一组类似表达式的声明符(declarator)。声明符从表面上看与表达式有些类似,对它求值应该返回一个声明中给定类型的结果。
 因为声明符与表达式的相似,所以我们也可以在声明符中任意使用括号:
 float ((f));
 这个声明的含义是:当对其求值时,((f))的类型为浮点类型,由此可以推知,f也是浮点类型。
 各种形式的声明还可以组合起来,就像在表达式中进行组合一样。因此,
 float *g(),(*h)();
 表示*g()与(*h)()是浮点表达式。因为()结合优先级高于*,*g()也就是*(g()):g是一个函数,该函数的返回值类型为指向浮点数的指针。同理,可以得出h是一个函数指针,h所指向函数的返回值为浮点类型。
 一旦我们知道了如何声明一个给定类型的变量,那么该类型的类型转换符就很容易得到了:只需要把声明中的变量名和声明末尾的分号去掉,再将剩余的部分用一个括号整个“封装”起来即可。例如,因为下面的声明:
 float (*h)();
 表示h是一个指向返回值为浮点类型的函数的指针,因此,
 (float (*)())
 表示一个“指向返回值为浮点类型的函数的指针”的类型转换符。
 (*fp)(); -> (*0)(); -> (*(void (*)())0)();

 2.2 运算符的优先级问题
 优先级最高者其实并不是真正意义上的运算符,包括:数组下标,函数调用操作符各结构成员选择操作符。他们都是自左于右结合,因此 a.b.c的含义是(a.b).c
 ()  []  ->  .
 单目运算符的优先级仅次于前述运算符。在所有的真正意义上的运算符中,它们的优先级最高。单目运算符是自右至左结合。因此*p++会被编译器解释成*(p++)。
 ! ~ ++ == = (type) * & sizeof
 优先级比单目运算符要低的,接下来就是双目运算符。在双目运算符中,算术运算符的优先级最高,移位运算符次之,关系运算符再次之,接着是逻辑运算符,赋值运算符,最后是条件运算符。
 *  /  %
 +  -
 <<  >>
 <  <=  >  >=
 == !=
 &
 ^
 |
 &&
 ||
 ?:
 我们需要记住的最重要的两点是:
 1.任何一个逻辑运算符的优先级低于任何一个关系运算符。
 2.移位运算符的优先级比算术运算符要低,但是比关系运算符要高。

 2.3 主义作为语句结束标志的分号
 2.4 关于switch语句
 case ' ':
   linecount++;
 case ' ':
 case '':
   .......
 2.5 函数调用
 f();是一个函数调用语句,而
 f; 计算函数f的地址,却并不调用该函数。
 2.6 “悬挂”else引发的问题
 if (x == 0)
   if (y == 0) error();
 else{
   z = x + y;
   f(&z);
 }
 
                                                                                                  第三章 “语义”陷阱

 3.1 指针和数组
 C语言中的数组值得注意的地方有以下两点:
 1.C语言中只有一维数组,而且数组的大小必须在编译期就作为一个常数确定下来。然而,C语言中数组的元素可以是任何类型的对象,当然也就可以是另外一个数组。
 (注:C99标准允许变长数组(VLA)。GCC编译器中实现了变长数组,但细节与C99标准不完全一致。)
 2.  对于一个数组,我们只能够做两件事:确定该数组的大小,以及获得指向该数组下标为0的元素的指针。其他有关数组的操作,哪怕他们看上去是以数组下标进行运算的,实际上都是通过指针进行的。换句话说,任何一个数组下标运算都等同于一个对应的指针运算,因此我们完全可以依据指针行为定义数组下标的行为。
 很多程序设计语言中都内建有索引运算,在C语言中索引运算是以指针算术的形式来定义的。
 如果一个指针指向的是数组中的一个元素,那么我们只要给这个指针加1,就能够得到指向该数组中下一个元素的指针。同样地,如果我们给这个指针减1,得到就是指向该数组中前一个元素的指针。
 int calendar[12][31];
 int *p;
 则p = calendar; 是非法的。因为calendar是一个二维数组,即“数组的数组”,在此处的上下文中使用calendar名称会将其转换为一个指向数组的指针;而p是一个指向整型变量的指针,这个语句试图将一种类型的指针赋值给另一种类型的指针。
 要构造一个指向数组的指针的方法:
 int calendar[12][31];
 int (*monthp)[31]; 
 monthp = calendar;
 这样,monthp将指向数组calendar的第一个元素,也就是数组calendar的12个有着31个元素的数组类型元素之一。

 3.2 非数组的指针
 在C语言中,字符串常量代表了一块包括字符串中所有字符以及一个空字符('')的内存区域的地址。
 假定我们有两个字符串s和t,我们希望将这两个字符串连接成单个字符串t。
 考虑:
 char *r,*malloc();
 r = mallor(strlen(s) + strlen(t));
 strcpy(r,s);
 strcat(r,t);
 这个例子的错误有3点:
 1,malloc函数有可能无法提供请求的内存。
 2,显式地分配了内存必须显式地释放内存。
 3,malloc函数并未分配足够的内存。
 正确是方法:
 char *r,*malloc();
 r = malloc(strlen(s) + strlen(t) + 1);
 if(!r) {
  complain();
  exit(1);
 }
 strcpy(r,s);
 strcat(r,t);
 
 /*一段时间之后*/
 free(r);

 3.3 作为参数的数组声明
 在C语言中,我们没有办法可以将一个数组作为函数参数直接传递。如果我们使用数组名作为参数,那么数组名会立刻被转换为指向该数组第1个元素的指针。
 因此,将数组作为函数参数毫无意义。所以,C语言中会自动地将作为参数的数组声明转换为相应的指针声明。
 
 3.4 避免“举x法”
 需要记住的是,复制指针并不同时复制指针所指向的数据。

 3.5 空指针并非空字符串
 出了一个重要的例外情况,在C语言中将一个整型转换为一个指针,最后得到的结果都取决于具体的C编译器实现。这个特殊的情况就是常数0,编译器保证由0转换而来的指针不等于任何有效的指针。
 #define Null 0
 需要记住的重要一点是,当常数0被转换为指针使用时,这个指针绝对不能被解除引用(dereference)。 换句话说,当我们将0赋值给一个指针变量时,绝对不能企图使用该指针所指向的内存中存储的内容。

 3.6 边界计算与不对称边界
 在所有常见的程序设计错误中,最难于察觉的一类是“栏杆错误”,也常被称为“差一错误”(off-by-one error)。
 避免“栏杆错误”的两个通用原则:
 (1) 首先考虑最简单情况下的特例,然后将得到的结果外推。
 (2) 仔细计算边界,绝不掉以轻心。
 用第一个入界点和第一个出界点来表示一个数值范围 能够降低这类错误发生的可能性。
 比如整数x满足边界条件x>=16且x<=37我们可以说x>=16且x<38,这里下界是“入界点”,即包括在取值范围之中;而上界是“出界点”,即不包括在取值范围之中。
 另一种考虑不对称边界的方式是,把上界视作某序列中第一个被占用的元素,而把下界视作序列中第一个被释放的元素。
 
 3.7 求值顺序
 C语言中只有四个运算符(&&, ||, ?: 和 ,)存在规定的求值顺序。运算符&&和运算符||首先对左侧操作数求值,只在需要时才对右侧操作数求值。运算符?:有三个操作数: 在a?b:c中,操作数a首先被求值,根据a的值首先被求值,根据a的值再求操作数b或c的值。而逗号运算符,首先对左侧操作数求值,然后该值被“丢弃”,再对右侧操作数求值。

 3.8 运算符&&, || 和 !
 运算符&和运算符&&不同,运算符&两侧的操作数必须被求值。

 3.9 整数溢出
 C语言中存在两类整数算术运算,有符号运算与无符号运算。在无符号算术运算中,没有所谓“溢出”一说:所有的无符号运算都是以2的n次方为模,这里n是结果中的位数。如果算术运算符的一个操作数是有符号整数,另一个是无符号整数,那么有符号整数会被转换为无符号整数,“溢出”也不可能发生。当两个操作数都是有符号整数时,“溢出”有可能发生。当一个运算的结果发生“溢出”时,作出任何假设都是不安全的。

 3.10 为函数main提供返回值
 一个返回值为整型的函数如果返回失败,实际上是隐含地返回了某个“垃圾”整数。只要该数值不被用到,就无关紧要。

posted on 2006-03-20 22:47  Jacquette.wang  阅读(563)  评论(0)    收藏  举报

导航