|
近几日在读《C缺陷与陷阱》,把做的摘要贴上来,免的总是忘记
C缺陷与陷阱读书笔记
程序设计错误实际上反映的是程序与程序员对该程序的“心智模式”两者的相异之处。(“心智模式”是“人们深值心中,对于周遭世界如何运作的看法和行为”)
第一章 语法“陷阱” 程序中的单个字符鼓励看来并没有什么意义,只有结合上下文才有意义。 编译器中负责将程序分解为一个一个符号的部分,一般称为“语法分析器”。 1.1 =不同于== while (c='' || c==' ' || c==' ') c=getc(f); 这个循环将一直进行到文件的结束,是否死循环取决于getc的实现。 如果确实需要在条件判断部分使用赋值,应该显式地进行比较: if ((x=y)!=0) foo(); 1.2 & 和 | 不同于 && 和 ||
1.3 语法分析中的“贪心法“ 当C编译器读入一个字符后又跟了一个字符,那么编译器就必须做出判断:是将其作为两个分别的符号对待,还是合起来作为一个符号对待。C语言对这个问题的解决方案可以归纳为一个很简单的规则:每一个符号应该包含尽可能多的字符。 a---b 与 a -- - b 的含义相同,而与 a - -- b 的含义不同。
1.4 整型常量 如果一个整型常量的第一个字符是数字0,那么该常量将被视作八进制数。
1.5 字符与字符串 C语言中的单引号和双引号含义迥异,在某些情况下如果把两者弄混,编译器并不会检测报错,从而在运行是产生难以预料的结果。 用单引号引起的一个字符实际上代表一个整数,整数值对应于该字符在编译器采用的字符集中的序列值。 用双引号引起的字符串,代表的却是一个指向无名数字起始字符的指针,该数组被双引号之间的字符以及一个额外的二进制为零的字符''初始化。 然而,某些C编译器对函数参数并不进行类型检查,特别是对printf函数的参数。因此,如果用 printf(' '); 来代替正确的 printf(" "); 则会在程序运行的时候产生难以预料的错误,而不会给出编译器诊断信息。 整型数(一般为16位或32为)的存储空间可以容纳多个字符(一般为8位),因此有个C编译器允许在一个字符常量(以及字符串常量)中包括多个字符。也就是说,用'yes'代替"yes"不会被该编译器检测到。后者的含义是“一次包括'y''e''s'以及空字符''的4个连续内存单元的首地址“。前者的含义并没有准确的进行定义,但大多数编译器理解为,“一个整数值,由'y''e''s'所代表的整数值按照特定编译器实现中定义的方式组合得到“。 (注:在Borland C++ v5.5 和 LCC v3.6中采取的做法是,忽略多余的字符,最后的整数值即第一个字符的整数值;而在Visual C++ 6.0 和 GCC v2.95中采取的做法是,依次用后一个字符覆盖前一个字符,最后得到的整数值即最后一个字符的整数值。)
第二章 语法“陷阱” 2.1 理解函数声明 (*(void(*)())0) (); 任何复杂表达式其实只有一条简单的规则:按照使用的方式来声明。 任何C变量的声明都由两部分组成:类型以及一组类似表达式的声明符(declarator)。声明符从表面上看与表达式有些类似,对它求值应该返回一个声明中给定类型的结果。 因为声明符与表达式的相似,所以我们也可以在声明符中任意使用括号: float ((f)); 这个声明的含义是:当对其求值时,((f))的类型为浮点类型,由此可以推知,f也是浮点类型。 各种形式的声明还可以组合起来,就像在表达式中进行组合一样。因此, float *g(),(*h)(); 表示*g()与(*h)()是浮点表达式。因为()结合优先级高于*,*g()也就是*(g()):g是一个函数,该函数的返回值类型为指向浮点数的指针。同理,可以得出h是一个函数指针,h所指向函数的返回值为浮点类型。 一旦我们知道了如何声明一个给定类型的变量,那么该类型的类型转换符就很容易得到了:只需要把声明中的变量名和声明末尾的分号去掉,再将剩余的部分用一个括号整个“封装”起来即可。例如,因为下面的声明: float (*h)(); 表示h是一个指向返回值为浮点类型的函数的指针,因此, (float (*)()) 表示一个“指向返回值为浮点类型的函数的指针”的类型转换符。 (*fp)(); -> (*0)(); -> (*(void (*)())0)();
2.2 运算符的优先级问题 优先级最高者其实并不是真正意义上的运算符,包括:数组下标,函数调用操作符各结构成员选择操作符。他们都是自左于右结合,因此 a.b.c的含义是(a.b).c () [] -> . 单目运算符的优先级仅次于前述运算符。在所有的真正意义上的运算符中,它们的优先级最高。单目运算符是自右至左结合。因此*p++会被编译器解释成*(p++)。 ! ~ ++ == = (type) * & sizeof 优先级比单目运算符要低的,接下来就是双目运算符。在双目运算符中,算术运算符的优先级最高,移位运算符次之,关系运算符再次之,接着是逻辑运算符,赋值运算符,最后是条件运算符。 * / % + - << >> < <= > >= == != & ^ | && || ?: 我们需要记住的最重要的两点是: 1.任何一个逻辑运算符的优先级低于任何一个关系运算符。 2.移位运算符的优先级比算术运算符要低,但是比关系运算符要高。
2.3 主义作为语句结束标志的分号 2.4 关于switch语句 case ' ': linecount++; case ' ': case '': ....... 2.5 函数调用 f();是一个函数调用语句,而 f; 计算函数f的地址,却并不调用该函数。 2.6 “悬挂”else引发的问题 if (x == 0) if (y == 0) error(); else{ z = x + y; f(&z); } 第三章 “语义”陷阱
3.1 指针和数组 C语言中的数组值得注意的地方有以下两点: 1.C语言中只有一维数组,而且数组的大小必须在编译期就作为一个常数确定下来。然而,C语言中数组的元素可以是任何类型的对象,当然也就可以是另外一个数组。 (注:C99标准允许变长数组(VLA)。GCC编译器中实现了变长数组,但细节与C99标准不完全一致。) 2. 对于一个数组,我们只能够做两件事:确定该数组的大小,以及获得指向该数组下标为0的元素的指针。其他有关数组的操作,哪怕他们看上去是以数组下标进行运算的,实际上都是通过指针进行的。换句话说,任何一个数组下标运算都等同于一个对应的指针运算,因此我们完全可以依据指针行为定义数组下标的行为。 很多程序设计语言中都内建有索引运算,在C语言中索引运算是以指针算术的形式来定义的。 如果一个指针指向的是数组中的一个元素,那么我们只要给这个指针加1,就能够得到指向该数组中下一个元素的指针。同样地,如果我们给这个指针减1,得到就是指向该数组中前一个元素的指针。 int calendar[12][31]; int *p; 则p = calendar; 是非法的。因为calendar是一个二维数组,即“数组的数组”,在此处的上下文中使用calendar名称会将其转换为一个指向数组的指针;而p是一个指向整型变量的指针,这个语句试图将一种类型的指针赋值给另一种类型的指针。 要构造一个指向数组的指针的方法: int calendar[12][31]; int (*monthp)[31]; monthp = calendar; 这样,monthp将指向数组calendar的第一个元素,也就是数组calendar的12个有着31个元素的数组类型元素之一。
3.2 非数组的指针 在C语言中,字符串常量代表了一块包括字符串中所有字符以及一个空字符('')的内存区域的地址。 假定我们有两个字符串s和t,我们希望将这两个字符串连接成单个字符串t。 考虑: char *r,*malloc(); r = mallor(strlen(s) + strlen(t)); strcpy(r,s); strcat(r,t); 这个例子的错误有3点: 1,malloc函数有可能无法提供请求的内存。 2,显式地分配了内存必须显式地释放内存。 3,malloc函数并未分配足够的内存。 正确是方法: char *r,*malloc(); r = malloc(strlen(s) + strlen(t) + 1); if(!r) { complain(); exit(1); } strcpy(r,s); strcat(r,t); /*一段时间之后*/ free(r);
3.3 作为参数的数组声明 在C语言中,我们没有办法可以将一个数组作为函数参数直接传递。如果我们使用数组名作为参数,那么数组名会立刻被转换为指向该数组第1个元素的指针。 因此,将数组作为函数参数毫无意义。所以,C语言中会自动地将作为参数的数组声明转换为相应的指针声明。 3.4 避免“举x法” 需要记住的是,复制指针并不同时复制指针所指向的数据。
3.5 空指针并非空字符串 出了一个重要的例外情况,在C语言中将一个整型转换为一个指针,最后得到的结果都取决于具体的C编译器实现。这个特殊的情况就是常数0,编译器保证由0转换而来的指针不等于任何有效的指针。 #define Null 0 需要记住的重要一点是,当常数0被转换为指针使用时,这个指针绝对不能被解除引用(dereference)。 换句话说,当我们将0赋值给一个指针变量时,绝对不能企图使用该指针所指向的内存中存储的内容。
3.6 边界计算与不对称边界 在所有常见的程序设计错误中,最难于察觉的一类是“栏杆错误”,也常被称为“差一错误”(off-by-one error)。 避免“栏杆错误”的两个通用原则: (1) 首先考虑最简单情况下的特例,然后将得到的结果外推。 (2) 仔细计算边界,绝不掉以轻心。 用第一个入界点和第一个出界点来表示一个数值范围 能够降低这类错误发生的可能性。 比如整数x满足边界条件x>=16且x<=37我们可以说x>=16且x<38,这里下界是“入界点”,即包括在取值范围之中;而上界是“出界点”,即不包括在取值范围之中。 另一种考虑不对称边界的方式是,把上界视作某序列中第一个被占用的元素,而把下界视作序列中第一个被释放的元素。 3.7 求值顺序 C语言中只有四个运算符(&&, ||, ?: 和 ,)存在规定的求值顺序。运算符&&和运算符||首先对左侧操作数求值,只在需要时才对右侧操作数求值。运算符?:有三个操作数: 在a?b:c中,操作数a首先被求值,根据a的值首先被求值,根据a的值再求操作数b或c的值。而逗号运算符,首先对左侧操作数求值,然后该值被“丢弃”,再对右侧操作数求值。
3.8 运算符&&, || 和 ! 运算符&和运算符&&不同,运算符&两侧的操作数必须被求值。
3.9 整数溢出 C语言中存在两类整数算术运算,有符号运算与无符号运算。在无符号算术运算中,没有所谓“溢出”一说:所有的无符号运算都是以2的n次方为模,这里n是结果中的位数。如果算术运算符的一个操作数是有符号整数,另一个是无符号整数,那么有符号整数会被转换为无符号整数,“溢出”也不可能发生。当两个操作数都是有符号整数时,“溢出”有可能发生。当一个运算的结果发生“溢出”时,作出任何假设都是不安全的。
3.10 为函数main提供返回值 一个返回值为整型的函数如果返回失败,实际上是隐含地返回了某个“垃圾”整数。只要该数值不被用到,就无关紧要。
|