预习非数值数据的编码方式
一、逻辑值。
2.5.1逻辑值
正常情况下,每个字或其他可寻址单位(字节半字等)是作为一个整体数据单元看待的。但是,某些时候还需要将一个,位数掘看成由n个1位数据组成,每个取值为0或1.例如,有时需要存储一个布尔或二讲制数据阵列.阵列中的每项只能取值为1或0;有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时,就被认为是逻辑数据。因此n位二进制数可表示n个逻辑值。逻辑数据只能参加逻辑运算,并且是按位进行的,如按位“与”按位“或”、逻辑左移、逻辑右移等。
逻辑数据和数值数据都是一串0/1序列,在形式上无任何差异,需要通过指令的操作码类型来识别它们。例如,逻辑运算指令处理的是逻再双始,异不运算指令处理的是数值数据。
2.5.2西文字符
西文由拉丁字母、数字、标点符号及一些特殊符号组成,他们统称为字符,所有的字符集合叫做字符集。字符不能直接在计算机内部进行处理,因而也必须对其进行数字化编码。

(1)字符0~9这10个数字字符的高3位编码为011,低4位分别为0000~1001。当去48掉高3位时,低4位正好是0~9这10个数字的8421码。这样既满足了正常的排序关系,又有利于实现ASCII码与十进制数之间的转换。
(2)英文字母字符的编码值也满足正常的字母排序关系,而且大、小写字母的编码之间有简单的对应关系,差别仅在b,这一位上,若这一位为0,则是大写字母;若为1,则是小写字母。这使得大、小写字母之间的转换非常方便。
2.5.3汉字字符
汉字系统必须处理一下几种汉字代码:输入码、内码、子模和阵码
汉字的输入码:汉字输入码也称外码,是为将汉字输入到计算机设计的代码。汉字输入码种类较多,选择不同的输入码方案,则输入的方法及按键次数、输入速度均有所不同。综合起来,汉字输入码可分为流水码、拼音类输入法、拼形类输入法和音形结合类输入法几大类。
汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。对于西文字符,它的内码就是ASCII码。
对于汉字内码的选择,必须考虑以下几个因素:
1.不能有二义性,即不能和ASCII码有相同的编码。
2.要与汉字在字库中的位置有关系,以便于与汉字的处理、查找。
3.编码应尽量短。
2.6数据的宽度和存储
计算机内部任何信息都被表示成二进制编码形式。二进制数据的每一位(或1)是组成二进制信息的最小单位,称为一个比特(bit),或称位元,简称位。比特是计算机中处理、存储和传输信息的最小单位。
字长等于CPU内部用于整数运算的运算器位数和通用寄存器宽度。
字和字长概念不同,字用来表示被处理信息的单位,用来度量各种类型的宽度。

由此可见,同一类型的数据并不是所有机器都采用相同的数据宽度,分配的字节数随机器和编译器不同而不同。
2.7数据校验码
数据在计算机内部进行计算、存取和传送过程中,由于元器件故障或噪音干扰等原因会出现差错。为了减少和避免这些错误,一方面要从计算机硬件本身的可靠性入手,在电路、电源、布线等各方面采取必要的措施,提高计算机的抗干扰能力;另一方面要采取相应的数据检错和校正措施,自动地发现并纠正错误。

奇偶校验码·
最简单的校验方法实现步骤如下:

海明校验码
海明效验是分组奇偶效验,单纠错码(SCE)只能纠正一位错,“纠一检二”码(SEC-DED)可纠正一位错并检测两位数
效验位和故障字的位数是相同的
S5 S4 S3 S2 S1为00000时,无错
S5 S4 S3 S2 S1仅一位不为0时,S指定位置上的效验位出错
S5 S4 S3 S2 S1两位不为0时,数据和效验位中有两位同时出错
S5 S4 S3 S2 S1三位不为0时,有一个数据位发生了错误
S5 S4 S3 S2 S1四位或五位不为0时,出错严重
问题
校验码那里没怎么看懂
浙公网安备 33010602011771号