预习非数值数据的编码方式

一、逻辑值。

2.5.1逻辑值

正常情况下,每个字或其他可寻址单位(字节半字等)是作为一个整体数据单元看待的。但是,某些时候还需要将一个,位数掘看成由n个1位数据组成,每个取值为0或1.例如,有时需要存储一个布尔或二讲制数据阵列.阵列中的每项只能取值为1或0;有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时,就被认为是逻辑数据。因此n位二进制数可表示n个逻辑值。逻辑数据只能参加逻辑运算,并且是按位进行的,如按位“与”按位“或”、逻辑左移、逻辑右移等。
逻辑数据和数值数据都是一串0/1序列,在形式上无任何差异,需要通过指令的操作码类型来识别它们。例如,逻辑运算指令处理的是逻再双始,异不运算指令处理的是数值数据。

2.5.2西文字符

西文由拉丁字母、数字、标点符号及一些特殊符号组成,他们统称为字符,所有的字符集合叫做字符集。字符不能直接在计算机内部进行处理,因而也必须对其进行数字化编码。

(1)字符0~9这10个数字字符的高3位编码为011,低4位分别为0000~1001。当去48掉高3位时,低4位正好是0~9这10个数字的8421码。这样既满足了正常的排序关系,又有利于实现ASCII码与十进制数之间的转换。
(2)英文字母字符的编码值也满足正常的字母排序关系,而且大、小写字母的编码之间有简单的对应关系,差别仅在b,这一位上,若这一位为0,则是大写字母;若为1,则是小写字母。这使得大、小写字母之间的转换非常方便。

2.5.3汉字字符

汉字系统必须处理一下几种汉字代码:输入码、内码、子模和阵码
汉字的输入码:汉字输入码也称外码,是为将汉字输入到计算机设计的代码。汉字输入码种类较多,选择不同的输入码方案,则输入的方法及按键次数、输入速度均有所不同。综合起来,汉字输入码可分为流水码、拼音类输入法、拼形类输入法和音形结合类输入法几大类。
汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。对于西文字符,它的内码就是ASCII码。
对于汉字内码的选择,必须考虑以下几个因素:
1.不能有二义性,即不能和ASCII码有相同的编码。
2.要与汉字在字库中的位置有关系,以便于与汉字的处理、查找。
3.编码应尽量短。

2.6数据的宽度和存储

计算机内部任何信息都被表示成二进制编码形式。二进制数据的每一位(或1)是组成二进制信息的最小单位,称为一个比特(bit),或称位元,简称位。比特是计算机中处理、存储和传输信息的最小单位。
字长等于CPU内部用于整数运算的运算器位数和通用寄存器宽度。
字和字长概念不同,字用来表示被处理信息的单位,用来度量各种类型的宽度。

由此可见,同一类型的数据并不是所有机器都采用相同的数据宽度,分配的字节数随机器和编译器不同而不同。

2.7数据校验码

数据在计算机内部进行计算、存取和传送过程中,由于元器件故障或噪音干扰等原因会出现差错。为了减少和避免这些错误,一方面要从计算机硬件本身的可靠性入手,在电路、电源、布线等各方面采取必要的措施,提高计算机的抗干扰能力;另一方面要采取相应的数据检错和校正措施,自动地发现并纠正错误。

奇偶校验码·

最简单的校验方法实现步骤如下:

海明校验码

海明效验是分组奇偶效验,单纠错码(SCE)只能纠正一位错,“纠一检二”码(SEC-DED)可纠正一位错并检测两位数
效验位和故障字的位数是相同的
S5 S4 S3 S2 S1为00000时,无错
S5 S4 S3 S2 S1仅一位不为0时,S指定位置上的效验位出错
S5 S4 S3 S2 S1两位不为0时,数据和效验位中有两位同时出错
S5 S4 S3 S2 S1三位不为0时,有一个数据位发生了错误
S5 S4 S3 S2 S1四位或五位不为0时,出错严重

问题

校验码那里没怎么看懂

posted @ 2020-09-22 18:23  刘&扬  阅读(253)  评论(0)    收藏  举报