预习非数值数据的编码方式

一、逻辑值。

2.5.1逻辑值

正常情况下，每个字或其他可寻址单位(字节半字等)是作为一个整体数据单元看待的。但是，某些时候还需要将一个，位数掘看成由n个1位数据组成,每个取值为0或1.例如,有时需要存储一个布尔或二讲制数据阵列.阵列中的每项只能取值为1或0;有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时,就被认为是逻辑数据。因此n位二进制数可表示n个逻辑值。逻辑数据只能参加逻辑运算，并且是按位进行的，如按位“与”按位“或”、逻辑左移、逻辑右移等。
逻辑数据和数值数据都是一串0/1序列，在形式上无任何差异，需要通过指令的操作码类型来识别它们。例如,逻辑运算指令处理的是逻再双始，异不运算指令处理的是数值数据。

2.5.2西文字符

西文由拉丁字母、数字、标点符号及一些特殊符号组成，他们统称为字符，所有的字符集合叫做字符集。字符不能直接在计算机内部进行处理，因而也必须对其进行数字化编码。

(1)字符0～9这10个数字字符的高3位编码为011，低4位分别为0000～1001。当去48掉高3位时，低4位正好是0～9这10个数字的8421码。这样既满足了正常的排序关系，又有利于实现ASCII码与十进制数之间的转换。
(2)英文字母字符的编码值也满足正常的字母排序关系，而且大、小写字母的编码之间有简单的对应关系，差别仅在b，这一位上，若这一位为0，则是大写字母；若为1，则是小写字母。这使得大、小写字母之间的转换非常方便。

2.5.3汉字字符

汉字系统必须处理一下几种汉字代码：输入码、内码、子模和阵码
汉字的输入码：汉字输入码也称外码，是为将汉字输入到计算机设计的代码。汉字输入码种类较多，选择不同的输入码方案，则输入的方法及按键次数、输入速度均有所不同。综合起来，汉字输入码可分为流水码、拼音类输入法、拼形类输入法和音形结合类输入法几大类。
汉字被输入到计算机内部后，就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。对于西文字符，它的内码就是ASCII码。
对于汉字内码的选择，必须考虑以下几个因素：
1.不能有二义性，即不能和ASCII码有相同的编码。
2.要与汉字在字库中的位置有关系，以便于与汉字的处理、查找。
3.编码应尽量短。

2.6数据的宽度和存储

计算机内部任何信息都被表示成二进制编码形式。二进制数据的每一位(或1)是组成二进制信息的最小单位，称为一个比特(bit)，或称位元，简称位。比特是计算机中处理、存储和传输信息的最小单位。
字长等于CPU内部用于整数运算的运算器位数和通用寄存器宽度。
字和字长概念不同，字用来表示被处理信息的单位，用来度量各种类型的宽度。

由此可见，同一类型的数据并不是所有机器都采用相同的数据宽度，分配的字节数随机器和编译器不同而不同。

2.7数据校验码

数据在计算机内部进行计算、存取和传送过程中，由于元器件故障或噪音干扰等原因会出现差错。为了减少和避免这些错误，一方面要从计算机硬件本身的可靠性入手，在电路、电源、布线等各方面采取必要的措施，提高计算机的抗干扰能力；另一方面要采取相应的数据检错和校正措施，自动地发现并纠正错误。

奇偶校验码·

最简单的校验方法实现步骤如下：

海明校验码

海明效验是分组奇偶效验，单纠错码（SCE）只能纠正一位错，“纠一检二”码（SEC-DED）可纠正一位错并检测两位数
效验位和故障字的位数是相同的
S5 S4 S3 S2 S1为00000时，无错
S5 S4 S3 S2 S1仅一位不为0时，S指定位置上的效验位出错
S5 S4 S3 S2 S1两位不为0时，数据和效验位中有两位同时出错
S5 S4 S3 S2 S1三位不为0时，有一个数据位发生了错误
S5 S4 S3 S2 S1四位或五位不为0时，出错严重

问题

校验码那里没怎么看懂

posted @ 2020-09-22 18:23 刘&扬阅读(259) 评论(0) 收藏举报

刷新页面返回顶部

??