预习非数值数据的编码方式

一、非数值数据的编码值表示
1、逻辑值
n位二进制数可表示n个逻辑值。
逻辑数据只能参加逻辑运算,并且是按位进行的,如按位“与”,按位“或”,逻辑左移,逻辑右移等。
逻辑运算指令处理的是逻辑数据,算术运算指令处理的是数值数据。
2、西文字符
西文由拉丁字母,数字,标点符号及一些特殊符号所组成,它们统称为字符。所有字符的集合叫字符集。
码表中的代码具有唯一性。
字符主要用于外部设备和计算机之间交换信息。
目前计算机中使用最广泛的西文字符集及其编码是ASCII码,即美国标准信息交换码。
3、汉字字符
汉字系统必须处理以下几种汉字代码:输入码、内码、字模点阵码。
1)汉字的输入码
目前,最简便,最广泛采用的汉字输入方法是利用英文键盘输入汉字。
这种对每个汉字用相应的按键进行的编码表示就称为汉字的输入码,又称外码。
汉字的输入码的码元(即组成编码的基本元素)是西文键盘中的某个按键。
2)字符集与汉字内码
汉字内码考虑因素:
a.不能有二义性,即不能和ASCII码有相同的编码。
b.要与汉字在字库中的位置有关系,以便于汉字的处理,查找。
c.编码应尽量短。
汉字输入码与汉字内码、汉字交换码完全是不同范畴的概念,不能把他们搞混淆。使用不同的输入编码方式输入同一个汉字时,在计算机内部得到的汉字内码是一样的。
3)汉字的字模点阵码和轮廓描述
汉字的字形主要有两种描述方法:字模点阵描述和轮廓描述。
轮廓描述已有两类国际标准:AdobeTybel和TrueType。
二、数据的宽度与存储
1.数据的宽度与单位
二进制数据的每一位(0或1)是组成二进制信息的最小单位,称为一个比特bit,或称位元,简称位。
每个西文字符要8个比特表示,每个汉字要16个比特表示。二进制信息的计量单位是字节byte,称位组。1byte=8bit。
字长等于指CPU内部用于整数运算的运算器位数和通用寄存器宽度。
字用来表示被处理信息的单位,用来度量各种数据类型的宽度;
字长表示进行数据运算,存储和传送的部件的宽度,它反映了计算机处理信息的一种能力。
1KB=2^10B 1PB=2^50B
1MB=2^20B 1EB=2^60B
1GB=2^30B 1ZB=2^70B
1TB=2^40B 1YB=2^80B
2.数据的存储和排列顺序
MSB(Most significant bit) 最高有效位
LSB(Least significant bit) 最低有效位
在所有计算机中,多字节数据都被存放在连续的字节序列中。根据数据中各字节在连续字节序列中的排列顺序的不同,可有两种排列方式:大端(big endian)和小端(little endian)。
变量的地址是最小地址。LSB 表示最低有效字节(01H),MSB 表示最高有效字节(67H)。
大端方式:将数据的最高有效字节存放在低地址单元中,将最低有效字节存放在高地址单元中,即变量的地址就是 MSB 所在的地址。
小端方式:将数据的最高有效字节存放在高地址单元中,将最低有效字节存放在低地址单元中,即数据的地址就是 LSB 所在的地址。
四、数据校验码
一种具有检错能力或自动改错能力的数据编码方法。
1.奇偶校验码
编码规律
偶校验:配一个校验位,使整个校验码(包括有效数据和校验位)中“1”的个数为偶数;
奇校验:配一个校验位,使整个校验码(包括有效数据和校验位)中“1”的个数为奇数;
2.海明校验码
实质:是一种多重奇偶校验码。
实现原理:按一定规律将有效数据位划分为若干组,分组进行奇偶校验。各组的检错信息构成一个指错字,不但可以发现出错,还能指出是哪一位出错,为自动纠错提供依据。
3.循环冗余校验码(CRC码)
校验规则
让校验码能被某一约定代码除尽。
若能除尽,表明代码无错;
若除不尽,余数将指明出错位置。
模2运算:以按位模2相加为基础,运算时不考虑进位和借位。
五、问题
有点没看懂校验码

posted on 2020-09-21 15:44  LTinga  阅读(365)  评论(0)    收藏  举报

导航