预习非数值数据的编码方式
非数值数据的编码表示
逻辑值
- 每个字或其他可寻址单位(字节、半字等)是作为一个整体数据单元看待的。但是,某些时候还需要将一个n位数据看成由n个1位数据组成,每个取值为0或1。
- 有时可能需要提取一个数据项中的某位进行诸如“置位”或“清零”等操作。当数据以这种方式看待时,就被认为是逻辑数据。
- 逻辑数据只能参加逻辑运算,并且是按位进行的。
西文字符
- 西文由拉丁字母、数字、标点符号及一些特殊符号所组成,它们统称为字符( character)。所有字符的集合叫做字符集。
- 字符不能直接在计算机内部进行处理,因而也必须对其进行数字化编码,字符集中每一个字符都有一个代码。
- 码表中的代码具有唯一性。
汉字字符
- 目前来说,最简便、最广泛采用的汉字输入方法是利用英文键盘输入汉字。
- 汉字的输入码
对每个汉字用相应的按键进行的编码表示就成为汉字的输入码,又称为外码。
因为汉字的输入码的码元(即组成编码的基本单位)是西文键盘中的某个按键。 - 字符集与汉字内码
对于汉字内码的选择,必须考虑以下几个因素:
a.不能有二义性,即不能和ASCII码有相同的编码。
b.要和汉字在字库中的位置有关系
c.编码尽量短。 - 汉字的字模点阵码和轮廓描述
字模点阵描述:将字库中每个汉字或其他字符的字形(即字模)用一个其元素有0和1组成的方阵来表示,汉字或字符中有黑点的地方用1表示,空白处用0表示
这种用来描述汉字字模的二进制点阵数据称为汉字的字模点阵码。
轮廓描述方法:把汉字笔画的轮廓用一组直线和曲线来勾画,记下每一直线和曲线的数学表述公式。
奇偶校检码
海明威码
我的疑惑
对于海明威码校检位的位数的确定不知道怎样来的