php与ascii码

首先 简单说一下历史,ascii码最开始是美国人搞出来的,用来干什么呢?我们知道,计算机只知道0和1,如果我们要计算机识别除了01之外的字符,例如 'a',我们要先告诉计算机‘1100001’就是'a'。跟摩斯密码一样,敲几下三长两短就是代表sos(开玩笑)。所谓的字符编码,就是跟计算机打交 道,跟计算机约定一连串的0101到底代表了什么字符。


ascii编码是鼻祖了,不过由于ascii只有8bits,而且实际上用到的是7位,所以能表示的只有128个字符(00000000~01111111)。这128个字符包括了可打印的普通字符,也包括了不可打印的命令字符。看下表。

这128个字符,对于美国人来说,应该是足够了。但对于一些使用非英文字符的国家地区,例如拉丁文,发文,俄文,中文,这就绝对不够。

所以后来就有人搞了扩展的ascii,也有人搞了新的字符编码,在原来的8位基础上扩展到16位,32位。我们常见的ISOxxxx,GB2312,GBK,BIG 5,unicode....都是后来发展起来的。

虽然这 些字符编码有些之间是不兼容,例如就中文而言,gb2312是不兼容unicode的,就是说,同一个汉字,底层约定的二进制是不一样的。网页上的乱码就 是出于此。但是这些后来发展的字符编码都向下兼容了ascii。这就是为什么utf-8(unicode)和gbk/gb2312显示英文是不会有乱码, 而显示中文会容易乱码。因为他们都兼容ascii,所以52个字母的显示都是按ascii标准。但ascii是没中文的,所以unicode,gbk都按 各自标准解释了。

从简单入手,我们先来看ascii标准的编码。弄清楚PHP里面的二进制,十进制,八进制,十六进制,字符的表示与转化。
先来说一下一些表示法:
Dec:十进制
Hex:十六进制
Oct:八进制
Bin:二进制

所以数字16表示为:16D = 01H = 018O = 1000 0000B
上面这些都是一些表示法而已。方便给人看的。

=================================================================================================

现在有一个需求,在程序中输入一个十六进制数,让计算机显示对应的ascii字符。例如就41H就对应A。
方法一:
转义字符:转义字符里提供\xdd和\ddd,\xdd表示十六进制,\ddd表示八进制
所以我们可以:
  1. <?php  
  2. echo "\x41";                    //十六进制,\x开头  
  3. echo "\101";                    //八进制,随便几位  
  4. ?>  

 

注意:转义字符只提供了十六进制和八进制转换到字符,没有提供二进制、十进制转换到字符。所以要用另外一种方法。

方法二:
用php里面的chr()函数。这个函数参数很简单,就是ascii码对应的十进制,十六进制,八进制。
十进制:直接写整数
八进制:第一位肯定是0,后面随便几位
十六进制:0xdd
二进制:字符串
注意:一定要记清楚十六进制是0xdd
  1. <?php  
  2. echo chr(65);                    //十进制,由于都输数,所以没必要加双引号了  
  3. echo chr(0x41);                 //十六进制  
  4. echo chr(0101);                 //八进制,三位,最高位补零  
  5. echo chr('01000001');         //二进制,注意,这里的二进制一定要看做字符串,加引号!上面三个都不用加  
  6. ?>  

 


方法三
用php里面的printf/sprintf()函数格式化输出
  1. <?php  
  2. printf("%c", 0x41);               //第二个参数一定不能用单/双引号  
  3. printf("%c", 0101);               //第二个参数一定不能用单/双引号  
  4. printf("%c", 65);                    //第二个参数一定不能用单/双引号  
  5. printf("%c"'01000001');  
  6. ?>  

 

第二个参数格式基本跟chr()的一样,8进制,10进制,16进制都不加引号,二进制就要加引号。8进制首位为0,16进制首位为0x。

====================================================================================
现在是根据一个字符提取ascii表中的对应值
方法一:
ord()函数
  1. <?php  
  2. echo ord('A');  
  3. ?>  

 

输出结果是65。因而这个函数只能从字符转化到十进制。
注意:这个方法只提取第一个字符。如果是一个字符串,那就没办法处理后面的字符了。

方法二:
bin2hex()函数:将字符[串]转换为16进制
  1. <?php  
  2. echo bin2hex('A');  
  3. ?>  

 

输出结果是41。
注意,这个41只是字面数值,没有16进制的意义。
这个函数不能用一个二进制‘01101...’直接转到16进制,只能由字符串转到16进制,真怪
这个函数可以处理字符串  

printf/sprintf()函数
.....发现都不行
所以,只能先用ord()转化为十进制,再转为二进制,八进制。(以后再看看pack这个函数)

====================================================================================

各种进制 的转换:
bindec():二进制转十进制
  1. <?php  
  2. echo bindec(1100);           //输出12,可以加引号,也可以不加                 
  3. ?>   

 

decbin():十进制转二进制,一样用

dechex() :十进制转16进制
hexdec():16进制转10进制(参数直接写值,不用写0x)

octdec():八进制转10进制
decoct():10进制转8进制

base_convert(要转换的数,原进制,目标进制):任意进制转换
<?php
echo base_convert(123, 6, 2);
?>

注意:上面的这些转换函数,由于都是数学处理函数,所以参数都不需要是字符串形式(不需要加引号),直接写数值就行了。




posted @ 2013-06-15 15:05  凡的世界  阅读(15386)  评论(0编辑  收藏  举报