Day2-字符集

2.2 字符集

1           <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

字符集用meta标签定义,meta表示“元”。“元”配置,就是表示基本的配置项目。

charset就是charactor set“字符集”的意思。这个meta不用背,谁背谁傻,用sublime生成就行。

中文能够使用的字符集两种:

第一种:UTF-8

1           <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

第二种:gb2312

1           <meta http-equiv="Content-Type" content="text/html;charset=gb2312">

也可以写成gbk

2           <meta http-equiv="Content-Type" content="text/html;charset=gbk">

 

什么是字符集?活字印刷术,所有的汉字都有一个个小印章,需要哪个字,就取哪个字。

 

但是,有两个人都发明了字库。老王发明了一个,老李也发明了一个。

比如同一个汉字,“传”字在老王的字库里面是第2个大盘子第4行第43列的。

而这个汉字“传”在老李的字库里面是第5个大盘子第6行第13列的。

计算机,不能直接存储汉字,而是存储的是编码,所以,计算机记录“传”这个字,就是这么记录的:

老王:

1           20443

老李

1           50613

 

有两个字库UTF-8和gb2312。

UTF-8是国际通用字库,里面涵盖了所有地球上所有人类的语言文字,比如阿拉伯文、汉语、鸟语……

gb2312 是国标,是中国的字库,里面涵盖了汉字和一些常用外文,比如日文片假名,和常见的符号。

 

字库规模:  UTF-8(字全) > gb2312(只有汉字)

 

 

我们用meta标签可以声明当前这个html文档的字库,但是一定要和保存的类型一样,否则乱码!(重点)

 

 

当我们不设置的时候,sublime默认类型就是UTF-8。而一旦更改为gb2312的时候,就一定要记得设置一下sublime的保存类型: 文件→ set File Encoding to → Chinese Simplified(GBK)

 

记住两者匹配:

 

 

注意,由于UTF-8里面保存了世界上所有人类语言,所以描述一个汉字需要的码更多。

UTF-8里面存储一个汉字3个字节。而gb2312中存储一个汉字2个字节。

 

保存大小:   UTF-8(更臃肿、加载更慢) > gb2312 (更小巧,加载更快)

 

总结:

UTF-8 字多,有各种国家的语言,但是保存尺寸大,文件臃肿;

gb2312字少,只用中文和少数外语和符号,但是尺寸小,文件小巧。

 

列出2个使用情形:

1) 你们公司是做日本动漫的,经常出现一些日语动漫的名字,网页要使用UTF-8。如果用gb2312将无法显示日语。

2) 你们公司就是中文网页,极度的追求网页的显示速度,要使用gb2312。如果使用UTF-8将每个汉字多一个byte,所以5000个汉字,多5kb。

 

我们亲测:

● qq网、网易、搜狐都是使用gb2312。这些公司,都追求显示速度。

● 新华网藏语频道,使用的是UTF-8,保证字符集的数量。

 

我们的课程,一律使用UTF-8,因为我们懒,懒得改了。

 

浏览器就是通过meta来看你是什么字符集的,比如你保存的时候meta写的,和声明的不匹配,那么浏览器就是乱码。

posted @ 2017-02-16 07:29  行走de猫  阅读(172)  评论(0)    收藏  举报