Unicode字符集

  • Unicode是国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。
    • Unicode只是一个符号集,它只规定了每个符号的二进制值,但是符号具体如何存储它并没有规定。因此,Unicode出现了多种存储方式,常见的有UTF-8、UTF-16、UTF-32,它们分别用不同的二进制格式来表示Unicode字符。
      • UTF-8、UTF-16、UTF-32主要区别是是否用更少的字节标识低位的 Unicode 符号,比如 UTF-8 用一个子节表示 Unicode 中包含的 ASCII字符集

ASCII字符集

  • ASCII字符集是一种用一个字节(8位)表示一个字符的编码方案,它最初只定义了128个字符,主要用于表示英语字母、数字、标点符号和控制字符。
    • ASCII字符集是Unicode字符集的一个子集,也就是说,ASCII字符集中的128个字符在Unicode字符集中都有对应的编码,并且与ASCII编码相同。

HTML转义序列

  • HTML转义序列是一种在HTML、XML等SGML类语言中表示特殊字符的方法。它们以&开头,以;结尾,中间可以是一个预定义的实体名称(如©表示版权符号),或者一个数字(如A表示字母A)。
    • 转义序列主要用于表示一些在HTML中有特殊含义的字符,如<、>、&等,或者一些不常用的字符,如©、®、×等。
    • 注释:根据当前标签所在字体文件作用域内寻找该转义序列

URL转义字符

  • URL转义字符:这是一种在URL中表示特殊字符的方法,它们使用百分号 (%) 加上两位的十六进制数。URL转义字符可以用于处理URL中的元字符和中文等特殊字符。
    • 元字符是一种在正则表达式中使用的特殊字符,它可以用来表示一个或多个字符的模式。比如'\d'表示0-9的数字
    • URL只能使用ASCII字符集来通过因特网进行发送。

编码和解码

  • decodeURIComponent()函数专注于解码由encodeURIComponent()编码的字符,而decodeURI()函数则用于解码由encodeURI()编码的字符
  • encodeURI方法不会对URI中的特殊字符进行编码,如冒号、正斜杠、问号和井字号,而encodeURIComponent方法则会对它发现的任何非标准字符进行编码。
    • encodeURI用于把字符串生成为标准的url,例如:把其中的中文转化为URL转义字符
    • encodeURIComponent用于把字符串生成标准的url参数
posted on 2023-09-19 10:19  噬蛇之牙  阅读(6)  评论(0编辑  收藏  举报