06 2017 档案

有关《刨根究底正则表达式》系列文章的更新说明
摘要:由于《刨根究底正则表达式》系列文章的后续稿件将被InfoQ采用,根据InfoQ的规定,必须在InfoQ首发后才能在本博客更新,因此,后续文章还需等待一段时间(因为要按InfoQ的要求修改稿件)才能继续在本博客更新。抱歉! 阅读全文

posted @ 2017-06-12 21:27 笨笨阿林 阅读(940) 评论(2) 推荐(0)

刨根究底字符编码之十三——UTF-16编码方式
摘要:UTF-16编码方式 1. UTF-16编码方式源于UCS-2(Universal Character Set coded in 2 octets、2-byte Universal Character Set)。而UCS-2,是早期遗留下来的历史产物。 UCS-2将字符编号直接映射为字符编码(CEF 阅读全文

posted @ 2017-06-09 23:11 笨笨阿林 阅读(2247) 评论(1) 推荐(2)

刨根究底正则表达式之二——正则表达式基础
摘要:说明: 虽然本系列文章开篇会简单介绍正则表达式的一些基础知识,但主要限于本系列文章所想强调的要点,因此本系列文章并不适合用于入门。 若你是对正则表达式没有任何概念的初学者,建议至少先阅读网上备受推崇的《正则表达式30分钟入门教程》,时间允许的话最好再阅读《正则表达式必知必会》(才130多页,写得非常 阅读全文

posted @ 2017-06-07 23:09 笨笨阿林 阅读(1239) 评论(0) 推荐(4)

刨根究底字符编码之十二——UTF-8究竟是怎么编码的
摘要:UTF-8究竟是怎么编码的 1. UTF-8编码是Unicode字符集的一种编码方式(CEF),其特点是使用变长字节数(即变长码元序列、变宽码元序列)来编码。一般是1到4个字节,当然,也可以更长。 为什么要变长呢?这可以理解为按需分配,比如一个字节足以容纳所有的ASCII字符,那何必补一堆0用更多的 阅读全文

posted @ 2017-06-06 22:07 笨笨阿林 阅读(2932) 评论(5) 推荐(3)

刨根究底正则表达式之一——正则表达式简介
摘要:说明: 虽然本系列文章开篇会简单介绍正则表达式的一些基础知识,但主要限于本系列文章所想强调的要点,因此本系列文章并不适合用于入门。 若你是对正则表达式没有任何概念的初学者,建议至少先阅读网上备受推崇的《正则表达式30分钟入门教程》,时间允许的话最好再阅读《正则表达式必知必会》(才130多页,写得非常 阅读全文

posted @ 2017-06-05 22:44 笨笨阿林 阅读(2066) 评论(0) 推荐(3)

刨根究底字符编码之十一——UTF-8编码方式与字节序标记
摘要:UTF-8编码方式与字节序标记 一、UTF-8编码方式 1. 接下来将分别介绍Unicode字符集的三种编码方式:UTF-8、UTF-16、UTF-32。这里先介绍应用最为广泛的UTF-8。 为满足基于ASCII、面向字节的字符处理的需要,Unicode标准中定义了UTF-8编码方式。UTF-8应该 阅读全文

posted @ 2017-06-02 21:09 笨笨阿林 阅读(3199) 评论(0) 推荐(1)

导航