摘要: 概念明确:被匹配串S、匹配串P。如从cbabce找ab,前者和后者分别称为被匹配串、匹配串。设S长度为n、P长度为k 暴力算法 最容易想到的方法:从首字母开始,逐个比较下去。一旦发现有不同的字符就停止并将这个匹配串后移一位,然后从头开始进行下一次比较。这样,就需要将字串中的所有字符一一比较。 KMP 阅读全文
posted @ 2019-11-26 12:00 March On 阅读(846) 评论(0) 推荐(0) 编辑
摘要: 知道一堆词汇里各个字出现的概率pi,则对这些字的最优编码下各字的位长(也即每个字包含的信息)为: 香农公式:,知道各字的位长后,可依次给他们编码0、10、110... 这些字的平均编码长度为(也即信息量,或称信息熵): 信息熵: 总结:信息是不确定性(无序)的度量,不确定性体现在概率分布上:概率分布 阅读全文
posted @ 2019-11-26 10:37 March On 阅读(172) 评论(0) 推荐(0) 编辑
top last
Welcome user from
(since 2020.6.1)