2012年5月6日

实现了一个压缩算法,在数据高度压缩的前提下,还可以快速查找 key

摘要: 最近写了一个算法,可用于 (key,value) 存储,key 当然是 string 类型。用一个 2.3G 的 url 集合做测试,如果不计 value 占用的空间,key 集合的存储空间可以被压缩70倍!压缩后整个数据结构仅占31M内存!压缩率比 bzip2 还要高。本质性的不同于: gzip, bzip2 等压缩算法仅仅是压缩而已,无法快速地从压缩数据中查找。我实现的这个算法能高效地支持对 key 的查找,并且查找的时间复杂度仅与 key 的长度有关,不管数据集合有多大,时间复杂度总是 O(strlen(key))。实际数据:当 key 长度均值为 76 字节时(该 url 集合中所有 阅读全文

posted @ 2012-05-06 00:21 能发波 阅读(172) 评论(0) 推荐(0)

导航