文章分类 - 算法
摘要:分类:数据结构与算法大数据处理2012-08-14 16:521345人阅读评论(1)收藏举报目录(?)[-]Bloom FilterHashBit-map堆双层桶数据库索引及优化数据库索引什么是索引概述为什么要创建索引在哪建索引数据库优化倒排索引搜索引擎之基石外排序trie树分布式处理 mapreduce 前面我们说海量数据处理提到,从算法的角度去考虑处理海量数据。1. Bloom Filter【Bloom Filter】Bloom Filter(BF)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。它是一个判断元素是否存在集合的快速的概
阅读全文
摘要:分类:数据结构与算法大数据处理云计算hadoop2012-08-14 18:401670人阅读评论(1)收藏举报filter算法vectorfunctionurlfile目录(?)[-]Bloom-Filter算法简介Bloom-Filter的基本思想扩展CounterBloom FilterCounterBloom FilterCompressed Bloom FilterBloom-Filter的应用网络应用垃圾邮件地址过滤Bloom-Filter的具体实现1. Bloom-Filter算法简介 Bloom-Filter,即布隆过滤器,1970年由Bloom中提出。它可以用于检索一个元..
阅读全文
摘要:分类:PHPmemcache2012-03-14 16:30575人阅读评论(0)收藏举报memcached算法服务器cacheperl目录(?)[-]memcached的分布式算法-Consistent Hashingmemcached的分布式memcached的分布式是什么意思CacheMemcached的分布式方法根据余数计算分散根据余数计算分散的缺点Consistent HashingConsistent Hashing的简单说明支持Consistent Hashing的函数库总结memcached的分布式算法-Consistent Hashing前言:我们知道以往资料要放到 M 台服
阅读全文
摘要:上一篇文章,我介绍了KMP 算法。 但是,它并不是效率最高的算法,实际采用并不多。各种文本编辑器的"查找"功能(Ctrl+F),大多采用Boyer-Moore 算法。 Boyer-Moore 算法不仅效率高,而且构思巧妙,容易理解。1977 年,德克萨斯大学的 Robert S. Boyer 教授和 J Strother Moore 教授发明了这种算法。 下面,我根据 Moore 教授自己的例子来解释这种算法。 1. 假定字符串为"HERE IS A SIMPLE EXAMPLE",搜索词为"EXAMPLE"。 2. 首先,"
阅读全文
摘要:字符串匹配的KMP算法Posted: 01 May 2013 03:46 AM PDT字符串匹配是计算机的基本任务之一。举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"?许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一。它以三个发明者命名,起头的那个K就是著名科学家Donald Knuth。这种算法不太容易理解,网上有很多解释,但读起来都很费劲。直到读到Jake Boxer的文章,我才真正理解这种算法。下面,我用自己的语言,试图写一
阅读全文