摘要: 两道题(简化的搜索提示系统+随机数发生器)一、实现一个简化的搜索提示系统。给定一个包含了用户query的日志文件,对于输入的任意一个字符串s,输出以s为前缀的在日志中出现频率最高的前10条query。提示: 1、可以预处理日志。 2、假设query不超过10亿条,每个query不超过50字节。 3、考虑在大查询量的情况下如何实现分布式服务。思路1:因为可以预处理,所以先日志分析,对query进行外排序,只保留每个待搜索字符串(这个字符串可以从所有关键字中得到) 的top10 记录。然后对结果进行索引,比如用apache的lucene,或者更进一步的solr。思路2:搜索一般都不是即时的,即不会 阅读全文