King_K

导航

2014年10月19日 #

第八章:简单之美——布尔代数和搜索引擎的索引

摘要: 接下来的几章,我们将讨论搜索引擎的一些基础知识。要真正做好搜索引擎,不可能是一朝一夕的事情,没有捷径可走。做好搜索,最基本的要求是每天分析10-20个不好的搜索结果,累积一段时间才有感觉。但是往往很多工程师都做不到这一点。搜索殷勤的原理其实非常简单:自动下载尽可能多的网页;建立快速有效的索引;根... 阅读全文

posted @ 2014-10-19 23:17 King_K 阅读(308) 评论(0) 推荐(0) 编辑

第六章:信息的度量和作用

摘要: 1.信息熵 我们用一个生动的例子来说明这个概念:刚好这几天举行世界杯,我们都会猜谁会获得冠军。假设有32支球队,编号从1-32。然后问:“冠军是在1-16中吗?”,不是的话就是在6-32中,一次类推。我们最多需要猜测5次就能猜出谁是冠军(log32)。但事实上,我们可能不需要5次就能猜出来,因为像... 阅读全文

posted @ 2014-10-19 23:16 King_K 阅读(373) 评论(0) 推荐(0) 编辑