摘要: 摘要by crazyhacking: 一 搜索引擎的核心问题就是3个:1、建立资料库,通过爬虫系统实现;2、建立一种数据结构,可以根据关键词找到含有这个词的页面。通过索引系统(倒排索引)实现。3排序系统。 pagerank解决了第三个问题;如何对查询结果排序。 二PageRank的思想概... 阅读全文
posted @ 2014-02-08 17:23 唐僧吃肉 阅读(403) 评论(0) 推荐(0)
摘要: 浅说机器学习中“迭代法” zouxy09@qq.com http://blog.csdn.net/zouxy09 首先来点八股文(来自百度百科):迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程,跟迭代法相对应的是直接法(或者称为一次解法),即一次性解决问题。迭代算法是用... 阅读全文
posted @ 2014-02-08 14:42 唐僧吃肉 阅读(491) 评论(0) 推荐(0)
摘要: 在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVariable)。最大期望经常用在机器学习和计算机视觉的数据聚类(DataClustering)领域。最大期望算法经过两个... 阅读全文
posted @ 2014-02-08 11:54 唐僧吃肉 阅读(306) 评论(0) 推荐(0)