摘要: 谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不过买来的数据挖掘书籍一打开全是... 阅读全文
posted @ 2014-09-30 11:42 李克华 阅读(1592) 评论(2) 推荐(3)
摘要: HBase系列:博客地址:http://www.cnblogs.com/panfeng412/tag/HBase/技术专题文章:HBase中MVCC的实现机制及应用情况HBase在单Column和多Column情况下批量Put的性能对比分析集群应用及运维经验小结HBase一次慢查询请求的问题排查与解... 阅读全文
posted @ 2014-09-30 11:29 李克华 阅读(546) 评论(1) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/7978451我们从用户的角度来看,用户不关心什么索引结构是倒排还是签名文件,也不需要知道相关排序算法。用户提交了查询,就需要获取满意的搜索结果。这个搜索结果就是搜索引擎是否提供有效的服务。1.查询流程... 阅读全文
posted @ 2014-09-30 11:09 李克华 阅读(690) 评论(0) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/79559851. 搜索引擎的分类搜索引擎按其工作方式主要可分为三种:分别是全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory... 阅读全文
posted @ 2014-09-30 11:02 李克华 阅读(5054) 评论(0) 推荐(1)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/7949844通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件... 阅读全文
posted @ 2014-09-30 11:01 李克华 阅读(934) 评论(0) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/79697571.概述 在关系数据库系统里,索引是检索数据最有效率的方式,。但对于搜索引起,他它并不能满足其特殊要求:1)海量数据:搜索引擎面对的是海量数据,像Google,百度这样大型的商业搜索引擎索... 阅读全文
posted @ 2014-09-30 10:58 李克华 阅读(2932) 评论(0) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/7962350搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系... 阅读全文
posted @ 2014-09-30 10:56 李克华 阅读(2555) 评论(0) 推荐(0)