摘要:
谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不过买来的数据挖掘书籍一打开全是... 阅读全文
posted @ 2014-09-30 11:42
李克华
阅读(1592)
评论(2)
推荐(3)
摘要:
HBase系列:博客地址:http://www.cnblogs.com/panfeng412/tag/HBase/技术专题文章:HBase中MVCC的实现机制及应用情况HBase在单Column和多Column情况下批量Put的性能对比分析集群应用及运维经验小结HBase一次慢查询请求的问题排查与解... 阅读全文
posted @ 2014-09-30 11:29
李克华
阅读(546)
评论(1)
推荐(0)
摘要:
文章转自:http://blog.csdn.net/hguisu/article/details/7978451我们从用户的角度来看,用户不关心什么索引结构是倒排还是签名文件,也不需要知道相关排序算法。用户提交了查询,就需要获取满意的搜索结果。这个搜索结果就是搜索引擎是否提供有效的服务。1.查询流程... 阅读全文
posted @ 2014-09-30 11:09
李克华
阅读(690)
评论(0)
推荐(0)
摘要:
文章转自:http://blog.csdn.net/hguisu/article/details/79559851. 搜索引擎的分类搜索引擎按其工作方式主要可分为三种:分别是全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory... 阅读全文
posted @ 2014-09-30 11:02
李克华
阅读(5054)
评论(0)
推荐(1)
摘要:
文章转自:http://blog.csdn.net/hguisu/article/details/7949844通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件... 阅读全文
posted @ 2014-09-30 11:01
李克华
阅读(934)
评论(0)
推荐(0)
摘要:
文章转自:http://blog.csdn.net/hguisu/article/details/79697571.概述 在关系数据库系统里,索引是检索数据最有效率的方式,。但对于搜索引起,他它并不能满足其特殊要求:1)海量数据:搜索引擎面对的是海量数据,像Google,百度这样大型的商业搜索引擎索... 阅读全文
posted @ 2014-09-30 10:58
李克华
阅读(2932)
评论(0)
推荐(0)
摘要:
文章转自:http://blog.csdn.net/hguisu/article/details/7962350搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系... 阅读全文
posted @ 2014-09-30 10:56
李克华
阅读(2555)
评论(0)
推荐(0)

浙公网安备 33010602011771号