上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 26 下一页
摘要: #! /bin/sh# Default-Start: 2 3 4 5# Default-Stop: 0 1 6# Short-Description: starts the nginx web serverPATH=/usr/local/sbin:/usr/local/bin:/s... 阅读全文
posted @ 2014-10-10 09:49 李克华 阅读(16359) 评论(0) 推荐(2)
摘要: 谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不过买来的数据挖掘书籍一打开全是... 阅读全文
posted @ 2014-09-30 11:42 李克华 阅读(1592) 评论(2) 推荐(3)
摘要: HBase系列:博客地址:http://www.cnblogs.com/panfeng412/tag/HBase/技术专题文章:HBase中MVCC的实现机制及应用情况HBase在单Column和多Column情况下批量Put的性能对比分析集群应用及运维经验小结HBase一次慢查询请求的问题排查与解... 阅读全文
posted @ 2014-09-30 11:29 李克华 阅读(546) 评论(1) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/7978451我们从用户的角度来看,用户不关心什么索引结构是倒排还是签名文件,也不需要知道相关排序算法。用户提交了查询,就需要获取满意的搜索结果。这个搜索结果就是搜索引擎是否提供有效的服务。1.查询流程... 阅读全文
posted @ 2014-09-30 11:09 李克华 阅读(690) 评论(0) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/79559851. 搜索引擎的分类搜索引擎按其工作方式主要可分为三种:分别是全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory... 阅读全文
posted @ 2014-09-30 11:02 李克华 阅读(5054) 评论(0) 推荐(1)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/7949844通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件... 阅读全文
posted @ 2014-09-30 11:01 李克华 阅读(934) 评论(0) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/79697571.概述 在关系数据库系统里,索引是检索数据最有效率的方式,。但对于搜索引起,他它并不能满足其特殊要求:1)海量数据:搜索引擎面对的是海量数据,像Google,百度这样大型的商业搜索引擎索... 阅读全文
posted @ 2014-09-30 10:58 李克华 阅读(2932) 评论(0) 推荐(0)
摘要: 文章转自:http://blog.csdn.net/hguisu/article/details/7962350搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系... 阅读全文
posted @ 2014-09-30 10:56 李克华 阅读(2554) 评论(0) 推荐(0)
摘要: 问题导读:1.ZooKeeper的数据模型是什么 ?2.ZooKeeper应用有哪些陷阱 ?3.每个节点(ZNode)中存储的是什么?4.一个ZNode维护了一个状态结构都包含了什么?5.ZNode组成结构是什么?6.Watches的机制是什么?7.ZooKeeper内置了哪4种方式实现ACL?前言... 阅读全文
posted @ 2014-09-29 10:05 李克华 阅读(6081) 评论(0) 推荐(0)
摘要: 问题导读:1.master挂机,传统做法备份必然是以前数据,该如何保证挂机数据与备份数据一致?2.分布式系统如何实现对同一资源的访问,保证数据的强一致性?3.集群中的worker挂了,传统做法是什么?zookeeper又是如何做的?分布式系统的运行是很复杂的,因为涉及到了网络通信还有节点失效等不可控... 阅读全文
posted @ 2014-09-29 10:01 李克华 阅读(28565) 评论(1) 推荐(2)
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 26 下一页