liuxiaopang
减肥路漫漫,编程遥无期
摘要: 经过一段时间的学习,对于Hadoop有了一些了解,于是决定用MapReduce实现PageRank算法,以下简称PR 先简单介绍一下PR算法(摘自百度百科:https://baike.baidu.com/item/google%20pagerank/2465380?fr=aladdin&fromid 阅读全文
posted @ 2017-11-30 18:42 liuxiaopang 阅读(4223) 评论(0) 推荐(0) 编辑
摘要: 所有服务器都会先将自己的服务器信息注册到servers中,然后每台服务器都会尝试注册master,哪台注册成功,则哪台就是master服务器。 所有的服务器都会关注master节点的删除事件,这样通过监听是否发生删除事件来确定master服务器是否宕机,宕机后需要重新选出一台 新机器来作为maste 阅读全文
posted @ 2017-11-14 14:23 liuxiaopang 阅读(177) 评论(0) 推荐(0) 编辑
摘要: timeout表示会话超时时间,zookeeper靠与客户的心跳来判断会话是否有效(单位毫秒), -r为只读,表示zookeeper如果与半数以上服务器失去连接则会停止服务,如果有-r参数,则会继续保留只读服务 -server ip和端口 connected表示连接成功,输入h获取帮助列表 一般通过 阅读全文
posted @ 2017-11-13 14:59 liuxiaopang 阅读(124) 评论(0) 推荐(0) 编辑
摘要: linux中/opt一般用来存放应用/var目录一般用来存放日志 sample为样例文件,复制一份zoo.cfg文件 配置zoo文件,id为服务器id(整数),host为服务器的ip地址,第一个port为follow的端口,第二个port为leader选举端口,输入任意可用值即可 创建一个zooke 阅读全文
posted @ 2017-11-10 12:25 liuxiaopang 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 顺序一致性:严格按照顺序在zookeeper上执行 原子性:所有事物请求的结果,在整个集群的应用情况一致 单一视图:无论从哪个服务器进入集群,看到的东西都是一致的 可靠性:服务端成功响应后,状态会 一直保留 3台的zookeeper集群达到12-13万QPS 客户端在zookeeper注册监听器,z 阅读全文
posted @ 2017-11-09 11:19 liuxiaopang 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 内嵌模式,存储于本地的Derby数据库中,只支持单用户 本地模式,支持多用户多会话,例如存入mysql 下载解压hive后,进到conf路径,将模板拷贝 出现该错误表示权限不够 该目录未找到 新建一个/tmp/hive目录,可建在集群同级目录,然后修改hive-site.xml文件 再次执行hive 阅读全文
posted @ 2017-11-07 14:43 liuxiaopang 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 一般用户用CLI(命令行界面)接口,元数据库含有表结构 单用户、多用户、远程服务 生成db文件,只能单客户端使用数据库 多用户是最常用的使用模式 配置与多用户一致 数据格式用户自定义 所有的表都存于改配置路径下,除了外部表 外部表指定location则可,删除一个表只会删除元数据(元数据(Metad 阅读全文
posted @ 2017-11-06 14:10 liuxiaopang 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 数据仓库是集成的面向主题的数据库的集合 面向主题主要是宏观上解决某一类问题,集合性指数据集 数据库主要处理用于事务处理,数据仓库用于分析处理,数据库适用于操作型数据,便于增删改查, 数据仓库则用于挖掘信息,数据仓库需充分了解企业以及组织的详细结构,给出方案。 阅读全文
posted @ 2017-11-06 11:06 liuxiaopang 阅读(759) 评论(0) 推荐(0) 编辑
摘要: Hive目的是为了简化MapReduce编程 实际应用中,Hive与Hbase不经常链接 阅读全文
posted @ 2017-11-06 10:33 liuxiaopang 阅读(645) 评论(0) 推荐(0) 编辑
摘要: G级别或者T级别都只能用hadoop 阅读全文
posted @ 2017-11-03 15:12 liuxiaopang 阅读(177) 评论(0) 推荐(0) 编辑