摘要: 前言1. 创建表:(由master完成)首先需要获取master地址(master启动时会将地址告诉zookeeper)因而客户端首先会访问zookeeper获取master的地址client和master通信,然后有master来创建表(包括表的列簇,是否cache,设置存储的最大版本数,是否压缩... 阅读全文
posted @ 2014-05-18 16:27 wishyouhappy 阅读(6982) 评论(0) 推荐(0) 编辑
摘要: 说明MapReduce是一种分布式计算模型,解决海量数据的计算问题,主要有Map和Reduce组成用户使用时需要实现map()和reduce()两个函数,两个函数的形参都是key/value键值对若以eclipse为开发环境,运行时出现内存不足的情况,需要修改虚拟机的参数 (例如把Default V... 阅读全文
posted @ 2014-05-18 12:15 wishyouhappy 阅读(552) 评论(2) 推荐(0) 编辑