会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
思考与践行
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
32
下一页
2019年6月18日
Hive 查询
摘要: 6. Hive 查询 6.1 基本查询(Select ... From) 6.1.1 常用函数 求总行数(count): 求工资的最大值(max): 求工资的最小值(min): 求工资的总和(sum): 求工资的平均值(avg): 6.2 Where 语句 6.2.1 基础 where 查询 查询工
阅读全文
posted @ 2019-06-18 13:58 小a的软件思考
阅读(2454)
评论(0)
推荐(0)
2019年6月15日
Hive 数据类型及操作数据库
摘要: 3. Hive 数据类型 3.1 基本数据类型 Hive 数据类型 | Java 数据类型 | 长度 | | TINYINT | byte | 1 byte 有符号整数 | SMALINT | short | 2 byte 有符号整数 | INT | int | 4 byte 有符号整数 | BIG
阅读全文
posted @ 2019-06-15 22:36 小a的软件思考
阅读(903)
评论(0)
推荐(0)
2019年6月14日
Hive 入门
摘要: 1. Hive 基本概念 1.1 Hive 介绍 Hive 由 Facebook 开源用于解决海量结构化日志的数据统计; Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供 类SQL 查询功能; 本质是:将 HQL 转化成 MapReduce 程序 ; 1
阅读全文
posted @ 2019-06-14 23:09 小a的软件思考
阅读(236)
评论(0)
推荐(0)
2019年6月10日
Zookeeper 应用
摘要: 1. 应用场景 Zookeeper提供的服务包括:统一命名服务,统一配置管理,统一集群管理,服务器节点动态上下线,软负载均衡等。 2. 配置修改 3. 操作单节点 Zookeeper 4. Zookeeper Shell命令操作 5. 监听器原理 首先,需要有一个main()线程; 在main线程中
阅读全文
posted @ 2019-06-10 20:47 小a的软件思考
阅读(162)
评论(0)
推荐(0)
2019年6月2日
HBase 详解
摘要: 1.HBase 架构 ============================================ 2. HBase Shell 操作 2.1. 基本操作 进入HBase客户端命令行: 查看帮助命令: 查看当前数据库中有哪些表: 2.2. 表的操作 3. HBase 数据结构 3.1 R
阅读全文
posted @ 2019-06-02 19:00 小a的软件思考
阅读(1283)
评论(0)
推荐(0)
2019年5月31日
Yarn 资源调度器
摘要: 1. 概述 YARN 是一个资源调度平台,负责为运算程序提供服务器运算资源; YARN 由ResourceManager,NodeManager, ApplicationMaster 和 Container 等组件构成; 2. YARN 工作机制 2.1 资源调度器 Hadoop 作业调度器主要有三
阅读全文
posted @ 2019-05-31 21:12 小a的软件思考
阅读(284)
评论(0)
推荐(0)
Hadoop Join
摘要: 1. Reduce Join工作原理 Map端的主要工作:为来自不同表或文件的key/value对,打标签以区别不同来源的记录。然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。 2. Map Join 使用场景:适用于一张表十分小,一张表很大的场景; 在 Map 端缓存多
阅读全文
posted @ 2019-05-31 20:53 小a的软件思考
阅读(381)
评论(0)
推荐(0)
Shuffle 机制
摘要: 1. 概述 Map 方法之后,Reduce 方法之前的数据处理过程称之为 Shuffle。 2. Partition 分区 需求:要求将统计结果按照条件输出到不同文件中(分区)。比如:将统计结果按照手机归属地,不同省份输出到不同文件中(分区)。 2.1 自定义 Partitioner 步骤 2.2
阅读全文
posted @ 2019-05-31 20:19 小a的软件思考
阅读(504)
评论(0)
推荐(0)
2019年5月30日
MapReduce 工作流程
摘要: 1. Map 阶段 ============================================= 2. Reduce 阶段
阅读全文
posted @ 2019-05-30 22:14 小a的软件思考
阅读(271)
评论(0)
推荐(0)
MapReduce 框架原理
摘要: 1. Hadoop 序列化 1.1 自定义Bean对象实现序列化接口 必须实现 Writable 接口; 反序列化时,需要反射调用空参构造函数,所以必须有空参构造; 重写序列化方法; 重写反序列化方法; 注意反序列化的顺序和序列化的顺序完全一致; 要想把结果显示在文件中,需要重写 toString(
阅读全文
posted @ 2019-05-30 22:03 小a的软件思考
阅读(397)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
32
下一页
公告