会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Bruce
管理
上一页
1
···
8
9
10
11
12
13
14
15
16
···
77
下一页
2019年2月28日
大数据技术之_08_Hive学习_04_压缩和存储(Hive高级)+ 企业级调优(Hive优化)
摘要: 第8章 压缩和存储(Hive高级)8.1 Hadoop源码编译支持Snappy压缩8.1.1 资源准备8.1.2 jar包安装8.1.3 编译源码8.2 Hadoop压缩配置8.2.1 MR支持的压缩编码8.2.2 压缩参数配置8.3 开启Map输出阶段压缩8.4 开启Reduce输出阶段压缩8.5
阅读全文
posted @ 2019-02-28 19:40 黑泽君
阅读(960)
评论(0)
推荐(3)
2019年2月27日
大数据技术之_08_Hive学习_03_查询+函数
摘要: 第6章 查询6.1 基本查询(select … from)6.1.1 全表和特定列查询6.1.2 列别名6.1.3 算术运算符6.1.4 常用函数(聚合函数)6.1.5 limit语句6.2 where语句6.2.1 比较运算符(between/in/is null)6.2.2 like和rlike
阅读全文
posted @ 2019-02-27 18:19 黑泽君
阅读(880)
评论(0)
推荐(0)
2019年2月26日
count(*)、count(1)和count(column)区别以及执行效率高低比较
摘要: 【mysql】count(*)、count(1)和count(column)区别 小结: count(*) 对行的数目进行计算,包含NULL。 count(column) 对特定的列的值具有的行数进行计算,不包含NULL值。 count(1) 这个用法和count(*)的结果是一样的。 性能问题:
阅读全文
posted @ 2019-02-26 11:48 黑泽君
阅读(1906)
评论(0)
推荐(0)
2019年2月25日
大数据技术之_08_Hive学习_02_DDL数据定义(创建/查询/修改/删除数据库+创建表+分区表+修改表+删除表)+DML数据操作(数据导入+数据导出+清除表中数据)
摘要: 第4章 DDL数据定义4.1 创建数据库4.2 查询数据库4.2.1 显示数据库4.2.2 查看数据库详情4.3.3 切换当前数据库4.3 修改数据库4.4 删除数据库4.5 创建表4.5.1 管理表(内部表)4.5.2 外部表4.5.3 管理表与外部表的互相转换4.6 分区表4.6.1 分区表基本
阅读全文
posted @ 2019-02-25 21:30 黑泽君
阅读(751)
评论(0)
推荐(0)
大数据技术之_08_Hive学习_01_Hive入门+Hive安装、配置和使用+Hive数据类型
摘要: 第1章 Hive入门1.1 什么是Hive1.2 Hive的优缺点1.2.1 优点1.2.2 缺点1.3 Hive架构原理1.4 Hive和数据库比较1.4.1 查询语言1.4.2 数据存储位置1.4.3 数据更新1.4.4 索引1.4.5 执行1.4.6 执行延迟1.4.7 可扩展性1.4.8 数
阅读全文
posted @ 2019-02-25 00:28 黑泽君
阅读(1150)
评论(0)
推荐(0)
2019年2月24日
大数据技术之_07_Hadoop学习_HDFS_HA(高可用)_HA概述+HDFS-HA工作机制+HDFS-HA集群配置+YARN-HA配置+HDFS Federation(联邦) 架构设计
摘要: 第8章 HDFS HA 高可用8.1 HA概述8.2 HDFS-HA工作机制8.2.1 HDFS-HA工作要点8.2.2 HDFS-HA手动故障转移工作机制8.2.3 HDFS-HA自动故障转移工作机制8.3 HDFS-HA集群配置8.3.1 环境准备8.3.2 规划集群8.3.3 配置Zookee
阅读全文
posted @ 2019-02-24 10:22 黑泽君
阅读(767)
评论(0)
推荐(0)
2019年2月23日
大数据技术之_06_Zookeeper学习_Zookeeper入门+Zookeeper安装+Zookeeper内部原理+Zookeeper实战(开发重点)+企业面试真题
摘要: 第1章 Zookeeper入门1.1 概述1.2 特点1.3 数据结构1.4 应用场景1.5 下载地址第2章 Zookeeper安装2.1 本地模式安装部署2.2 配置参数解读第3章 Zookeeper内部原理3.1 选举机制(面试重点)3.2 节点类型3.3 stat结构体3.4 监听器原理(面试
阅读全文
posted @ 2019-02-23 01:37 黑泽君
阅读(950)
评论(3)
推荐(0)
2019年2月20日
大数据技术之_05_Hadoop学习_04_MapReduce_Hadoop企业优化(重中之重)+HDFS小文件优化方法+MapReduce扩展案例+倒排索引案例(多job串联)+TopN案例+找博客共同粉丝案例+常见错误及解决方案
摘要: 第6章 Hadoop企业优化(重中之重)6.1 MapReduce 跑的慢的原因6.2 MapReduce优化方法6.2.1 数据输入6.2.2 Map阶段6.2.3 Reduce阶段6.2.4 I/O传输6.2.5 数据倾斜问题6.2.6 常用的调优参数6.3 HDFS小文件优化方法6.3.1 H
阅读全文
posted @ 2019-02-20 23:02 黑泽君
阅读(678)
评论(0)
推荐(0)
2019年2月17日
大数据技术之_05_Hadoop学习_03_MapReduce_MapTask工作机制+ReduceTask工作机制+OutputFormat数据输出+Join多种应用+计数器应用+数据清洗(ETL)+Hadoop数据压缩+Yarn资源调度器
摘要: 3.3.4 WritableComparable排序3.3.5 WritableComparable排序案例实操(全排序)3.3.6 WritableComparable排序案例实操(区内排序)3.3.7 Combiner合并3.3.8 Combiner合并案例实操3.3.9 GroupingCom
阅读全文
posted @ 2019-02-17 18:24 黑泽君
阅读(811)
评论(0)
推荐(0)
2019年2月15日
大数据技术之_05_Hadoop学习_02_MapReduce_MapReduce框架原理+InputFormat数据输入+MapReduce工作流程(面试重点)+Shuffle机制(面试重点)
摘要: 第3章 MapReduce框架原理3.1 InputFormat数据输入3.1.1 切片与MapTask并行度决定机制3.1.2 Job提交流程源码和切片源码详解3.1.3 FileInputFormat切片机制3.1.4 CombineTextInputFormat切片机制3.1.5 Combin
阅读全文
posted @ 2019-02-15 23:29 黑泽君
阅读(1061)
评论(1)
推荐(1)
上一页
1
···
8
9
10
11
12
13
14
15
16
···
77
下一页