会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
atao-BigData
人生如逆旅,你我亦行人。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
26
27
28
29
30
31
32
33
34
···
39
下一页
2022年6月8日
Hive-day06基本函数_窗口函数_行列转换_UDF_连续登录问题
摘要: hive-基本函数_窗口函数_行列转换_UDF_连续登录问题 SQL练习 1、count(*)、count(1) 、count('字段名') 区别 从执行结果来看 count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略列值为NULL 最慢的 count(1)包括了忽略所有列,用1代表
阅读全文
posted @ 2022-06-08 19:19 a-tao必须奥利给
阅读(236)
评论(0)
推荐(0)
2022年6月7日
Hive-day05_(hive_优化学习)
摘要: Hive_优化学习 Hive优化(面试宝典)大部分需要开启额外的配置 1.1 hive的随机抓取策略 理论上来说,Hive中的所有sql都需要进行mapreduce,但是hive的抓取策略帮我们 省略掉了这个过程,把切片split的过程提前帮我们做了。 set hive.fetch.task.con
阅读全文
posted @ 2022-06-07 20:29 a-tao必须奥利给
阅读(66)
评论(0)
推荐(0)
2022年6月6日
hive-day03_排序和行列转换
摘要: 4、Hive查询语法(DQL) SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list] [ORDER BY col_l
阅读全文
posted @ 2022-06-06 18:53 a-tao必须奥利给
阅读(161)
评论(0)
推荐(0)
2022年6月4日
Hadoop-day09_hadoop优化
摘要: Hadoop优化 案例、天气预报 随机生成温度代码 package com.shujia.weather; import java.text.DateFormat; import java.text.ParseException; import java.text.SimpleDateFormat;
阅读全文
posted @ 2022-06-04 14:56 a-tao必须奥利给
阅读(46)
评论(0)
推荐(0)
Hive-day03_hive的基本操作
摘要: 2、Hive的基本操作 2.1 Hive库操作 2.1.1 创建数据库 1)创建一个数据库,数据库在HDFS上的默认存储路径是/hive/warehouse/*.db。 create database testdb; 2)避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法
阅读全文
posted @ 2022-06-04 11:02 a-tao必须奥利给
阅读(178)
评论(0)
推荐(0)
2022年6月3日
Hive-day03_分区|分桶|java连接hive
摘要: Hive1.2.1学习 1、Hive分区 在大数据中,最常见的一种思想就是分治,我们可以把大的文件切割划分成一个个的小的文件,这样每次操作一个个小的文件就会很容易了,同样的道理,在hive当中也是支持这种思想的,就是我们可以把大的数据,按照每天或者每小时切分成一个个小的文件,这样去操作小的文件就会容
阅读全文
posted @ 2022-06-03 22:57 a-tao必须奥利给
阅读(197)
评论(0)
推荐(0)
2022年6月1日
Hive-day03_hive介绍和三种交互方式
摘要: Hive1.2.1_hive介绍和三种交互方式 1、Hive基本概念 1.1 Hive简介 Hive本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更近一步说hive就是一个MapRed
阅读全文
posted @ 2022-06-01 21:17 a-tao必须奥利给
阅读(430)
评论(0)
推荐(0)
2022年5月31日
Hive_day01(概述与安装)
摘要: hive-概述与安装 数据仓库架构(手绘,引出hive在其中的角色) 数据仓库层的划分: 2.1 什么是hive?(面试题) 1:hive是基于hadoop的数据仓库建模工具之一(后面还有TEZ,Spark)。 2:hive可以使用类sql方言,对存储在hdfs上的数据进行分析和管理。传入一
阅读全文
posted @ 2022-05-31 21:48 a-tao必须奥利给
阅读(60)
评论(0)
推荐(0)
Hive-day01_引入背景
摘要: Hive(数据仓库建模工具之一) 一、数据库、数据仓库概述 如今,随着诸如互联网以及物联网等技术的不断发展,越来越多的数据被生产出来-据统计,每天大约有超过2.5亿亿字节的各种各样数据产生。这些数据需要被存储起来并且能够被方便的分析和利用。 随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发
阅读全文
posted @ 2022-05-31 19:36 a-tao必须奥利给
阅读(64)
评论(0)
推荐(0)
2022年5月30日
Hadoop-day08_MapReduce源码分析
摘要: MapReduce源码分析 快捷键 ctrl+alt+方向键:查看上一个或者下一个方法 ctrl+shift+alt+c: 拷贝方法的全名 com.shujia.airPM25.Pm25Avg#main ctrl+alt+b:查看当前接口的实现类 9.1 Split 带着问题看源码: 1、map的数
阅读全文
posted @ 2022-05-30 21:05 a-tao必须奥利给
阅读(48)
评论(0)
推荐(0)
上一页
1
···
26
27
28
29
30
31
32
33
34
···
39
下一页
公告