上一页 1 ··· 26 27 28 29 30 31 32 33 34 ··· 39 下一页
摘要: hive-基本函数_窗口函数_行列转换_UDF_连续登录问题 SQL练习 1、count(*)、count(1) 、count('字段名') 区别 从执行结果来看 count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略列值为NULL 最慢的 count(1)包括了忽略所有列,用1代表 阅读全文
posted @ 2022-06-08 19:19 a-tao必须奥利给 阅读(236) 评论(0) 推荐(0)
摘要: Hive_优化学习 Hive优化(面试宝典)大部分需要开启额外的配置 1.1 hive的随机抓取策略 理论上来说,Hive中的所有sql都需要进行mapreduce,但是hive的抓取策略帮我们 省略掉了这个过程,把切片split的过程提前帮我们做了。 set hive.fetch.task.con 阅读全文
posted @ 2022-06-07 20:29 a-tao必须奥利给 阅读(66) 评论(0) 推荐(0)
摘要: 4、Hive查询语法(DQL) SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list] [ORDER BY col_l 阅读全文
posted @ 2022-06-06 18:53 a-tao必须奥利给 阅读(161) 评论(0) 推荐(0)
摘要: Hadoop优化 案例、天气预报 随机生成温度代码 package com.shujia.weather; import java.text.DateFormat; import java.text.ParseException; import java.text.SimpleDateFormat; 阅读全文
posted @ 2022-06-04 14:56 a-tao必须奥利给 阅读(46) 评论(0) 推荐(0)
摘要: 2、Hive的基本操作 2.1 Hive库操作 2.1.1 创建数据库 1)创建一个数据库,数据库在HDFS上的默认存储路径是/hive/warehouse/*.db。 create database testdb; 2)避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法 阅读全文
posted @ 2022-06-04 11:02 a-tao必须奥利给 阅读(178) 评论(0) 推荐(0)
摘要: Hive1.2.1学习 1、Hive分区 在大数据中,最常见的一种思想就是分治,我们可以把大的文件切割划分成一个个的小的文件,这样每次操作一个个小的文件就会很容易了,同样的道理,在hive当中也是支持这种思想的,就是我们可以把大的数据,按照每天或者每小时切分成一个个小的文件,这样去操作小的文件就会容 阅读全文
posted @ 2022-06-03 22:57 a-tao必须奥利给 阅读(197) 评论(0) 推荐(0)
摘要: Hive1.2.1_hive介绍和三种交互方式 1、Hive基本概念 1.1 Hive简介 Hive本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更近一步说hive就是一个MapRed 阅读全文
posted @ 2022-06-01 21:17 a-tao必须奥利给 阅读(430) 评论(0) 推荐(0)
摘要: hive-概述与安装 数据仓库架构(手绘,引出hive在其中的角色) 数据仓库层的划分: 2.1 什么是hive?(面试题) ​ 1:hive是基于hadoop的数据仓库建模工具之一(后面还有TEZ,Spark)。 ​ 2:hive可以使用类sql方言,对存储在hdfs上的数据进行分析和管理。传入一 阅读全文
posted @ 2022-05-31 21:48 a-tao必须奥利给 阅读(60) 评论(0) 推荐(0)
摘要: Hive(数据仓库建模工具之一) 一、数据库、数据仓库概述 如今,随着诸如互联网以及物联网等技术的不断发展,越来越多的数据被生产出来-据统计,每天大约有超过2.5亿亿字节的各种各样数据产生。这些数据需要被存储起来并且能够被方便的分析和利用。 随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发 阅读全文
posted @ 2022-05-31 19:36 a-tao必须奥利给 阅读(64) 评论(0) 推荐(0)
摘要: MapReduce源码分析 快捷键 ctrl+alt+方向键:查看上一个或者下一个方法 ctrl+shift+alt+c: 拷贝方法的全名 com.shujia.airPM25.Pm25Avg#main ctrl+alt+b:查看当前接口的实现类 9.1 Split 带着问题看源码: 1、map的数 阅读全文
posted @ 2022-05-30 21:05 a-tao必须奥利给 阅读(48) 评论(0) 推荐(0)
上一页 1 ··· 26 27 28 29 30 31 32 33 34 ··· 39 下一页