会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
每天进步一小步
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
下一页
2020年3月24日
Hive学习(十) Hive连接工具beeline
摘要: 官方文档:https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients beeline 的常用参数 The Beeline CLI 支持以下命令行参数: Option Description --autoCommit=[tr
阅读全文
posted @ 2020-03-24 11:30 一个人、一座城
阅读(1423)
评论(0)
推荐(0)
2019年12月30日
Linux 查找文件
摘要: -- 当前目录下查找文件中含有字符-temp的文件 find . -name "*.*" | xargs grep "temp"
阅读全文
posted @ 2019-12-30 16:45 一个人、一座城
阅读(139)
评论(0)
推荐(0)
2019年8月2日
Spark2.4.3 部署
摘要: scala下载地址:https://www.scala-lang.org/download/ spark下载地址:https://spark.apache.org/downloads.html 安装步骤 安装scala tar -zxvf scala-2.13.0.tgz scp -r scala-
阅读全文
posted @ 2019-08-02 09:54 一个人、一座城
阅读(1175)
评论(0)
推荐(0)
2019年7月26日
Hive学习(九) 参数设置(调优)
摘要: Hive的参数设置方式 1、配置文件 (全局有效) 2、命令行参数(对 hive 启动实例有效) 3、参数声明 (对 hive 的连接 session 有效) (1)配置文件 Hive 的配置文件包括: A. 用户自定义配置文件:$HIVE_CONF_DIR/hive-site.xml B. 默认配
阅读全文
posted @ 2019-07-26 14:18 一个人、一座城
阅读(3052)
评论(0)
推荐(1)
Hive学习(八) 排序:order by、sort by、distribute by、cluster by
摘要: hive中有四种排序: 1、全局排序:order by 2、内部排序:sort by 3、分区排序:distribute by 4、组合排序:cluster by 全局排序:order by 说明:全局排序是在一个MapReduce中进行排序的。 参数: ASC:是升序的意思和mysql一样,同时也
阅读全文
posted @ 2019-07-26 14:08 一个人、一座城
阅读(861)
评论(0)
推荐(0)
2019年7月24日
Linux shuf
摘要: shuf 随机切分文件内容 打乱文件行号 shuf imei.txt > imei_1.txt 1/把文随机切分成若干部分 (1)全部打乱 shuf imei.txt > imei_info.txt (2)顺序切分 前100行 $ head -n100 imei_info.txt > imei_1.
阅读全文
posted @ 2019-07-24 19:57 一个人、一座城
阅读(710)
评论(0)
推荐(0)
2019年7月23日
Hive学习(七) 数据类型
摘要: 基本类型 类型名称 大小 最小值 最大值 示例 TINYINT 1byte -128 127 100Y SMALLINT 2byte -32768 32767 100S INT 4byte -2,147,483,648 2,147,483,647 100 BIGINT 8byte -9,223,37
阅读全文
posted @ 2019-07-23 10:56 一个人、一座城
阅读(958)
评论(0)
推荐(0)
Hive学习(六) 数据操作
摘要: 加载数据,2种方式 从文件加载到Hive表 从查询插入到Hive表
阅读全文
posted @ 2019-07-23 10:44 一个人、一座城
阅读(141)
评论(0)
推荐(0)
Hive学习(五) 表操作(创建/删除/添加/修改)
摘要: 创建简单表 创建分区表 一个表可以拥有一个或者多个分区,每个分区以文件夹的形式单独存在表文件夹的目录下。 分区是以字段的形式在表结构中存在,通过describe table命令可以查看到字段存在,但是该字段不存放实际的数据内容,仅仅是分区的表示。 在Hive Select查询中一般会扫描整个表内容,
阅读全文
posted @ 2019-07-23 10:38 一个人、一座城
阅读(667)
评论(0)
推荐(0)
2019年7月17日
Hive学习(四) 开窗函数
摘要: 1、row_number、rank、dense_rank ROW_NUMBER() –从1开始,按照顺序,生成分组内记录的序列 RANK() 生成数据项在分组中的排名,排名相等会在名次中留下空位 DENSE_RANK() 生成数据项在分组中的排名,排名相等会在名次中不会留下空位 2、sum、avg、
阅读全文
posted @ 2019-07-17 11:13 一个人、一座城
阅读(1021)
评论(0)
推荐(0)
上一页
1
2
3
下一页
公告