会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
songxr
博客园
首页
新随笔
联系
订阅
管理
[置顶]
大数据面试题问题
摘要: Hadoop面试题(约5.5w字) Hadoop基础 介绍下Hadoop Hadoop的特点 说下Hadoop生态圈组件及其作用 Hadoop主要分哪几个部分?他们有什么作用? Hadoop 1.x,2x,3.x的区别 Hadoop集群工作时启动哪些进程?它们有什么作用? 在集群计算的时候,什么是集
阅读全文
posted @ 2022-12-30 19:16 闻染呀
阅读(235)
评论(1)
推荐(0)
[置顶]
数仓随记
摘要: 表全量、增量选择 大表 变化大 全量 大表 变化小 增量 小表 变化大 全量 小表 变化小 全量 查看hdf以gzip压缩的文件 hadoop fs -cat /xxxx/xxx.gz | gzip -d 或 hadoop fs -cat /xxxx/xxx.gz | zcat dataX动态传参
阅读全文
posted @ 2022-12-01 21:57 闻染呀
阅读(35)
评论(0)
推荐(0)
2022年12月30日
大数据开发面试题,牛客上面试被问频率最高的几道面试题
摘要: 大数据开发面试题,牛客上面试被问频率最高的几道面试题 一、Hadoop部分 一、HDFS文件写入和读取过程****可灵活回答:1)HDFS读写原理(流程)2)HDFS上传下载流程3)讲讲(介绍下)HDFS 4)HDFS存储机制问过的一些公司:阿里×3,阿里社招,腾讯x2,字节x2,百度,拼多多x2,
阅读全文
posted @ 2022-12-30 19:12 闻染呀
阅读(593)
评论(0)
推荐(0)
2022年12月11日
Hive数据存储格式详细讲解
摘要: Hive数据存储格式详细讲解 0-前言 1-TextFile 2-SequenceFile 3-RCFile 4-ORCFile 4.1-ORC相比较 RCFile 的优点 4.2-ORC的基本结构 4.3-ORC的数据类型 4.4-ORC 的 ACID 事务的支持 4.5-ORC 相关的 Hive
阅读全文
posted @ 2022-12-11 11:47 闻染呀
阅读(1376)
评论(0)
推荐(0)
HIVE中,order by、sort by、 distribute by和 cluster by区别,以及cluster by有什么意义
摘要: HIVE中,order by、sort by、 distribute by和 cluster by区别,以及cluster by有什么意义 1. oreder by 主要是做全局排序。 只要hive的sql中指定了order by,那么所有的数据都会到同一个reducer进行处理**(不管有多少
阅读全文
posted @ 2022-12-11 11:28 闻染呀
阅读(1251)
评论(0)
推荐(0)
2022年12月4日
sql题解--打折日期交叉问题
摘要: 题目-打折日期交叉问题 现有各品牌优惠周期表(promotion_info)如下,其记录了每个品牌的每个优惠活动的周期,其中同一品牌的不同优惠活动的周期可能会有交叉。 | promotion_id | brand | start_date | end_date | | : : | : : | : :
阅读全文
posted @ 2022-12-04 17:43 闻染呀
阅读(221)
评论(0)
推荐(0)
2022年12月2日
sql题解--求出平台同时在线最多的人数
摘要: 题目-求出平台同时在线最多的人数 题目需求 根据用户登录明细表(user_login_detail),求出平台同时在线最多的人数。 结果如下: | cn | | : : | | 7 | 需要用到的表: 用户登录明细表:user_login_detail | user_id(用户id) | ip_ad
阅读全文
posted @ 2022-12-02 16:59 闻染呀
阅读(173)
评论(0)
推荐(0)
sql题解--连续签到领金币
摘要: 题解 | #连续签到领金币# 题目需求 用户每天签到可以领1金币,并可以累计签到天数,连续签到的第3、7天分别可以额外领2和6金币。 每连续签到7天重新累积签到天数。 从用户登录明细表中求出每个用户金币总数,并按照金币总数倒序排序 结果如下: | user_id (用户id) | sum_coin_
阅读全文
posted @ 2022-12-02 13:32 闻染呀
阅读(480)
评论(0)
推荐(0)
sql 执行过程
摘要: # sql 执行过程 具体顺序如下: FROM -> ON -> JOIN -> WHERE -> GROUP BY -> AGG_FUNC -> WITH -> HAVING -> SELECT -> DISTINCT -> ORDER BY -> LIMIT/OFFSET 图示: 1 FROM
阅读全文
posted @ 2022-12-02 13:10 闻染呀
阅读(195)
评论(0)
推荐(0)
2022年11月30日
Hive进阶
摘要: title: Hive进阶 cover: /cover_imgs/hive.png tags: Hive categories: Hive 第 1 章 Explain 查看执行计划(重点) 1.1 基础语法 EXPLAIN [EXTENDED | DEPENDENCY | AUTHORIZATION
阅读全文
posted @ 2022-11-30 22:16 闻染呀
阅读(90)
评论(0)
推荐(0)
下一页
公告