会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
大数据技术派
关注公众号:大数据技术派,回复“资料”,领取1000G资料。
首页
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
13
下一页
2021年11月23日
Spark SQL知识点与实战
摘要: Spark SQL概述 1、什么是Spark SQL Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。 与基本的Spark RDD API不同,Spark SQL的抽象数据类型为Spark提供了关于数据结构和正在执行的计算的更多信息。 在内部,Sp
阅读全文
posted @ 2021-11-23 00:27 大数据技术派
阅读(1182)
评论(0)
推荐(1)
2021年11月19日
Spark面试题(八)——Spark的Shuffle配置调优
摘要: 1、Shuffle优化配置 -spark.shuffle.file.buffer 默认值:32k 参数说明:该参数用于设置shuffle write task的BufferedOutputStream的buffer缓冲大小。将数据写到磁盘文件之前,会先写入buffer缓冲中,待缓冲写满之后,才会溢写
阅读全文
posted @ 2021-11-19 11:01 大数据技术派
阅读(404)
评论(0)
推荐(0)
2021年11月18日
Spark面试题(七)——Spark程序开发调优
摘要: Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf
阅读全文
posted @ 2021-11-18 23:48 大数据技术派
阅读(404)
评论(0)
推荐(0)
2021年11月16日
Spark面试题(六)——Spark资源调优
摘要: Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf
阅读全文
posted @ 2021-11-16 23:09 大数据技术派
阅读(274)
评论(0)
推荐(0)
2021年11月15日
Spark面试题(五)——数据倾斜调优
摘要: Spark面试题系列 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf
阅读全文
posted @ 2021-11-15 22:01 大数据技术派
阅读(498)
评论(0)
推荐(0)
Zookeeper面试题总结
摘要: 1、请简述Zookeeper的选举机制 假设有五台服务器组成的zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都是一样的。 假设这些服务器依序启动,来看看会发生什么。 (1)服务器1启动,此时只有它一台服务器启动了,它发出去的报没有任何响
阅读全文
posted @ 2021-11-15 10:25 大数据技术派
阅读(1154)
评论(0)
推荐(0)
2021年11月14日
Flume面试题整理
摘要: 1、Flume使用场景(☆☆☆☆☆) 线上数据一般主要是落地(存储到磁盘)或者通过socket传输给另外一个系统,这种情况下,你很难推动线上应用或服务去修改接口,实现直接向kafka里写数据,这时候你可能就需要flume这样的系统帮你去做传输。 2、Flume丢包问题(☆☆☆☆☆) 单机upd的fl
阅读全文
posted @ 2021-11-14 15:56 大数据技术派
阅读(525)
评论(0)
推荐(0)
2021年11月13日
Kafka面试题总结
摘要: 关注公众号:大数据技术派,回复: 资料,领取1024G资料。 1、Kafka 都有哪些特点? 高吞吐量、低延迟:kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒,每个topic可以分多个partition, consumer group 对partition进行consume操作。 可扩展
阅读全文
posted @ 2021-11-13 13:10 大数据技术派
阅读(2076)
评论(0)
推荐(0)
2021年11月9日
大数据SQL中的Join谓词下推,真的那么难懂?
摘要: 听到谓词下推这个词,是不是觉得很高大上,找点资料看了半天才能搞懂概念和思想,借这个机会好好学习一下吧。 引用范欣欣大佬的博客中写道,以前经常满大街听到谓词下推,然而对谓词下推却总感觉懵懵懂懂,并不明白的很真切。这里拿出来和大家交流交流。个人认为谓词下推有两个层面的理解: 其一是逻辑执行计划优化层面的
阅读全文
posted @ 2021-11-09 22:22 大数据技术派
阅读(607)
评论(3)
推荐(0)
2021年11月7日
Spark面试题(四)
摘要: Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf
阅读全文
posted @ 2021-11-07 20:17 大数据技术派
阅读(515)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
···
13
下一页
公告