上一页 1 2 3 4 5 6 7 8 9 10 ··· 13 下一页
摘要: Spark SQL概述 1、什么是Spark SQL Spark SQL是Spark用于结构化数据(structured data)处理的Spark模块。 与基本的Spark RDD API不同,Spark SQL的抽象数据类型为Spark提供了关于数据结构和正在执行的计算的更多信息。 在内部,Sp 阅读全文
posted @ 2021-11-23 00:27 大数据技术派 阅读(1182) 评论(0) 推荐(1)
摘要: 1、Shuffle优化配置 -spark.shuffle.file.buffer 默认值:32k 参数说明:该参数用于设置shuffle write task的BufferedOutputStream的buffer缓冲大小。将数据写到磁盘文件之前,会先写入buffer缓冲中,待缓冲写满之后,才会溢写 阅读全文
posted @ 2021-11-19 11:01 大数据技术派 阅读(404) 评论(0) 推荐(0)
摘要: Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf 阅读全文
posted @ 2021-11-18 23:48 大数据技术派 阅读(404) 评论(0) 推荐(0)
摘要: Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf 阅读全文
posted @ 2021-11-16 23:09 大数据技术派 阅读(274) 评论(0) 推荐(0)
摘要: Spark面试题系列 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf 阅读全文
posted @ 2021-11-15 22:01 大数据技术派 阅读(498) 评论(0) 推荐(0)
摘要: 1、请简述Zookeeper的选举机制 假设有五台服务器组成的zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都是一样的。 假设这些服务器依序启动,来看看会发生什么。 (1)服务器1启动,此时只有它一台服务器启动了,它发出去的报没有任何响 阅读全文
posted @ 2021-11-15 10:25 大数据技术派 阅读(1154) 评论(0) 推荐(0)
摘要: 1、Flume使用场景(☆☆☆☆☆) 线上数据一般主要是落地(存储到磁盘)或者通过socket传输给另外一个系统,这种情况下,你很难推动线上应用或服务去修改接口,实现直接向kafka里写数据,这时候你可能就需要flume这样的系统帮你去做传输。 2、Flume丢包问题(☆☆☆☆☆) 单机upd的fl 阅读全文
posted @ 2021-11-14 15:56 大数据技术派 阅读(525) 评论(0) 推荐(0)
摘要: 关注公众号:大数据技术派,回复: 资料,领取1024G资料。 1、Kafka 都有哪些特点? 高吞吐量、低延迟:kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒,每个topic可以分多个partition, consumer group 对partition进行consume操作。 可扩展 阅读全文
posted @ 2021-11-13 13:10 大数据技术派 阅读(2076) 评论(0) 推荐(0)
摘要: 听到谓词下推这个词,是不是觉得很高大上,找点资料看了半天才能搞懂概念和思想,借这个机会好好学习一下吧。 引用范欣欣大佬的博客中写道,以前经常满大街听到谓词下推,然而对谓词下推却总感觉懵懵懂懂,并不明白的很真切。这里拿出来和大家交流交流。个人认为谓词下推有两个层面的理解: 其一是逻辑执行计划优化层面的 阅读全文
posted @ 2021-11-09 22:22 大数据技术派 阅读(607) 评论(3) 推荐(0)
摘要: Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——Spark程序开发调优 Spark面试题(八)——Spark的Shuf 阅读全文
posted @ 2021-11-07 20:17 大数据技术派 阅读(515) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 13 下一页