大数据开发工师面试复盘

最近面试了静极思动,面试了不少大数据相关岗位。总结了一下考察的相关范围:

1、Java基础

出乎意料,大数据岗也会问一下不少Java的知识,像 多线程、JVM内存管理、四种引用、GC机制、CMS和G1区别 都是考察的重点

2、算法

HiveSQL 经典:分组TopN、连续值求解问题

经典算法:超内存比较、二叉树遍历、链表反转等

3、Hive/Spark问题

运行机制、Shuffle原理、常用API、数据倾斜、算法优化、广播变量、小文件、SQL解析机制(大厂)、RPC机制(源码,这种只有一线大厂才会问)

4、结合自身岗位的其他大数据组件:HDFS、Hbase、Kafka、Redis等

以实操解决问题居多、基础数据结构次之、原理最少

 

总结:加强Flink的学习,流式计算为自身弱点

posted @ 2021-09-23 09:49  梦里繁花  阅读(75)  评论(0编辑  收藏  举报