摘要:
Java 内存分区结构: 堆:存放new的对象和数组,可以被所有的线程共享,不会存放别的对象引用 栈:存放基本类型(包含具体数值的)、引用对象的变量(该引用对象在堆的具体地址) 方法区:存放class对象,static变量,可以被所有的线程共享 类的加载过程: 加载 - 链接 - 初始化 加载: c 阅读全文
posted @ 2021-08-02 22:43
没离开过o
阅读(70)
评论(0)
推荐(0)
摘要:
HDFS写入过程中各组件发生了什么事? HDFS有什么组件: Client NameNode(NN) DataNode(DN) 名词解释: block: HDFS的存储单元,默认128M pipeline:Client和DataNode之间用来传输数据建立的管道 packet:属于pipeline管 阅读全文
posted @ 2021-08-02 22:42
没离开过o
阅读(239)
评论(0)
推荐(0)
摘要:
##HDFS元数据是怎么管理的? 总所周知,HDFS的元数据都是保存在NameNode的内存里,放内存的好处很多,读写快,响应快,但是也会有要两个问题: 如果服务器重启后内存就会被清空,数据会丢失,数据怎么持久化? 单点NameNode的内存是有极限的,怎么扩展? (HDFS集群的性能瓶颈取决Nam 阅读全文
posted @ 2021-08-02 22:41
没离开过o
阅读(489)
评论(0)
推荐(0)
摘要:
1.什么是拉链表? 拉链表是属于用来应对缓慢变化维度的解决方案之一 2.拉链表的关键字段: (1) t_start_date 该记录的生效日期(生命周期开始) (2) t_end_date 该记录的失效日期(生命周期结束)默认 9999-12-31 3.拉链表的实现: #Hive场景 1 需要准备一 阅读全文
posted @ 2021-08-02 18:56
没离开过o
阅读(275)
评论(0)
推荐(0)

浙公网安备 33010602011771号