摘要: Combiner编程、reduce join、map join、mapreduce优化总结、通过自定义分区类避免数据倾斜、MapReduce自定义排序 Combiner编程 reduce join map join mapreduce优化总结 通过自定义分区类避免数据倾斜 #每一个reduce任务生 阅读全文
posted @ 2022-03-25 10:57 阿伟宝座 阅读(77) 评论(0) 推荐(0)
摘要: 常用的Writable实现类 Java基本类型 Writable 序列化大小(字节) 布尔型(boolean) BooleanWritable 1 字节型(byte) ByteWritable 1 整型(int) IntWritable 4 VIntWritable 1~5 浮点型(float) F 阅读全文
posted @ 2022-03-25 10:40 阿伟宝座 阅读(130) 评论(0) 推荐(0)
摘要: 什么是序列化?为什么要序列化? 序列化(Serialization):将对象的状态信息转换为可以存储或传输的形式的过程。 在序列化期间,对象将其当前状态写入到临时或持久性存储区。 以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。 当两个进程在进行远程通信时,彼此可以发送各种类型的数 阅读全文
posted @ 2022-03-25 09:46 阿伟宝座 阅读(1017) 评论(0) 推荐(0)