Glückliches Kodierer

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2018年9月14日

摘要: 此文章虽然是面向C/C++程序员写得,但是对咱们Java程序员还是很有帮助的。堆和栈的区别一、预备知识—程序的内存分配一个由C/C++编译的程序占用的内存分为以下几个部分1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2、堆区(he 阅读全文
posted @ 2018-09-14 14:54 pla37401 阅读(65) 评论(0) 推荐(0)

摘要: Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流 阅读全文
posted @ 2018-09-14 14:47 pla37401 阅读(101) 评论(0) 推荐(0)

摘要: ​ Shuffle过程,也称Copy阶段。reduce task从各个map task上远程拷贝一片数据,并针对某一片数据,如果其大小超过一定的阀值,则写到磁盘上,否则直接放到内存中。 官方的Shuffle过程如上图所示,不过细节有错乱,官方图并没有说明partition、sort和combiner 阅读全文
posted @ 2018-09-14 14:44 pla37401 阅读(89) 评论(0) 推荐(0)