会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
另见 https://ibuddha.github.io/
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
下一页
2015年12月15日
Kafka之ReplicaManager(1)
摘要: 基于Kafka 0.9.0版ReplicaManager需要做什么Replicated LogsKafka的partition可以看成是一个replicated log, 每个replica就是这个replicated log其中的一个log。多个replica是为了容忍机器故障,因此同一个part...
阅读全文
posted @ 2015-12-15 20:55 devos
阅读(1040)
评论(0)
推荐(0)
2015年9月17日
sort-based shuffle的核心:org.apache.spark.util.collection.ExternalSorter
摘要: 依据Spark 1.4版在哪里会用到它ExternalSorter是Spark的sort形式的shuffle实现的关键。SortShuffleWriter使用它,把RDD分区中的数据写入文件。 override def write(records: Iterator[Product2[K, V]]...
阅读全文
posted @ 2015-09-17 16:06 devos
阅读(2504)
评论(0)
推荐(0)
2015年9月13日
shuffle过程中的信息传递
摘要: 依据Spark1.4版Spark中的shuffle大概是这么个过程:map端把map输出写成本地文件,reduce端去读取这些文件,然后执行reduce操作。那么,问题来了:reducer是怎么知道它的输入在哪呢?首先,mapper在写完文件之后,肯定能提供与它的输出相关的信息。这个信息,在Spar...
阅读全文
posted @ 2015-09-13 08:54 devos
阅读(983)
评论(0)
推荐(0)
2015年9月11日
Spark中shuffle的触发和调度
摘要: Spark中的shuffle是在干嘛?Shuffle在Spark中即是把父RDD中的KV对按照Key重新分区,从而得到一个新的RDD。也就是说原本同属于父RDD同一个分区的数据需要进入到子RDD的不同的分区。但这只是shuffle的过程,却不是shuffle的原因。为何需要shuffle呢?Shuf...
阅读全文
posted @ 2015-09-11 12:58 devos
阅读(7713)
评论(0)
推荐(0)
2015年9月6日
关于Spark中RDD的设计的一些分析
摘要: RDD, Resilient Distributed Dataset,弹性分布式数据集, 是Spark的核心概念。对于RDD的原理性的知识,可以参阅Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory C...
阅读全文
posted @ 2015-09-06 11:27 devos
阅读(2818)
评论(0)
推荐(0)
2015年8月19日
Spark的TorrentBroadcast:实现
摘要: 依据Spark 1.4版序列化和反序列化前边提到,TorrentBroadcast的关键就在于特殊的序列化和反序列化设置。1.1版的TorrentBroadcast实现了自己的readObject和writeObject方法,但是1.4.1版的TorrentBroadcast没有实现自己的readO...
阅读全文
posted @ 2015-08-19 09:07 devos
阅读(1054)
评论(0)
推荐(0)
2015年8月16日
Spark的TorrentBroadcast:概念和原理
摘要: 依据Spark 1.4.1源码SparkContext的broadcast方法注释可以用SparkContext将一个变量广播到所有的executor上,使得所有executor都能获取这个变量代表的数据。SparkContext对于broadcast方法的注释为:/** * Broadcast a...
阅读全文
posted @ 2015-08-16 11:33 devos
阅读(2101)
评论(0)
推荐(0)
2015年4月23日
case class inheritance
摘要: Scala 禁止case class inheritancecase class Person(name: String, age: Int)case class FootballPlayer(name: String, age: Int, number: Int) extends Person(n...
阅读全文
posted @ 2015-04-23 22:04 devos
阅读(2116)
评论(0)
推荐(0)
2015年4月18日
[Akka]发送一条消息的内部流程
摘要: 本想通过了解一下Akka-actor工程中主要的类的概念,来看下Akka内部运作的机制。无奈里边的类的确太多,注释中对每个类的功能也没有足够的解释。所以还是通过debug的方式,找个入手点,看一下互相之间调用的关系。最初的选择是看一下ActorSystem的实始化过程,但发现难度挺大,因为这个初始化...
阅读全文
posted @ 2015-04-18 23:56 devos
阅读(2608)
评论(1)
推荐(1)
2015年4月13日
Akka Stream文档翻译:Motivation
摘要: 动机MotivationThe way we consume services from the internet today includes many instances of streaming data, both down- loading from a service as well a...
阅读全文
posted @ 2015-04-13 11:52 devos
阅读(766)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
下一页
公告