2014 年 5月随笔档案 - 玖疯

Flume-NG源码阅读之AvroSink

摘要：org.apache.flume.sink.AvroSink是用来通过网络来传输数据的，可以将event发送到RPC服务器（比如AvroSource），使用AvroSink和AvroSource可以组成分层结构。它继承自AbstractRpcSink extends AbstractSinkim... 阅读全文

posted @ 2014-05-27 18:55 玖疯阅读(2381) 评论(0) 推荐(0)

Flume-NG源码阅读之SourceRunner，及选择器selector和拦截器interceptor的执行

摘要：在AbstractConfigurationProvider类中loadSources方法会将所有的source进行封装成SourceRunner放到了Map sourceRunnerMap之中。相关代码如下： 1 Map selectorConfig = context.getSu... 阅读全文

posted @ 2014-05-26 15:48 玖疯阅读(2641) 评论(1) 推荐(1)

Flume-NG源码阅读之SinkGroups和SinkRunner

摘要：在AbstractConfigurationProvider类中loadSinks方法会调用loadSinkGroups方法将所有的sink和sinkgroup放到了Map sinkRunnerMap之中。 SinkRunner可能对应一个sink也可能对应一个sinkgroup。因为如果配置... 阅读全文

posted @ 2014-05-25 15:10 玖疯阅读(2999) 评论(0) 推荐(1)

MapReduce job在JobTracker初始化源码级分析

摘要：mapreduce job提交流程源码级分析（三）中已经说明用户最终调用JobTracker.submitJob方法来向JobTracker提交作业。而这个方法的核心提交方法是JobTracker.addJob(JobID jobId, JobInProgress job)方法，这个addJob... 阅读全文

posted @ 2014-05-22 10:24 玖疯阅读(1331) 评论(1) 推荐(0)

Flume-NG源码阅读之FileChannel

摘要：FileChannel是flume一个非常重要的channel组件，非常常用。这个channel非常复杂，涉及的文件更多涉及三个包：org.apache.flume.channel.file、org.apache.flume.channel.file.encryption(加密)、org.apa... 阅读全文

posted @ 2014-05-18 17:59 玖疯阅读(4605) 评论(2) 推荐(2)

linux下gzip压缩同样内容大小不一样

摘要：一份数据，两种传输方式进行收集。一份数据：有多台数据采集节点或者多个数据源两种方式：一种是从依次多个采集节点或者多个数据源将数据拷贝过来，合并为一个文件另外一种是多个采集节点或者数据源同时向汇总端发送数据，最后合并为一个文件两种方式的不同：汇总后的数据都是一样的，但是顺... 阅读全文

posted @ 2014-05-14 19:50 玖疯阅读(1940) 评论(0) 推荐(0)

mapreduce job提交流程源码级分析（三）

摘要：mapreduce job提交流程源码级分析（二）（原创）这篇文章说到了jobSubmitClient.submitJob(jobId, submitJobDir.toString(), jobCopy.getCredentials())提交job，最终调用的是JobTracker.submit... 阅读全文

posted @ 2014-05-11 14:14 玖疯阅读(1046) 评论(0) 推荐(1)

JobTracker启动流程源码级分析

摘要：org.apache.hadoop.mapred.JobTracker类是个独立的进程，有自己的main函数。JobTracker是在网络环境中提交及运行MR任务的核心位置。 main方法主要代码有两句：1 //创建jobTracker对象2 JobTracker t... 阅读全文

posted @ 2014-05-08 18:08 玖疯阅读(1615) 评论(0) 推荐(0)

Flume-NG源码阅读之HDFSEventSink

摘要：HDFSEventSink是flume中一个很重要的sink，配置文件中type=hdfs。与此sink相关的类都在org.apache.flume.sink.hdfs包中。 HDFSEventSink算是一个比较复杂的sink，包下涉及的源代码文件数多达13个。。。可配置的参数众多。。。希望... 阅读全文

posted @ 2014-05-06 18:32 玖疯阅读(4328) 评论(0) 推荐(2)

尼玛——博客园

摘要：昨晚上的博客泡汤了。。。擦！！昨晚明明在22:00多保存草稿了。。。。尼玛早上一来，擦，真的是一夜回到解放前啊！记录到昨天下午4:00了。。。顿时心血付诸东流哇…… 从头再来的感觉。。。什么玩意啊…… 让我情何以堪？？让你情何以堪？？让这个园子里的同僚情何以堪？？容忍你一... 阅读全文

posted @ 2014-05-06 09:56 玖疯阅读(284) 评论(4) 推荐(0)

Flume-NG源码阅读之HBaseSink

摘要：关于HBase的sink的所有内容均在org.apache.flume.sink.hbase包下。每个sink包括自己定制的，都extends AbstractSink implements Configurable。一、首先是configure(Context context)方法。该... 阅读全文

posted @ 2014-05-04 19:01 玖疯阅读(2937) 评论(0) 推荐(0)

参与《【拉勾专场】抛弃简历！让代码说话！》编程挑战的尝试

摘要：强强联手，互联网垂直招聘专家拉勾网携手全球顶尖IT公司ThoughtWorks共同推出此次代码挑战！等你来打擂！题目：FizzBuzzWhizz你是一名体育老师，在某次课距离下课还有五分钟时，你决定搞一个游戏。此时有100名学生在上课。游戏的规则是：1. 你首先说出三个不同的特殊数，要求必须是个位数... 阅读全文

posted @ 2014-05-03 20:14 玖疯阅读(1043) 评论(6) 推荐(0)

玖疯

本来名字要写“疚疯”的，结果一不小心成“玖疯”了。。。

05 2014 档案

公告