会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
soft
LxFly
相信技术会改变一切!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
10
11
12
13
14
15
16
17
18
下一页
2016年3月26日
Spark作业调度阶段分析
摘要: Spark作为分布式的大数据处理框架必然或涉及到大量的作业调度,如果能够理解Spark中的调度对我们编写或优化Spark程序都是有很大帮助的; 在Spark中存在 转换操作(Transformation Operation) 与 行动操作(Action Operation) 两种;而转换操作只是会从
阅读全文
posted @ 2016-03-26 08:58 AiFly
阅读(738)
评论(0)
推荐(0)
2016年2月27日
Spark——共享变量
摘要: Spark执行不少操作时都依赖于 闭包函数 的调用,此时如果闭包函数使用到了外部变量驱动程序在使用行动操作时传递到集群中各worker节点任务时就会进行一系列操作: 1、驱动程序使将闭包中使用变量封装成对象,驱动程序序列化对象,传给worker节点任务; 2、worker节点任务接收到对象,执行闭包
阅读全文
posted @ 2016-02-27 20:22 AiFly
阅读(1877)
评论(0)
推荐(0)
2016年1月14日
Spark编译与打包
摘要: 编译打包 Spark支持Maven与SBT两种编译工具,这里使用了Maven进行编译打包; 在执行make distribution脚本时它会检查本地是否已经存在Maven还有当前Spark所依赖的Scala版本,如果不存在它会自动帮你下载到build目录中并解压使用;Maven源最好...
阅读全文
posted @ 2016-01-14 21:43 AiFly
阅读(1671)
评论(0)
推荐(0)
2016年1月9日
Spark核心——RDD
摘要: Spark中最核心的概念为 RDD(Resilient Distributed DataSets) 中文为: 弹性分布式数据集 ,RDD为对分布式内存对象的 抽象它表示一个 被分区不可变 且能 并行操作 的数据集;RDD为可序列化的、可缓存到内存对RDD进行操作过后还可以存到内存中,下次操作直接把内...
阅读全文
posted @ 2016-01-09 17:31 AiFly
阅读(589)
评论(0)
推荐(0)
2016年1月5日
Spark运行模式与Standalone模式部署
摘要: 上节中简单的介绍了 Spark 的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署; Spark运行模式 在 Spark 中存在着多种运行模式,可使用本地模式运行、可使用伪分布式模式运行、使用分布式模式也存在多种模式如:S...
阅读全文
posted @ 2016-01-05 07:44 AiFly
阅读(7248)
评论(0)
推荐(1)
2015年12月28日
Scala初入
摘要: 何为Scala物 Scala 为基于JVM虚拟机中的面向对象与 函数式编程 思想并且完全兼容Java的混合编程语言,可以是Scala与Java是同根同源的,既然Scala与JAVA都是基于JVM之上的编程语言那么Scala的特色又在哪呢 Scala最大的特色就是他是支持函数式编程的,函数式...
阅读全文
posted @ 2015-12-28 07:43 AiFly
阅读(680)
评论(0)
推荐(0)
2015年12月22日
Spark概述
摘要: 背景 目前按照大数据处理类型来分大致可以分为:批量数据处理、交互式数据查询、实时数据流处理,这三种数据处理方式对应的业务场景也都不一样; 关注大数据处理的应该都知道Hadoop,而Hadoop的核心为 HDFS 与 MapReduce ,HDFS分布式文件系统在Hadop中是用来存储数...
阅读全文
posted @ 2015-12-22 22:52 AiFly
阅读(625)
评论(0)
推荐(0)
2015年11月22日
React Native初试:Windows下Andriod环境搭建
摘要: 最近想写个App,又觉得Native App 太无趣了Web App又没那么成熟然后发现了Facebook在9月发布的React Native比较新奇,所以决定捣鼓看看; React Native为Facebook开源的使用Javascript与React开发Android、IOS原生跨平台A...
阅读全文
posted @ 2015-11-22 18:07 AiFly
阅读(1413)
评论(0)
推荐(0)
2015年11月15日
Fiddler基本原理与抓取Andriod与IOS的App数据包
摘要: Fiddler基本原理 Fiddler数据包的原理是Fiddler将自己设置为一个代理服务器,默认监听127.0.0.1:8888端口同时将浏览器的HTTP、HTTPS协议设置为使用代理服务器也就是使用自己作为浏览器的代理服务器; 1\.Fiddler原理图 打...
阅读全文
posted @ 2015-11-15 15:56 AiFly
阅读(3064)
评论(0)
推荐(0)
2015年9月21日
并发编程之可变状态
摘要: 熟悉Java或如C 等使用共享内存模型作为并发实现的人都比较清楚,编写线程安全的代码很关键的一点就是要控制好 可变状态 ,对于Java开发者来说可能用 内存可见性 更容易理解,在各种关于并发的书籍中都是处理好内存可见性问题编写线程安全的代码就成功了一半了,但我认为“内存可见性”太过于抽象、底层,使开...
阅读全文
posted @ 2015-09-21 08:51 AiFly
阅读(719)
评论(0)
推荐(1)
上一页
1
···
10
11
12
13
14
15
16
17
18
下一页