05 2018 档案

摘要:在前一篇文章《Win7 下使用spark 对文件进行处理》中,搭建了一个win7的开发测试环境,生成了一个jar执行包,并能够成功的在本机以多线程方式调试及运行,但将这个包分发到linux spark集群上,以standalone方式运行时,却报如下异常: 18/05/22 17:13:22 ERR 阅读全文
posted @ 2018-05-23 10:51 黎明踏浪号 阅读(5988) 评论(0) 推荐(0)
摘要:Spark是由加州大学伯克利分校的AMPLab于2009年开发,并于2014年成为Apache的顶级项目,其本身是一个基于内存的分布式处理框架,能够处理批运算,在Spark Streaming模块的支持下,也可以用于流式实时处理,Spark从一开始便是作为一个生态系统出现,是一个通用的计算框架,本文 阅读全文
posted @ 2018-05-07 16:40 黎明踏浪号 阅读(718) 评论(0) 推荐(0)