随笔分类 -  004_Spark

摘要:【序言】 Spark 基于内存的基本类型 (primitive)为一些应用程序带来了 100 倍的性能提升。Spark 允许用户程序将数据加载到 集群内存中用于反复查询,非常适用于大数据和机器学习。 目前,Spark 已经超越 Spark 核心,发展到了 Spark streaming、SQL、ML 阅读全文
posted @ 2017-02-15 16:52 Aviva_ye 阅读(388) 评论(0) 推荐(0)
摘要:【下载】 注意选择spark版本时,与hadoop的版本要搭配 http://spark.apache.org/downloads.html 【安装】 阅读全文
posted @ 2017-02-14 17:07 Aviva_ye 阅读(199) 评论(0) 推荐(0)
摘要:【简介】 官网:http://spark.apache.org/ 推荐学习博客:http://dblab.xmu.edu.cn/blog/spark/ spark是一个采用Scala语言进行开发,更快速更稳定的用于大规模数据处理的计算引擎。 是Apache软件基金会最重要的三大分布式计算系统开源项目 阅读全文
posted @ 2017-02-14 12:12 Aviva_ye 阅读(691) 评论(0) 推荐(0)