随笔分类 -  spark

摘要:SparkSQL 数据分析的方式 数据分析的方式大致上可以划分为 SQL 和 命令式两种 命令式在前面的 RDD 部分, 非常明显可以感觉的到是命令式的, 主要特征是通过一个算子, 可以得到一个结果, 通过结果再进行后续计算sc.textFile("...").flatMap(_.split(" " 阅读全文
posted @ 2019-09-16 00:12 不穿格子衫的徍爺 阅读(194) 评论(0) 推荐(0)
摘要:spark-初阶①(介绍+RDD) Spark是什么? Apache Spark 是一个快速的, 多用途的集群计算系统, 相对于 Hadoop MapReduce 将中间结果保存在磁盘中, Spark 使用了内存保存中间结果, 能在数据尚未写入硬盘时在内存中进行运算. Spark的特点(优点) 速度 阅读全文
posted @ 2019-09-07 16:44 不穿格子衫的徍爺 阅读(257) 评论(0) 推荐(0)